Se você tem um arquivo em pdf com a lista de candidatos que passaram em um concurso e você deseja classifica-lo por ordem de pontuação, você seguir estes passos:
pdf2txt arquivo.pdf > arquivo.txt
cat listagem.txt | sed 's/ \+/\t/g' > listaordenada.txt
Eu gastei muito tempo para converter esta lista, pois todos os exemplo que encontrei na internet sempre usavam ‘s/ +/\t/g’ ou ‘s/\s+{2,}/\t/g’, o detalhe é que você precisa usar \+ ou invés de simplesmente + ou \{2,} ou invés de {2,} são coisas bobas mas que nos fazem perder tempo.
Para ordenar ou invés se usar o sort junto com awk ou outra coisa do genero, eu simples utilizei o LibreOffice Calc e fui em Data -> Sort