Day: May 30, 2012

Converter espaços em tab para separar colunas de um texto

Se você tem um arquivo em pdf com a lista de candidatos que passaram em um concurso e você deseja classifica-lo por ordem de pontuação, você seguir estes passos:

pdf2txt arquivo.pdf > arquivo.txt
cat listagem.txt | sed 's/  \+/\t/g' > listaordenada.txt

Eu gastei muito tempo para converter esta lista, pois todos os exemplo que encontrei na internet sempre usavam ‘s/ +/\t/g’ ou ‘s/\s+{2,}/\t/g’, o detalhe é que você precisa usar \+ ou invés de simplesmente + ou \{2,} ou invés de {2,} são coisas bobas mas que nos fazem perder tempo.

Para ordenar ou invés se usar o sort junto com awk ou outra coisa do genero, eu simples utilizei o LibreOffice Calc e fui em Data -> Sort