Converter espaços em tab para separar colunas de um texto

Se você tem um arquivo em pdf com a lista de candidatos que passaram em um concurso e você deseja classifica-lo por ordem de pontuação, você seguir estes passos:

pdf2txt arquivo.pdf > arquivo.txt
cat listagem.txt | sed 's/  \+/\t/g' > listaordenada.txt

Eu gastei muito tempo para converter esta lista, pois todos os exemplo que encontrei na internet sempre usavam ‘s/ +/\t/g’ ou ‘s/\s+{2,}/\t/g’, o detalhe é que você precisa usar \+ ou invés de simplesmente + ou \{2,} ou invés de {2,} são coisas bobas mas que nos fazem perder tempo.

Para ordenar ou invés se usar o sort junto com awk ou outra coisa do genero, eu simples utilizei o LibreOffice Calc e fui em Data -> Sort

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s