Removendo linhas duplicadas não-consecutivas

Publicado por Sandro Marcell em 20/10/2009

[ Hits: 16.716 ]

Blog: http://sanmarcell.wordpress.com

1 0

Denuncie Favoritos Indicar Impressora

Removendo linhas duplicadas não-consecutivas

Geralmente utilizo o comando sort para remover linhas duplicadas de um arquivo:

sort -o output -u input

O problema era que em alguns casos as linhas não poderiam ser ordenadas, mas o sort (obviamente!) as ordenava. Então acabei resolvendo o meu problema assim:

perl -ne '$i{"$_"}++ || print' < input > output

O mesmo pode ser obtido via awk:

awk '!i[$0]++' < input > output

Ou:

awk '!($0 in i) {i[$0] ; print}' < input > output

Sendo "input" o arquivo de entrada e "output" o de saída.

Falou! ;)

Outras dicas deste autor

Detectando conflitos de IP

Jogando Tetris via terminal

Declarando constantes em shell scripts

Substituir espaços em branco por underlines em nome de arquivos

Habilitando correção ortográfica no Vim

Leitura recomendada

GoogleCL: O poder do Google na linha de comando

Monitorando a entrada e saída de pacotes

Substituição de strings no VI

Ver conexões httpd simultâneas

Listando arquivos página por página (com em DOS dir/p)

Comentários

[1] Comentário enviado por ferrarezux em 29/10/2012 - 12:37h

Valeu cara! Me ajudou demais aqui.

Patrocínio

Site hospedado pelo provedor RedeHost.

Destaques

Criei um app de escrita acadêmica para brasileiros! (4)

Links importantes de usuários do vol (4)

Artigos

Maquina modesta - a vez dos navegadores ferrarem o usuario

Fscrypt: protegendo arquivos do seu usuário sem a lentidão padrão de criptograr o disco

Faça suas próprias atualizações de pacotes/programas no Void Linux e torne-se um Contribuidor

Como rodar o Folding@home no Linux

Criando um painel de controle (Dashboard) para seu servidor com o Homepage

Dicas

Utilizando a Ferramenta xcheckrestart no Void Linux

Pisando no acelerador do Linux Mint: Kernel XanMod, zRAM e Ajustes de Swap

Como compilar kernel no Linux Mint

Lançamento do Brutal DOOM test 6

Consertando o erro no Brave de webgl

Tópicos

como usar o caja como cliente FTP no linux mint? (7)

(CLIPPER) Rodando o mesmo código tanto no Windows quanto no Linux (1)

O que você está ouvindo agora? [2] (247)

O que significa essa expressão? (3)

o que é esta mensagem? relatorios do sistema (8)

Top 10 do mês

Xerxes
1° lugar - 150.888 pts
Fábio Berbert de Paula
2° lugar - 69.154 pts
Buckminster
3° lugar - 49.251 pts
Alberto Federman Neto.
4° lugar - 39.578 pts
edps
5° lugar - 25.790 pts
Alessandro de Oliveira Faria (A.K.A. CABELO)
6° lugar - 25.556 pts
Sidnei Serra
7° lugar - 24.201 pts
Mauricio Ferrari (LinuxProativo)
8° lugar - 22.582 pts
Daniel Lara Souza
9° lugar - 22.500 pts
Andre (pinduvoz)
10° lugar - 18.606 pts

Scripts

[Shell Script] imageDownloader

[Shell Script] Flatpak manager

[Shell Script] Renomador em lote feito em Zenity

[C/C++] Jogo do Labirinto no Terminal

[Shell Script] Status do teclado em qualquer ambiente gráfico com system tray no Linux