formatação de arquivo

1. formatação de arquivo

Felipe Lopes de Assis
felipelopesassis

(usa Ubuntu)

Enviado em 06/05/2014 - 12:12h

Boa tarde pessoal,

Estou com um pequeno grande problema. Bem básico na verdade! Tenho um arquivo com a seguinte cara:

ID=1 ID=3 Ankyrin repeat
ID=2 ID=7 TPR repeat, SEL1 subfamily
ID=3 ID=10 TPR repeat, SEL1 subfamily
ID=4 ID=11 Ankyrin repeat
ID=5 ID=13 Ankyrin repeat
ID=6 ID=15 Ankyrin repeat
ID=7 ID=20 Cobalamin biosynthesis protein CobT
ID=8 ID=26 Ankyrin repeat
ID=9 ID=30 AAA ATPase containing von Willebrand factor type A (vWA) domain
ID=10 ID=43 Ankyrin repeat
ID=11 ID=57 Ankyrin repeat
ID=12 ID=59 WD40 repeat
ID=13 ID=62 Ankyrin repeat

A primeira coluna contem as ID's de um até 1022. A segunda coluna contem as ID's com informações que estão na coluna 3. Daí queria associar a primeira coluna à terceira, eliminando a segunda coluna. Alguem poderia me ajudar a fazer isso? Pra ficar algo do tipo:

ID=1 hypotetical protein
ID=2 hypotetical protein
ID=3 Ankyrin repeat
ID=4 hypotetical protein
ID=5 hypotetical protein
ID=6 hypotetical protein
ID=7 TPR repeat, SEL1 subfamily
ID=8 hypotetical protein
ID=9 hypotetical protein
ID=10 TPR repeat, SEL1 subfamily






  


2. Re: formatação de arquivo

Perfil removido
removido

(usa Nenhuma)

Enviado em 06/05/2014 - 17:14h

awk '{ $2=""; print }' arquivo 


Seguindo seu exemplo:

$ cat teste.txt
ID=1    ID=3    Ankyrin repeat
ID=2 ID=7 TPR repeat, SEL1 subfamily
ID=3 ID=10 TPR repeat, SEL1 subfamily
ID=4 ID=11 Ankyrin repeat
ID=5 ID=13 Ankyrin repeat
ID=6 ID=15 Ankyrin repeat
ID=7 ID=20 Cobalamin biosynthesis protein CobT
ID=8 ID=26 Ankyrin repeat
ID=9 ID=30 AAA ATPase containing von Willebrand factor type A (vWA) domain
ID=10 ID=43 Ankyrin repeat
ID=11 ID=57 Ankyrin repeat
ID=12 ID=59 WD40 repeat
ID=13 ID=62 Ankyrin repeat


$ awk '{ $2=""; print }' teste.txt
ID=1  Ankyrin repeat
ID=2 TPR repeat, SEL1 subfamily
ID=3 TPR repeat, SEL1 subfamily
ID=4 Ankyrin repeat
ID=5 Ankyrin repeat
ID=6 Ankyrin repeat
ID=7 Cobalamin biosynthesis protein CobT
ID=8 Ankyrin repeat
ID=9 AAA ATPase containing von Willebrand factor type A (vWA) domain
ID=10 Ankyrin repeat
ID=11 Ankyrin repeat
ID=12 WD40 repeat
ID=13 Ankyrin repeat



3. Re: formatação de arquivo

Felipe Lopes de Assis
felipelopesassis

(usa Ubuntu)

Enviado em 13/05/2014 - 05:20h

Muito Obrigado amigo!! Resolveu meu problema!! Abraço!!


4. Re: formatação de arquivo

Perfil removido
removido

(usa Nenhuma)

Enviado em 13/05/2014 - 07:28h

Por nada!






Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts