Continuando com a minha demostração de como utilizar um desktop usável em modo texto, desta vez vou dar foco à aplicações para internet desenvolvidas para serem utilizadas no shell (
vide parte 1 desta série).
Porém, antes de continuar, gostaria de explicar o funcionamento dos aplicativos
antiword e
WvWare, aos quais por um descuido meu, acabaram faltando no tópico "Lendo arquivos DOC do WORD no VIM".
Logo após prosseguirei com o artigo abordando as aplicações para internet.
Vamos lá.
Utilizando o Antiword e WvWare
Um dos maiores inconvenientes de quem usa sistemas
Linux para seu trabalho diário é a utilização de documentos gravados no formato Microsoft Word (extensão doc).
Existem duas alternativas, transformar o documento num formato mais aceitável, como texto puro, que pode ser lido em qualquer computador e sistema operacional existente na face da terra, ou então fazer uma conversão do formato para algo mais aceitável, como o formato html.
O Antiword e o WvWare fazem esse trabalho, convertendo documentos .doc em arquivos de texto puro (txt) ou html.
Aqui, vou demonstrar como utilizá-los:
Antiword
Instalação. Para quem usa o Debian:
# apt-get install antiword
Ou você pode baixar o source do endereço:
e compilá-lo.
Para transformar um arquivo .doc em .txt com o antiword eu faço o seguinte:
$ antiword -t arquivo.doc >> arquivo.txt
ou
$ antiword -m 8859-1.txt -p a4 arquivo.doc >> arquivo.txt
WvWare
É o aplicativo que faz a conversão de arquivos no formato MS Word para HTML. Antigamente ele se chamava mswordview, porém o autor resolveu renomear o produto para wv, já que o nome original, mswordview, era bastante semelhante ao nome de um produto da Microsoft chamado wordview.
O programa é excelente e são raríssimos os casos em que não consegue converter corretamente os documentos.
Instalação. Para quem usa o Debian:
# apt-get install wv
O programa WvWare pode ser baixado também a partir do endereço:
Para fazer a conversão basta:
$ wvHtml arquivo.doc arquivo.html
E você pode ler o seu arquivo em qualquer browser modo texto.
O arquivo gerado fica com a mesma formatação do documento, e se aberto em qualquer browser gráfico, não se nota diferença entre ambos.