Converter pdf em texto [RESOLVIDO]

1. Converter pdf em texto [RESOLVIDO]

ian cléver sales fernandes
ianclever

(usa Arch Linux)

Enviado em 11/05/2012 - 13:12h

Alguém conhece algum programa para linux(com interface gráfica) que converta pdf em arquivo de texto aditável? mas não *.txt, eu digo formatos como: *.odf, *.doc...
E que sejam satisfatórios, pois os conversores que conheci quando usava windows eram uma #%&8*! só convertia o texto, mas se tivesse uma tabela no pdf não importava, se tinha uma imagem saía borrada. Já na minha experiencia GNU/Linux, que já tem dois anos, eu ainda não tive a necessidade da conversão mas agora surgiu e eu quero aprender a fazer.
Só me mostrem programas em modo texto se for ultimo caso, pq passando os comandos eu sei fazer, mas tenho preguiça, e outra que estou fazendo trabalho de divulgação GNU/linux aos meus conhecidos, e quanto mais facilidade eu encontrar melhor será para convence-los a largar o windows.



  


3. Re: Converter pdf em texto [RESOLVIDO]

Raimundo Alves Portela
rai3mb

(usa Outra)

Enviado em 12/05/2012 - 00:49h

Uso o pdftotext ou pdftohtml

Detalhe:
..quando usava windows eram uma #%&8*! só convertia o texto, mas se tivesse uma tabela no pdf não importava, se tinha uma imagem saía borrada...


Use sempre vai acontecer, independente de Linux e Windows, pois o problema e que alguns caracteres não poderão ser interpretados e transformados nos seus correspondentes facilmente. Nunca vi uma ferramenta dessa que converta as tabelas ...

Fiz um script que pode ajudar alguns usuários a usar o pdftotext graficamente:


#!/bin/bash
# Raimundo Portela <rai3mb@gmail.com>
# yad_pdf2text
# Script para converter arquivos pdf em texto usando pdftotext + yad
#-------------------------------------------------------

# coleta os dados
if DADOS=$(yad --title='pdftotext grafico' --width=500 --height=350 --file --file-filter='PDF|*.pdf' --button='Sair':1 --button='_Converter':0)
then
# obtem apenas o nome do arquivo
IFS='|' read ARQUIVO <<< "$DADOS"

# verifica o arquivo, converte e abre-o para conferencia
[ -f "$ARQUIVO" ] && pdftotext "$ARQUIVO" && gedit "${ARQUIVO%%.pdf}.txt"
fi




Use o ícone abaixo para rodar ele. Abra o editor nano, exemplo:

nano icone.desktop

Cole o conteúdo:


[Desktop Entry]
Name=yad_pdf2text
Comment=Coberter PDF em Texto
Exec=/opt/yad_pdf2text.sh
Icon=terminal
Terminal=false
Type=Application
Name[en_US]=Converter PDF em Texto
Name[pt_BR]=Converter PDF em Texto




Salve o script em um arquivo com o nome, como yad_pdf2text.sh e coloque-o em /opt

E o icone que passei que aponta para Exec=/opt/yad_pdf2text.sh vai executar o script apenas clicando 2 vezes nele.

Obs.: Para usá-lo precisará do Yad (http://www.vivaolinux.com.br/artigo/Yad-016-Eu-quero-sempre-mais-de-ti/)



4. Re: Converter pdf em texto [RESOLVIDO]

ian cléver sales fernandes
ianclever

(usa Arch Linux)

Enviado em 15/05/2012 - 23:57h



esse eu conheço, valeu pela dica.


5. Re: Converter pdf em texto [RESOLVIDO]

ian cléver sales fernandes
ianclever

(usa Arch Linux)

Enviado em 16/05/2012 - 00:00h

rai3mb escreveu:

Uso o pdftotext ou pdftohtml

Detalhe:
..quando usava windows eram uma #%&8*! só convertia o texto, mas se tivesse uma tabela no pdf não importava, se tinha uma imagem saía borrada...


Use sempre vai acontecer, independente de Linux e Windows, pois o problema e que alguns caracteres não poderão ser interpretados e transformados nos seus correspondentes facilmente. Nunca vi uma ferramenta dessa que converta as tabelas ...

Fiz um script que pode ajudar alguns usuários a usar o pdftotext graficamente:


#!/bin/bash
# Raimundo Portela <rai3mb@gmail.com>
# yad_pdf2text
# Script para converter arquivos pdf em texto usando pdftotext + yad
#-------------------------------------------------------

# coleta os dados
if DADOS=$(yad --title='pdftotext grafico' --width=500 --height=350 --file --file-filter='PDF|*.pdf' --button='Sair':1 --button='_Converter':0)
then
# obtem apenas o nome do arquivo
IFS='|' read ARQUIVO <<< "$DADOS"

# verifica o arquivo, converte e abre-o para conferencia
[ -f "$ARQUIVO" ] && pdftotext "$ARQUIVO" && gedit "${ARQUIVO%%.pdf}.txt"
fi




Use o ícone abaixo para rodar ele. Abra o editor nano, exemplo:

nano icone.desktop

Cole o conteúdo:


[Desktop Entry]
Name=yad_pdf2text
Comment=Coberter PDF em Texto
Exec=/opt/yad_pdf2text.sh
Icon=terminal
Terminal=false
Type=Application
Name[en_US]=Converter PDF em Texto
Name[pt_BR]=Converter PDF em Texto




Salve o script em um arquivo com o nome, como yad_pdf2text.sh e coloque-o em /opt

E o icone que passei que aponta para Exec=/opt/yad_pdf2text.sh vai executar o script apenas clicando 2 vezes nele.

Obs.: Para usá-lo precisará do Yad (http://www.vivaolinux.com.br/artigo/Yad-016-Eu-quero-sempre-mais-de-ti/)

valeu esse eu conhecia tb, mas no modo texto, vou achar um tempinho e vou testar com o script, e muito obrigado pelo esclarecimento.








Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts