Extraindo imagens de arquivos PDF no Ubuntu via linha de comando

Publicado por Jonatas Augusto em 10/11/2012

[ Hits: 12.505 ]

Blog: http://hotplugdicas.blogspot.com

 


Extraindo imagens de arquivos PDF no Ubuntu via linha de comando



Baixei um visualizador de quadrinhos para meu PSP, mas infelizmente (ou felizmente, pelo motivo desta postagem), ele não oferece suporte para arquivos em PDF.

Então procurei um extrator de imagens de arquivos PDF e encontrei uma série de programas que modificavam, extraiam textos e visualizavam arquivos no formato PDF. Mas nenhum que oferecesse simplicidade na extração das imagens de dentro destes arquivos em PDF.

Alguns desses, como o PDF Editor e o GIMP, até oferecem a opção de extração de arquivo por arquivo, mas, imaginem extrair 70, 80... 100 páginas/imagens ou mais, e uma a uma, de um PDF!

Foi quando encontrei comentários sobre o pacote poppler-utils, cujo um dos comandos, tem por finalidade exportar arquivos PDF para HTML, consequentemente, extraindo individualmente todas as imagens num único passo!

Poppler-utils é um pacote padrão e muito provavelmente você já deve tê-lo instalado no sistema. Mas caso não tenha, usuários de Debian e derivados podem recorrer ao apt-get:

# apt-get install poppler-utils

Após a instalação deste pacote, basta criar um diretório qualquer, gravar seu arquivo PDF dentro, abrir um terminal dentro deste diretório e rodar o seguinte comando:

pdftohtml ARQUIVO.pdf QUALQUER_NOME.html

Pronto! O comando "desmontará" seu arquivo PDF em arquivos texto no formato HTML, extraindo todos as imagens pra dentro do diretório:
Linux: Ubuntu - Extraindo imagens de arquivos PDF, usando uma simples linha de comando
Além de, para o meu propósito em particular, ser uma ferramenta muito útil para recriar um documento utilizando as imagens de um arquivo em PDF.

Previamente publicado em meu blog:
Outras dicas deste autor

Ubuntu 10.10 - Recebendo arquivos via Bluetooth

Wget - Baixando sites inteiros

Ubuntu - Alterando as Fontes do Terminal

Leitura recomendada

Como tirar os "Ícones invisíveis" do lançador do Ubuntu

Desligando o PC na hora certa com o shutdown

lshw - Gerando relatório HTML de seu hardware

O gerenciador de pacotes dpkg

Partição - Formatando e mantendo seu UUID

  

Comentários
[1] Comentário enviado por andreuebe em 10/11/2012 - 18:51h

Muito legal!

Valeu pela dica!

[2] Comentário enviado por julio_hoffimann em 10/11/2012 - 22:09h

Ótima dica Jonatas!

Abraço!

[3] Comentário enviado por titohigh em 29/11/2012 - 12:19h

Que programa fantástico!
Podia ter conhecido esse comando alguns anos atrás, ia me ajudar muito.



Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts