DJVU o formato que pode ameaçar o reinado do PDF
Djvu (Déjà Vu, do francês) é um formato para distribuição de documentos com foco na web.
Pode substituir com vantagens formatos como PDF, PS, TIFF, etc para a distribuição de documentos scaneados, documentos digitais ou imagens de alta resolução.
Pode substituir com vantagens formatos como PDF, PS, TIFF, etc para a distribuição de documentos scaneados, documentos digitais ou imagens de alta resolução.
Djvu
Djvu (Déjà Vu, do francês) é um formato para distribuição de documentos
com foco na web. Pode substituir com vantagens formatos como PDF, PS, TIFF,
etc para a distribuição de documentos scaneados, documentos digitais ou
imagens de alta resolução.
Originalmente desenvolvido nos Bell Labs da AT&T, a partir de 1995, o formato hoje está sendo comercialmente explorado pela empresa Lizardtech e ao mesmo tempo sendo desenvolvido, como software aberto, pelo projeto DjVuLibre, conduzido pelos próprios inventores da tecnologia.
Um arquivo digitalizado, em formato PDF, ocupa 20MB, já o mesmo arquivo, no formato djvu ocupa apenas 4MB, um quinto do total. Outra grande vantagem em relação à outros formatos, o download não é feito do documento inteiro, mas de suas partes. No caso do PDF você só consegue ver o documento após o download dos 40MB. Já com o djvu as páginas são carregadas individualmente, o que gera um tempo de espera equivalente à carga de uma página html normal, talvez um pouco mais.
Outra coisa interessante, acoplando-se o djvu a um software de reconhecimento de caracteres, é possível fazer busca textual. O software de OCR empregado, o Clara OCR, que embora ainda não faça um reconhecimento 100% dos caracteres, certamente contribui para exibir inequivocamente a eficácia de tal solução.
O software Clara OCR, desenvolvido por Ricardo Ueda (http://www.ime.usp.br/~ueda/), é licenciado sob a GPL e pode ser baixado no endereço http://www.claraocr.org.
Como o PDF, o DjVu exige um visualizador para a sua leitura. O visualizador é gratuito e pode ser instalado como um plugin nos browsers mais comuns. Visualizadores para Windows, Mac e Linux encontram-se no site da LizardTech, Inc. Downloads em: Para sistemas Unix, o projeto DjVuLibre disponibiliza visualizadores com o programa fonte. Existem ainda pacotes binários para as principais distribuições do Linux. Alguns deles são:
Segue abaixo um tutorial para criação de documento .djvu:
Originalmente desenvolvido nos Bell Labs da AT&T, a partir de 1995, o formato hoje está sendo comercialmente explorado pela empresa Lizardtech e ao mesmo tempo sendo desenvolvido, como software aberto, pelo projeto DjVuLibre, conduzido pelos próprios inventores da tecnologia.
Um arquivo digitalizado, em formato PDF, ocupa 20MB, já o mesmo arquivo, no formato djvu ocupa apenas 4MB, um quinto do total. Outra grande vantagem em relação à outros formatos, o download não é feito do documento inteiro, mas de suas partes. No caso do PDF você só consegue ver o documento após o download dos 40MB. Já com o djvu as páginas são carregadas individualmente, o que gera um tempo de espera equivalente à carga de uma página html normal, talvez um pouco mais.
Outra coisa interessante, acoplando-se o djvu a um software de reconhecimento de caracteres, é possível fazer busca textual. O software de OCR empregado, o Clara OCR, que embora ainda não faça um reconhecimento 100% dos caracteres, certamente contribui para exibir inequivocamente a eficácia de tal solução.
O software Clara OCR, desenvolvido por Ricardo Ueda (http://www.ime.usp.br/~ueda/), é licenciado sob a GPL e pode ser baixado no endereço http://www.claraocr.org.
Como o PDF, o DjVu exige um visualizador para a sua leitura. O visualizador é gratuito e pode ser instalado como um plugin nos browsers mais comuns. Visualizadores para Windows, Mac e Linux encontram-se no site da LizardTech, Inc. Downloads em: Para sistemas Unix, o projeto DjVuLibre disponibiliza visualizadores com o programa fonte. Existem ainda pacotes binários para as principais distribuições do Linux. Alguns deles são:
- Debian: djvulibre-plugin
- RedHat e Mandrake: veja em http://djvu.sourceforge.net/
Segue abaixo um tutorial para criação de documento .djvu:
documenttodjvu document.ps document.djvu
Ainda sobre o tema, descobri um site que faz a conversão online para djvu. Fiz o teste com um documento pdf e o resultado foi até satisfatório. O link é: http://any2djvu.djvuzone.org/any2djvu.php.