Motor de Busca Texto / PDF para web interface

1. Motor de Busca Texto / PDF para web interface

Pedro Henrique Rissato
pedrorissato

(usa Fedora)

Enviado em 18/04/2010 - 12:01h

Boa tarde a todos... Cenario: Tenho 1017 PDFS no trabalho onde preciso procurar determinado texto dentro deles (nome, cpf, expressao, etc...).

As maquinas la são vista/seven, tentei usar a indexação do windows para fazer isso... mas demora muito pra mostrar os resultados e ainda não pesquisa exato (retorna similares).

Entao como já tinha usado muito antigamente um motor de busca para texto (funcionava só com txt) no Apache, pensei em montar um server e levar pro trabalho.

Testei o Beagle, excelente indexador, porém a interface web melhor pra mim seria o "Peagle", só que ele não retorna os resultados no Ubuntu, dá erro. No slack o Beagle é bem xarope pra funcionar mesmo com o pacote proprio compilado. A interface web nativa do Beagle não é configurável e ele indexa tudo que ve na frente o que iria atrapalhar um pouco.

Descarto o Lucene por ser java e não consegui baixar a versão php dele.

Voltei ao apache e testei o Sphider... mas esse buscador indexa sites propriamente ditos (só .php/.html) e não diretorios em si.

Queria saber se alguem conhece algum motor de busca simples (ou até complexo) que busque dentro do PDF e me retorne os resultados. Tem que ser web pois 4 pessoas vão pesquisar ao mesmo tempo.

Obrigado pela ajuda, quem puder!


  






Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts