tesseract - Reconhecimento de caracteres em imagens
Dica publicada em Linux / Miscelânea
tesseract - Reconhecimento de caracteres em imagens
Olá, pessoal do VOL.
Minha dica de hoje é sobre um software que utilizei para o reconhecimento de caracteres. Estou falando do tesseract.
Inicialmente meu projeto tinha por objetivo o reconhecimento de placas veiculares, para um simples controle interno no estacionamento da minha empresa.
Utilizando um software chamado fswebcam, consegui capturar imagens a partir do terminal. Assim posicionei duas câmeras nas vagas do meu estacionamento, capturando uma foto da placa de cada veículo estacionado.
Com o tesseract consegui transformar as imagens em caracteres para o armazenamento em banco MySQL.
Com isso, alimentei meu banco de dados com as placas dos veículos, hora de chegada e hora de saída de cada carro.
Instalando o tesseract (em distribuições baseadas no Debian):
# apt-get install tesseract-ocr
Convertendo imagem "teste.jpg" para texto:
No diretório da imagem a ser convertida, digite o comando abaixo:
# tesseract teste.jpg -psm 8 resultado
O comando acima reconhece os caracteres na imagem e com parâmetro "-psm 8", os dados da imagem são tratados em uma única palavra.
O resultado será armazenado no arquivo "resultado", como informado no comando acima.
# cat resultado
MMM-0058
Prontinho, os caracteres da imagem já estão disponíveis em texto.
Abraço a todos!
Minha dica de hoje é sobre um software que utilizei para o reconhecimento de caracteres. Estou falando do tesseract.
Inicialmente meu projeto tinha por objetivo o reconhecimento de placas veiculares, para um simples controle interno no estacionamento da minha empresa.
Utilizando um software chamado fswebcam, consegui capturar imagens a partir do terminal. Assim posicionei duas câmeras nas vagas do meu estacionamento, capturando uma foto da placa de cada veículo estacionado.
Com o tesseract consegui transformar as imagens em caracteres para o armazenamento em banco MySQL.
Com isso, alimentei meu banco de dados com as placas dos veículos, hora de chegada e hora de saída de cada carro.
Instalando o tesseract (em distribuições baseadas no Debian):
# apt-get install tesseract-ocr
Convertendo imagem "teste.jpg" para texto:
# tesseract teste.jpg -psm 8 resultado
O comando acima reconhece os caracteres na imagem e com parâmetro "-psm 8", os dados da imagem são tratados em uma única palavra.
O resultado será armazenado no arquivo "resultado", como informado no comando acima.
# cat resultado
MMM-0058
Prontinho, os caracteres da imagem já estão disponíveis em texto.
Abraço a todos!