Linux

Reconocimiento Optico de caracteres (OCR)

El reconocimiento óptico de caracteres (OCR), permite convertir diferentes tipos de documentos y pasarlos a texto plano (ejemplo: documentos en papel escaneados guardados como Tif, jpg, png, o ficheros en PDF.

La función es separar el texto de la imagen, o lo que es lo mismo, poder diferenciar un texto de una imagen cualquiera, esto permite tener acceso y editar el contenido del documento original (albaranes, formularios, facturas, etc.). Generalmente en el sector de la empresa se le llama “gestión documental” y se usa para agilizar los procesos de localización y recuperación de archivos, reducción de costes de almacenamiento de los documentos e incremento de la productividad.



La tecnología OCR tiene cabida por ejemplo en los radares de trafico. Una cámara captura la matricula y el motor OCR se encarga de pasar los números de la imagen a texto plano.


La tecnología OCR actualmente esta dando mas avances dentro las google glass. o los teléfonos moviles:




Hay muchos motores OCR de código abierto pero tienen sus limitaciones (la imagen tiene que tener una gran calidad, la mayoría solo admite ficheros de imagen en formato Tif …).

Tesseract-ocr esta entre estos. Desarrollado originalmente por Hewlett Packard, fue liberado como código abierto en el año 2005 y esta patrocinado actualmente por Google, que lo distribuye bajo licencia Apache. Es multiplataforma y soporta múltiples idiomas (funciona por terminal y solo puede procesar imágenes TIFF.).

Otro es Tessract-GUI, que no es un front-end para tesseract-ocr. Es sólo una manera gráfica para utilizarlo con la manipulación de imágenes sencillas a través de ImageMagick (ofrece mas formatos de entrada como png, jpeg, tif, pdf).

Tessract-GUI tiene dependencias de las siguientes aplicaciones que deben ser instaladas:
tesseract-ocr y ImageMagick


Enlace: Tesseract-ocr

Enlace: Tessract-GUI




Si queres probarlo:

Descargamos Tesseract-GUI desde su web


$ cd /directorio donde se descargue/tesseract-gui-X.X.tar.gz
$ tar xzvf tesseract-gui-X.X.tar.gz
$ cd tesseract-gui-X.X
$ sudo make install



Y lo lanzamos con:

$ tesseract-gui.py











Otra opción mas fácil es hacer pasar la imagen a texto online, hay bastantes webs para subir las imágenes y pasarlas a texto. link: http://www.onlineocr.net/.

(Pero no es que funciona MUY bien)