gImageReader
Aplicación de reconocimiento óptico de caracteres (OCR) que trabaja con imágenes y archivos en formato PDF.
Idiomas: Aunque el procedimiento de instalación, la página Web e incluso el programa se encuentran en Inglés, si al realizar la instalación de Tesseract-OCR instalamos el paquete de idioma Español, el programa será capaz de reconocer correctamente textos en este idioma.
Licencia: Código abierto y libre distribución.
Requisitos.
- Está disponible para equipos con sistemas operativos Windows y Linux.
- Para su funcionamiento requiere que se encuentren instaladas las librerías GTK+.
Accesibilidad.
- El procedimiento de instalación es accesible con teclado, ratón y puede ser realizado con el revisor y magnificador de pantalla.
- El programa se puede utilizar con teclado o combinaciones de teclas, puntero de ratón, pero NO puede seguirse con el lector de pantalla ya que utiliza controles NO estándar del Sistema Operativo Windows.
- Permite conversión a otros formatos.
- El programa lo puede utilizar un usuario que no precise un revisor de pantalla como herramienta de accesibilidad.
- También se debe disponer de conocimientos básicos de Inglés.
Recursos utilizados.
- PC de sobremesa con sistema operativo Microsoft Windows 7 Service Pack 1.
- gImageReader 0.9 con Tesseract-OCR 3.02.02.
- Revisor de pantalla NVDA 2013.3.
Descripción.
Es un interfaz gráfico para Tesseract-OCR, por lo que antes de instalar gImageReader se necesita tener instalado Tessereract-OCR y los diccionarios de idiomas.
Instalación y configuración.
Antes de proceder a instalar este programa es preciso instalar Tesseract-OCR.
Para saber en que idiomas es capaz de reconocer textos el programa:
- Acceder a las opciones de configuración a través de la Barra de menú \ File \ Configure.
- Se abre un cuadro de diálogo con múltiples pestañas, debemos cambiar a la pestaña «Language».
- En la lista de idiomas se pueden identificar de la siguiente forma los que detecta automáticamente el programa:
- Para el Español «spa – Español – es_ES».
- Para el Catalán «cat – Català – es_ES».
Enlaces.
- Web de gImageReader.
- Descargar gImageReader.
- Información sobre Tesseract-OCR.
- Guía sobre Pautas básicas para uso de OCR. publicada por el CIDAT de la ONCE.
- Guía sobre Programas OCR gratuitos publicada por el CIDAT de la ONCE.
- Herramientas y utilidades similares.
Fuentes, colaboraciones y biblioteconomía.
Este artículo ha sido posible gracias a la información aportada por CDLibre.org.