FreeOCR

Ventana principal de la aplicación dividida en dos paneles, uno donde se encuentra la imágen y otro con el texto reconocido.

Programa de Reconocimiento Óptico de Caracteres (OCR) que permite reconocer los textos de imágenes y transformarlos a un documento de texto plano. Utiliza el motor Tesseract-OCR.

Es capaz de reconocer imágenes directamente desde el escáner instalado en Windows. También es capaz de reconocer imágenes desde archivos en múltiples formatos y archivos PDF.

Idioma: Tanto el programa como la página Web se encuentran en inglés. Es capaz de reconocer textos en varios idiomas, entre ellos el español.

Licencia: Gratuita y de libre distribución.

Requisitos.

Está disponible para equipos con sistema operativo Windows.
Para el reconocimiento de documentos tipográficos es preciso disponer de un escáner.
Precisa conocimientos para desplazarse por los controles de las aplicaciones.
Siendo usuario ciego, es recomendable saber Braille y utilizar una línea Braille para mejorar la lectura de los textos reconocidos.

Recursos utilizados.

FreeOCR 5.41 y Tesseract 3.
Sistema operativo: Windows 11 (64 Bits).
Escáner Canon Lide 120.
Lector de pantalla JAWS 2022 y NVDA 2022.1.
Magnificador de pantalla ZoomText 2022.
Línea Braille Focus 40 Blue.

Utilización.

Definir idioma de reconocimiento:

Sirve para especificar en que idioma se encuentra el texto que deseamos reconocer.
Debemos localizar un cuadro combinado con la etiqueta «OCR Language» (Ojo porque el lector de pantalla puede que no la lea y en ese caso deberemos ayudarnos del contenido del cuadro combinaod, normalmente las iniciales del idioma, eng para Inglés, spa para Español…) pulsando Tabulador.
Una vez localizado el cuadro combinado «OCR Language» seleccionaremos «spa» (Español) con Flecha Abajo.

Importar una imagen desde el escáner:

A través de la Barra de Menú del programa ejecutar File \ Scan.
En el cuadro de diálogo que se abre localizar el botón «Scan» pulsando Tabulador y confirmar con Enter.
Si el escáner no se pusiera en funcionamiento de forma automática entonces:
- Volver a ejecutar a través de la Barra de Menú del programa la opción File \ Scan.
- En el cuadro de diálogo que se abre localizar el botón «Select scan device» pulsando Tabulador y confirmar con Enter.
- Se abrirá otro cuadro de diálogo el cual contiene una lista con los escáners detectados en el equipo y compatibles con el protocolo TWAIN. Seleccionar el que corresponda y pulsar el botón Aceptar.

Reconocer las imágenes cargadas en el programa:

Sirve para realizar el procedimiento de reconocimiento de caracteres sobre las imágenes que hayamos cargado en el programa, independientemente de si procede del escáner, un archivo de imagen o un archivo PDF.
Para iniciar el procedimiento de reconocimiento, a través de la Barra de Menú, ejecutar OCR \ Start OCR process.

Enlaces.

Web de FreeOCR.
Más información sobre Tesseract-OCR.
Guía sobre Pautas básicas para uso de OCR. publicada por el CIDAT de la ONCE.
Guía sobre Programas OCR gratuitos publicada por el CIDAT de la ONCE.
Herramientas y utilidades similares.