FreeOCR
Programa de Reconocimiento Óptico de Caracteres (OCR) que permite reconocer los textos de imágenes y transformarlos a un documento de texto plano. Utiliza el motor Tesseract-OCR.
Es capaz de reconocer imágenes directamente desde el escáner instalado en Windows. También es capaz de reconocer imágenes desde archivos en múltiples formatos y archivos PDF.
Idioma: Tanto el programa como la página Web se encuentran en inglés. Es capaz de reconocer textos en varios idiomas, entre ellos el español.
Licencia: Gratuita y de libre distribución.
Requisitos.
- Está disponible para equipos con sistema operativo Windows.
- Para el reconocimiento de documentos tipográficos es preciso disponer de un escáner.
- Precisa conocimientos para desplazarse por los controles de las aplicaciones.
- Siendo usuario ciego, es recomendable saber Braille y utilizar una línea Braille para mejorar la lectura de los textos reconocidos.
Recursos utilizados.
- FreeOCR 5.41 y Tesseract 3.
- Sistema operativo: Windows 11 (64 Bits).
- Escáner Canon Lide 120.
- Lector de pantalla JAWS 2022 y NVDA 2022.1.
- Magnificador de pantalla ZoomText 2022.
- Línea Braille Focus 40 Blue.
Utilización.
Definir idioma de reconocimiento:
- Sirve para especificar en que idioma se encuentra el texto que deseamos reconocer.
- Debemos localizar un cuadro combinado con la etiqueta «OCR Language» (Ojo porque el lector de pantalla puede que no la lea y en ese caso deberemos ayudarnos del contenido del cuadro combinaod, normalmente las iniciales del idioma, eng para Inglés, spa para Español…) pulsando Tabulador.
- Una vez localizado el cuadro combinado «OCR Language» seleccionaremos «spa» (Español) con Flecha Abajo.
Importar una imagen desde el escáner:
- A través de la Barra de Menú del programa ejecutar File \ Scan.
- En el cuadro de diálogo que se abre localizar el botón «Scan» pulsando Tabulador y confirmar con Enter.
- Si el escáner no se pusiera en funcionamiento de forma automática entonces:
- Volver a ejecutar a través de la Barra de Menú del programa la opción File \ Scan.
- En el cuadro de diálogo que se abre localizar el botón «Select scan device» pulsando Tabulador y confirmar con Enter.
- Se abrirá otro cuadro de diálogo el cual contiene una lista con los escáners detectados en el equipo y compatibles con el protocolo TWAIN. Seleccionar el que corresponda y pulsar el botón Aceptar.
Reconocer las imágenes cargadas en el programa:
- Sirve para realizar el procedimiento de reconocimiento de caracteres sobre las imágenes que hayamos cargado en el programa, independientemente de si procede del escáner, un archivo de imagen o un archivo PDF.
- Para iniciar el procedimiento de reconocimiento, a través de la Barra de Menú, ejecutar OCR \ Start OCR process.
Enlaces.
- Web de FreeOCR.
- Más información sobre Tesseract-OCR.
- Guía sobre Pautas básicas para uso de OCR. publicada por el CIDAT de la ONCE.
- Guía sobre Programas OCR gratuitos publicada por el CIDAT de la ONCE.
- Herramientas y utilidades similares.