OCR (reconocimiento óptico de caracteres) es una tecnología que permite a las computadoras reconocer texto en imágenes o documentos escaneados y convertirlo en texto editable. Las herramientas de OCR se utilizan comúnmente en diversas industrias, que incluyen:
- Digitalización de materiales impresos: el OCR se puede utilizar para convertir libros, revistas y periódicos físicos en formatos digitales que se puedan buscar y compartir fácilmente.
- Gestión de documentos: el OCR se puede utilizar para extraer datos de documentos, lo que facilita la organización y la búsqueda en grandes cantidades de información.
- Accesibilidad: OCR se puede utilizar para convertir materiales impresos a formatos accesibles para personas con discapacidad visual.
- Traducción: OCR se puede utilizar para extraer texto de documentos en un idioma y traducirlo a otro.
Hay muchas herramientas de OCR disponibles, cada una con sus propias características y casos de uso únicos. Algunas herramientas están diseñadas para tareas específicas, como TessStudio para revisar y corregir datos de OCR, mientras que otras como EasyOCR tienen un propósito más general.
En esta publicación, encontraremos las mejores herramientas de OCR gratuitas y de código abierto que puede descargar, instalar y usar para Windows y otras plataformas.
1- Captura de texto
Captura de texto es una utilidad de OCR de Windows 10/11 que toma una captura de pantalla, pasa la imagen al motor de OCR API de Windows local y coloca el texto en el portapapeles para usarlo en cualquier lugar. Tiene diferentes modos para que trabajar con texto sea rápido y sencillo.
2- Traductor OCR
Traductor OCR le permite convertir sin esfuerzo imágenes capturadas en texto y traducir ese texto con confianza y facilidad.
Características
- Aplicación de escritorio con una interfaz gráfica de usuario (GUI) fácil de usar proporcionada por customtkinter.
- Posibilidad de seleccionar servicios de traducción y OCR preferidos.
- Opción para ejecutar el programa usando el botón INICIO o el método abreviado de teclado (Alt+Win+T o vinculado desde opciones).
- Capacidad para elegir el área de la pantalla para escanear texto usando OCR y guardar la posición (por ejemplo, cuando miras una película y los subtítulos siempre aparecen en un lugar, por lo que no tienes que volver a seleccionar el área de texto).
- Traducción automática del texto capturado si se ha seleccionado un servicio de traducción.
- Posibilidad de capturar subtítulos de películas o juegos seleccionando el área correspondiente de la pantalla y mostrando el texto traducido junto a ellos.
- Chatea con chatGPT o edgeGPT.
- Posibilidad de traducir desde el portapapeles o texto ingresado manualmente (similar a una aplicación de traducción típica).
- Guarde todas las opciones y configuraciones seleccionadas en un archivo y cárguelas cuando se inicie el programa.
3- Tess Estudio
tessstudio es un potente programa de Windows diseñado para crear, revisar y corregir datos OCR en archivos PDF con capacidad de búsqueda utilizando el motor Tesseract altamente confiable.
Características
- Admite archivos PDF de imágenes y de varias páginas, con o sin datos OCR previos.
- Puede ejecutar o volver a ejecutar el proceso Tesseract OCR en la página actual, todas las páginas o las páginas seleccionadas.
- Conserva cualquier texto visible en una página PDF mientras realiza OCR solo en los elementos de la imagen.
- Para archivos de varias páginas, se ejecutan varias instancias del motor Tesseract en paralelo para mejorar el rendimiento. La mejora de la velocidad depende de la cantidad de núcleos del procesador.
- Identifique y muestre texto OCR a nivel de palabra con los límites de las palabras detectadas visibles.
- El corrector ortográfico integrado etiqueta automáticamente las palabras que no se encuentran en el diccionario.
- Muestre páginas PDF en los siguientes modos: Imagen con texto OCR oculto, texto OCR visible e imagen oculta y texto OCR visible en una imagen descolorida.
- Utilice cualquier fuente instalada para mostrar texto OCR. Las fuentes se escalan automáticamente para ajustarse a los límites de las palabras.
- Haga clic en una palabra visible para abrir un editor de texto para corregir errores de OCR.
- Divida una palabra seleccionada en la posición actual del cursor en dos palabras o combine la palabra seleccionada con la siguiente palabra.
- Modifique o mueva los límites de las palabras.
- Cree nuevas palabras de OCR, elimine palabras existentes.
- Admite cualquier cantidad de operaciones de Deshacer y Rehacer.
- Guarde las correcciones como archivos PDF con capacidad de búsqueda. Opcionalmente, guárdelo como PDF/A o archivos PDF cifrados.
- Soporte experimental para eliminar líneas de cuadrícula y manejar una página de modo mixto con texto claro sobre fondo oscuro y texto oscuro sobre fondo claro. Esto es común con los encabezados de las tablas.
- Capture y examine imágenes intermedias de depuración y resultados de OCR en texto.
4- ImagenScanOCR
OCR de escaneo de imágenes es la herramienta definitiva para reconocer texto de imágenes y archivos PDF mediante OCR de Windows. Con esta potente aplicación de OCR, puedes convertir fácilmente cualquier imagen de texto en texto sin formato editable. ¿Y la mejor parte? Puede administrar y guardar fácilmente el texto del resultado de OCR como un archivo de texto sin formato, lo que simplifica la organización y el acceso a su información importante.
5-FácilOCR
FácilOCR es un software de OCR que está listo para usar y admite más de 80 idiomas, incluidas escrituras populares como latín, chino, árabe, devanagari, cirílico y más.
6- (a9t9) Software gratuito de OCR
Esto es un Aplicación OCR gratuita de código abierto para la Tienda Windows: una interfaz gráfica de usuario moderna para la biblioteca OCR de Microsoft. La aplicación también incluye soporte para leer y realizar OCR en archivos PDF.
7- pdf2pdfocr
Esto es un herramienta excepcional que realiza OCR rápidamente en archivos PDF (e imágenes compatibles) con la característica adicional de agregar una “capa” de texto al archivo original, transformándolo en un PDF con muchas posibilidades de búsqueda. El script emplea exclusivamente herramientas de código abierto, lo que consolida su estatus como un activo confiable.
8- Cuneiforme-OCR (Python)
Este repositorio contiene código para detección de líneas, detección de caracteres y reconocimiento en imágenes cuneiformes 2D.
Cada carpeta contiene el código respectivo para:
- Detección de línea: Al utilizar técnicas de procesamiento de imágenes, se encuentran sangrías de líneas en imágenes cuneiformes rgb.
- Detección de objetos: Uso de maskrcnn Los caracteres cuneiformes y las intenciones de línea se encuentran en imágenes cuneiformes rgb.
- Sintético: Para crear imágenes rgb cuneiformes sintéticas con anot
aciones para el entrenamiento de maskrcnn.
9- TapaNorma
Nuestro Con tecnología OCR La herramienta de captura de pantalla captura información de manera más eficiente que los métodos tradicionales basados en imágenes. Disponible para linuxmacOS y sistemas operativos Windows.
10-LAREX
LAREX es una excelente herramienta de código abierto para analizar el diseño de los primeros libros impresos. Su enfoque basado en reglas para los componentes conectados no sólo es eficiente, sino también fácil de entender para el usuario. Si es necesario, también hay una opción de corrección manual intuitiva.
Además, el formato PAGE XML facilita la integración en los flujos de trabajo de OCR existentes. Las evaluaciones han demostrado de manera concluyente que LAREX es una solución eficiente y flexible para segmentar páginas de libros impresos tempranos y seguramente cumplirá con todas las expectativas.
LAREX Se puede instalar a través de Docker o desde la fuente.
11- OCRAlimentador
OCRAlimentador es un potente sistema de análisis de diseño de documentos y reconocimiento óptico de caracteres que delinea automáticamente el contenido, distingue entre gráficos y texto y realiza OCR sobre este último. Genera múltiples formatos, con ODT como salida principal.
Con su completa interfaz gráfica de usuario GTK, los usuarios pueden corregir con confianza cualquier carácter no reconocido, definir o corregir cuadros delimitadores, establecer estilos de párrafo, limpiar imágenes de entrada, importar archivos PDF, guardar y cargar proyectos y exportar todo a múltiples formatos. OCRFeeder brinda a los usuarios las herramientas que necesitan para procesar sus documentos de manera eficiente y precisa.
12- Editor de cajas QT
Editor de cuadros QT es una herramienta utilizada para ajustar archivos de caja en tesseract-ocr. El objetivo de este proyecto es proporcionar una manera fácil y eficiente de editar archivos, independientemente de su tamaño. El editor de cuadros QT es el sucesor del proyecto tesseract-guique ya no se está desarrollando.
13- Rescribir
rescribir es una herramienta de escritorio que le permite realizar OCR fácilmente en archivos de imagen, PDF y Google Books. Utiliza el motor Tesseract OCR junto con procesos eficientes de preprocesamiento y análisis para producir resultados de alta calidad. La herramienta es particularmente útil para OCR de obras impresas históricas, pero también incluye opciones de lenguaje moderno y funciona bien en obras impresas modernas.
Rescribe está disponible para Windows, Linux y macOS.
14- OpenOCR cognitivo
OpenOCR cognitivo es un programa de OCR gratuito que combina bases de datos de otros programas de OCR abiertos y comentarios de los usuarios. Ofrece 23 opciones de idiomas diferentes y tiene opciones de bloatware evitables durante la instalación.
15- OCRmiPDF
16- Trámites
17- Lios OCR
18- TapaNorma
Etiquetas
ocr pdf ocr Listado de código abierto productivo Herramientas de productividad Oficina de herramientas en línea