OCRmyPDF es una herramienta gratuita de línea de comandos de código abierto que agrega una capa de texto OCR a los archivos PDF escaneados, lo que permite buscarlos o copiarlos. Ya se utiliza para escanear y buscar millones de archivos PDF pesados.
Características
Sus características incluyen:
-
Genera un archivo PDF/A con capacidad de búsqueda a partir de un PDF normal
-
Coloca el texto OCR con precisión debajo de la imagen para facilitar copiar/pegar
-
Mantiene la resolución exacta de las imágenes incrustadas originales.
-
Cuando sea posible, inserta información de OCR como una operación “sin pérdidas” sin alterar ningún otro contenido.
-
Optimiza imágenes PDF, generando a menudo archivos más pequeños que el archivo de entrada.
-
Si se solicita, corrige y/o limpia la imagen antes de realizar el OCR.
-
Valida archivos de entrada y salida.
-
Distribuye el trabajo entre todos los núcleos de CPU disponibles
-
Utiliza el motor Tesseract OCR para reconocer más de 100 idiomas
-
Mantiene sus datos privados privados.
-
Se escala correctamente para manejar archivos con miles de páginas.
Plataformas
macOS Windows y Linux
Licencia
Licencia MPL-2.0
Etiquetas
PDF,OCR,OCR PDF, PDF OCR, CLI, herramientas,office,reconocimiento óptico de caracteres,herramienta,productividad
Recursos
GitHub
Etiquetas
macos opentosh cli tools office herramienta de reconocimiento óptico de caracteres Productividad