OCR: Reconocimiento de texto, tratamiento de archivos pdf

Un programa OCR permite ahorrar bastante trabajo en el tratamiento de archivos pdf o imágenes con texto que deseamos poder editar.

Yo utilizo el OCR Readiris, que venía con el escáner HP. Readiris permite importar archivos pdf y pasar el texto a un documento editable. También por supuesto reconocer texto a partir de archivos de imagen, escáner o cámara.

Cuando el OCR tiene problemas en importar un pdf, un truco que utilizo es "imprimirlo" primero con PdfCreator,  así obtengo un segundo pdf que es una imagen que se trata con el OCR.

Buscando en internet alternativas a Readiris, encuentro varias opciones que parecen interesantes:


No hay comentarios: