OCR PDF

Convertir documentos e imágenes escaneados en editable Word, PDF, Excel y formatos de salida de texto

Cómo reconocer el texto?

paso 1
paso 1
Subir archivo
Seleccionar archivo, que desea convertir de su ordenador, Google Drive, Dropbox o arrastrar y soltar en la página
paso 2
paso 2
formato de salida Selecciona idioma y
Seleccionar todos los idiomas utilizados en el documento. Además, puede seleccionar cualquier formato de salida deseado, por ejemplo, .doc (más de 10 formatos de texto compatibles)
paso 3
paso 3
Convertir y descargar
Haga clic en el botón "Reconocer" y luego descargar el archivo con el texto reconocido

Reconocimiento óptico de caracteres

Reconocimiento óptico de caracteres o un lector óptico de caracteres (OCR) es la conversión electrónica o mecánica de las imágenes de texto mecanografiado, escrito a mano o impreso en texto máquina codificados, ya sea de un documento escaneado, una foto de un documento, una escena-foto (por ejemplo, el texto en los letreros en una foto del paisaje) o de subtítulos de texto superpuesto a una imagen (por ejemplo, de un programa de televisión). Ampliamente utilizado como una forma de entrada de datos de los registros de datos de papel impreso - si los documentos de pasaportes, facturas, estados de cuenta, recibos computarizados, tarjetas de visita, el correo, las impresiones de la electricidad estática de datos, o cualquier documentación adecuada - es un método común de la digitalización impresa textos para que puedan ser editados electrónicamente, buscaron, almacenado de forma más compacta, que aparecen en línea, y se utilizan en procesos tales como la máquina de computación cognitiva, la traducción automática, (extraído) de texto a voz, datos clave y la minería de texto. OCR es un campo de investigación en el reconocimiento de patrones, la inteligencia artificial y visión por ordenador. Las primeras versiones tenían que ser entrenados con imágenes de cada personaje, y trabajaron en una fuente a la vez. Los sistemas avanzados capaces de producir un alto grado de precisión de reconocimiento para la mayoría de las fuentes son ahora comunes, y con soporte para una variedad de entradas de formato de archivo de imagen digital. Algunos sistemas son capaces de reproducir el formato de salida que se aproxima mucho a la página original, incluyendo imágenes, columnas y otros componentes no textuales.