Reconnaissance PDF

Convertir des documents et des images numérisées en sous Word, PDF, Excel et formats de sortie de texte

Comment reconnaître le texte?

étape 1
étape 1
Téléverser un fichier
Sélectionnez le fichier que vous souhaitez convertir à partir de votre ordinateur, Google Drive, Dropbox ou glisser-déposer sur la page
étape 2
étape 2
Choisir la langue et le format de sortie
Sélectionnez toutes les langues utilisées dans votre document. Vous pouvez aussi choisir un format de sortie souhaité, par exemple, .doc (plus de 10 formats de texte pris en charge)
étape 3
étape 3
Convert & Télécharger
Cliquez sur le bouton «Reconnaître», puis télécharger le fichier avec le texte reconnu

Reconnaissance optique de caractères

Reconnaissance optique de caractères ou d'un lecteur optique de caractères (OCR) est la conversion électronique ou mécanique d'images dactylographiées, texte manuscrit ou imprimé en texte codé machine, que ce soit à partir d'un document numérisé, une photo d'un document, une scène-photo (par exemple le texte sur les panneaux et les panneaux d'affichage dans une photo de paysage) ou à partir du texte des sous-titres superposé sur une image (par exemple d'une émission de télévision). Largement utilisé comme une forme de saisie de données à partir des enregistrements de données de papier imprimé - que ce soit des documents de passeport, les factures, les relevés bancaires, reçus informatisés, cartes de visite, le courrier, les impressions de l'électricité statique des données ou toute documentation appropriée - il est une méthode commune de la numérisation imprimée textes afin qu'ils puissent être modifiés par voie électronique, fouillés, stockés de manière plus compacte, affichés en ligne et utilisés dans la machine des processus tels que l'informatique cognitive, la traduction automatique, (extrait) texte à la parole, les données clés et l'exploration de texte. OCR est un domaine de recherche en reconnaissance des formes, l'intelligence artificielle et vision par ordinateur. Les premières versions doivent être formés avec des images de chaque personnage, et a travaillé sur une police à la fois. Des systèmes avancés capables de produire un haut degré de précision de reconnaissance pour la plupart des polices sont maintenant courantes, et avec le soutien pour une variété d'entrées de format de fichier d'image numérique. Certains systèmes sont capables de reproduire la sortie au format qui se rapproche de près la page originale, y compris des images, des colonnes et d'autres composants non textuels.