Vietnamien OCR

Convertissez des documents et images numérisés en formats Word, PDF, Excel et texte modifiables

Comment reconnaître le texte ?

étape 1
étape 1
Télécharger le fichier
Sélectionnez le fichier que vous souhaitez convertir à partir de votre ordinateur, de Google Drive, de Dropbox ou faites-le glisser-déposer sur la page
étape 2
étape 2
Sélectionner la langue et le format de sortie
Sélectionnez toutes les langues utilisées dans votre document. Choisissez également le format de sortie souhaité, par exemple .doc (plus de 10 formats de texte sont pris en charge)
étape 3
étape 3
Convertir et télécharger
Cliquez sur le bouton "Reconnaître" puis téléchargez votre fichier avec le texte reconnu

Reconnaissance optique des caractères

La reconnaissance optique de caractères (OCR) est un processus qui convertit des images de texte tapé, écrit à la main ou imprimé en texte machine lisible. La technologie OCR peut convertir des documents numérisés, des photos de documents, des photos de scènes ou des sous-titres superposés sur une image en texte encodé machine. L'OCR est couramment utilisé pour numériser le texte imprimé à partir de documents papier tels que des passeports, des factures, des relevés bancaires, des cartes de visite et du courrier. Le texte numérisé peut être édité électroniquement, recherché, stocké plus efficacement et utilisé dans des processus de machine tels que la cognition, la traduction automatique et l'extraction de texte. L'OCR est un domaine de recherche en reconnaissance de formes, en intelligence artificielle et en vision par ordinateur. Alors que les premières versions de l'OCR devaient être entraînées avec des images de chaque caractère et ne fonctionnaient que sur une police à la fois, les systèmes avancés sont désormais capables de produire une reconnaissance hautement précise pour la plupart des polices et prennent en charge une variété de formats de fichiers d'image numérique. Certains systèmes OCR peuvent même reproduire une sortie formatée qui ressemble étroitement à la page d'origine, y compris les images, les colonnes et d'autres composants non textuels.