Japanse OCR

Converteer gescande documenten en afbeeldingen naar bewerkbare Word-, Pdf-, Excel- en tekstuitvoerformaten

Hoe herken je tekst?

stap 1
stap 1
Bestand uploaden
Selecteer het bestand dat je wilt converteren vanaf je computer, Google Drive, Dropbox of sleep het naar de pagina
stap 2
stap 2
Selecteer de taal en het uitvoerformaat
Selecteer alle talen die in het document worden gebruikt. Kies ook het gewenste uitvoerformaat, bijvoorbeeld .doc (er worden meer dan 10 tekstformaten ondersteund)
stap 3
stap 3
Converteren en downloaden
Klik op de knop 'Herken' en download vervolgens je bestand met de herkende tekst

Optische tekenherkenning (OCR)

Optische tekenherkenning (OCR) is een proces dat afbeeldingen van getypte, handgeschreven of gedrukte tekst omzet in machineleesbare tekst. OCR-technologie kan gescande documenten, foto's van documenten, scènefoto's of ondertiteling die op een afbeelding is geplaatst, omzetten in machine-gecodeerde tekst. OCR wordt veel gebruikt om gedrukte tekst van papieren documenten zoals paspoorten, facturen, bankafschriften, visitekaartjes en post te digitaliseren. Gedigitaliseerde tekst kan elektronisch worden bewerkt, doorzocht, efficiënter worden opgeslagen en worden gebruikt in machineprocessen zoals cognitieve computing, machinevertaling en tekstmining. OCR is een onderzoeksgebied binnen patroonherkenning, kunstmatige intelligentie en computervisie. Terwijl vroege versies van OCR moesten worden getraind met afbeeldingen van elk teken en werkten met één lettertype tegelijk, zijn geavanceerde systemen nu in staat om zeer nauwkeurige herkenning te produceren voor de meeste lettertypen en ondersteunen ze verschillende digitale beeldbestandsindelingen. Sommige OCR-systemen kunnen zelfs opgemaakte output reproduceren die sterk lijkt op de originele pagina, inclusief afbeeldingen, kolommen en andere niet-tekstuele componenten.