OCR PDF

Gescande documenten en afbeeldingen converteren naar bewerkbare Word-, Pdf-, Excel- en tekstuitvoerformaten

Hoe de tekst te herkennen?

stap 1
stap 1
Bestand uploaden
Selecteer het bestand dat u wilt converteren vanaf uw computer, Google Drive, Dropbox of sleep het naar de pagina
stap 2
stap 2
Taal en outputformaat selecteren
Selecteer alle talen die in uw document worden gebruikt. Kies ook elk gewenst outputformaat, bijvoorbeeld .doc (meer dan 10 tekstformaten worden ondersteund)
stap 3
stap 3
Converteren en downloaden
Klik op de knop "Herkennen" en download vervolgens uw bestand met de herkende tekst

Optische tekenherkenning

"Optical character recognition (OCR) of in het Nederlands: optische tekenherkenning is de elektronische of mechanische conversie van afbeeldingen van getypte, handgeschreven of afgedrukte tekst naar machine-gecodeerde tekst, of het nu gaat om een gescand document, een foto van een document, een scènefoto (bijvoorbeeld de tekst op borden en reclameborden in een landschapsfoto) of uit ondertiteltekst, bovenop een afbeelding (bijvoorbeeld van een televisie-uitzending). Op grote schaal gebruikt als een vorm van data-invoer van afgedrukte papieren datarecords - of het nu gaat om paspoortdocumenten, facturen, bankafschriften, geautomatiseerde ontvangstbewijzen, visitekaartjes, mail, afdrukken van statische gegevens of andere geschikte documentatie – is het een veelgebruikte methode om afgedrukte teksten te digitaliseren, zodat ze elektronisch kunnen worden bewerkt, doorzocht, compacter kunnen worden opgeslagen, online kunnen worden weergegeven en kunnen worden gebruikt in machineprocessen, zoals cognitive computing, machinevertaling, (geëxtraheerde) tekst-naar-spraak, sleuteldata en text mining. OCR is een onderzoeksgebied op het vlak van patroonherkenning, kunstmatige intelligentie en computervisie. Eerdere versies moesten worden getraind met afbeeldingen van elk teken en werkten aan één lettertype tegelijk. Geavanceerde systemen, die in staat zijn om voor de meeste lettertypen een hoge mate van herkenningsnauwkeurigheid te produceren, zijn nu gebruikelijk en worden ondersteund door een verscheidenheid aan digitale beeldbestandsindelingen. Sommige systemen zijn in staat om geformatteerde output te reproduceren, die de originele pagina zeer nauw benadert, inclusief afbeeldingen, kolommen en andere niet-tekstuele componenten. "