Optical Character Recognition (OCR)
Konvertieren von gescannten Dokumenten und Bildern in bearbeitbare Word, PDF, Excel und Textausgabeformate
Wie Text zu erkennen?
Verschiedene Arten von PDF-Dateien
Bevor Sie beginnen, Ihren PDF-Text mit OCR durchsuchbar zu machen, ist es wichtig, die verschiedenen Arten von PDF-Dateien zu kennen. Die drei gängigen Typen werden im Folgenden beschrieben.
- Text-Only PDF – Auch als echtes PDF oder textbasiertes PDF bekannt. Diese Datei wird erstellt, wenn Sie ein Dokument mit einem Textverarbeitungsprogramm oder einer beliebigen PDF-Funktion/Anwendung als PDF speichern.
- Nur-Bild-PDF – Wie der Name schon sagt, Bild- basierte Dateien werden erstellt, wenn sie gescannt oder als Bild erfasst werden. Beispiele hierfür sind von einem Scanner aufgenommene Dateien, Fotos, Screenshot-Funktionen usw.
- OCR PDF – Bezieht sich auf Dateien, die mit optischer Zeichenerkennung (OCR) durchsuchbar gemacht wurden. Der Prozess liest die Dokumentstruktur und fügt eine durchsuchbare Textebene hinzu.
So machen Sie ein PDF mit OCR durchsuchbar
Es gibt verschiedene Möglichkeiten, ein PDF durchsuchbar zu machen. Sie können das Dokument als PDF veröffentlichen, wenn Sie mit Textverarbeitungsprogrammen arbeiten. Wenn Sie jedoch bereits eine Datei haben, die Sie durchsuchbar machen möchten, ist ein OCR-Tool wie 2PDF die beste Lösung. Im Folgenden sind die Schritte aufgeführt, die erforderlich sind, um ein PDF erfolgreich mit OCR auf 2PDF durchsuchbar zu machen.
- PDF OCR öffnen – OCR funktioniert bei bildbasierten Dateien, daher sollten Sie die Dokument oder stellen Sie sicher, dass es als bildbasiertes PDF gespeichert wird. Klicken Sie anschließend in der Hauptnavigation auf Alle Tools und wählen Sie PDF OCR. Dadurch wird das Programm in einem neuen Fenster gestartet.
- PDF hochladen – Es gibt zwei Möglichkeiten, Ihre Datei auf 2PDF hochzuladen. Sie können die Datei direkt auf die OCR ziehen und dort ablegen oder die Datei von Ihrem Computer auswählen. Der Vorgang dauert je nach PDF-Größe einige Sekunden.
- OCR PDF – Um Ihr PDF mit OCR zu versehen, stellen Sie die gewünschte Sprache und das gewünschte Format für die endgültige Ausgabe ein und klicken Sie auf rote Erkennungstaste. Das Programm macht das Dokument durchsuchbar, wonach Sie das OCR-PDF herunterladen können.
Vorteile der Verwendung von 2PDF für OCR
2PDF ist ein praktisches Tool, mit dem Sie Bilder und gescannte Dokumente in durchsuchbare und bearbeitbare PDF-, Word-, Excel- und andere Textformate konvertieren können. Nachfolgend sind fünf Vorteile der Verwendung von 2PDF für OCR aufgeführt.
- Kostenlos – 2PDF ist ein kostenloses Tool, sodass Sie Ihre PDF-Dateien kostenlos mit OCR bearbeiten können.
- Sofort – Das Tool bietet Online-Konvertierungen, die Sie jederzeit und überall erreichen können.
- Schnell – 2PDF konvertiert PDF in Sekundenschnelle in durchsuchbare OCR-Dateien.
- Einfach – Der Prozess ist einfach; hochladen, Sprache angeben, konvertieren und herunterladen.
- Praktisch – Sie können Dateien von Ihrem Computer, Telefon, Dropbox, Google Drive oder per Drag & Drop hochladen.
Was ist OCR?
Die einfache Frage, was ist OCR? lässt sich am besten beantworten, wenn Sie das Akronym ausdrücken. OCR bedeutet einfach optische Zeichenerkennung, was sich auf einen elektronischen Mechanismus bezieht, der optische Zeichen erkennt und sie in maschinencodierten Text umwandelt. Ein optisches Zeichen kann jede gescannte Datei gedruckter oder handgeschriebener Dokumente, ein Foto oder ein Screenshot sein, der mit einem Telefon oder Computer-Schnappschüssen aufgenommen wurde.
Wie funktioniert es?
Wenn Sie bei einer PDF-Datei OCR ausführen, ist der erste Schritt die Vorverarbeitung, die das Dokument bereinigt und die Zeichen von allem anderen trennt. Als nächstes isoliert der Prozess jedes Zeichen und vergleicht es mit einer Bibliothek, um zu bestimmen, was es ist. Fortgeschrittene OCRs verwenden ausgefeiltere Programme, um handschriftliche Dokumente zu verarbeiten, indem sie die Zeichenstruktur wie die beiden vertikalen Linien und eine sich kreuzende horizontale Linie im Buchstaben „H“ vergleichen. Die Programme erkennen auch Zeichengruppen als Wörter und vergleichen sie mit dem nächsten Wort und Satz.
Digitalisierung gescannter Dokumente
So machen Sie einen PDF-Text nicht durchsuchbar
Mit OCR für PDF können Sie eine gescannte Datei durchsuchbar und bearbeitbar machen. Manchmal möchten Sie jedoch eine nicht durchsuchbare PDF-Datei erstellen. Der Prozess wandelt die Textelemente einfach in ein Nur-Bild-Format um, das von Standardsuchwerkzeugen und -funktionen nicht erkannt wird. Im Folgenden finden Sie die zwei besten Methoden, um Ihren PDF-Text nicht durchsuchbar zu machen.
- Nur-Bild-PDF – Sie benötigen keine OCR für PDF diese Methode zu verwenden. Speichern Sie das Dokument einfach als reines Bild-PDF in dem von Ihnen verwendeten Prozessor.
- Verwenden Sie 2DPF – Mit 2PDF können Sie OCR ausführen, wenn Sie einen Text durchsuchbar machen müssen. Die Site konvertiert auch durchsuchbare Dokumente in nicht durchsuchbare bildbasierte PDFs. Wählen Sie einfach die gewünschte Konvertierung im oberen Menü aus, laden Sie Ihre Datei hoch, konvertieren Sie sie und laden Sie sie herunter. Die Plattform bietet Tools zum Konvertieren, Zusammenführen, Aufteilen, Passwortschutz, Entsperren von PDF usw.