OCR PDF

Konvertiere gescannte Dokumente und Bilder in bearbeitbare Ausgabeformate wie Word, PDF, Excel und Text

Wie erkenne ich Text?

Schritt 1
Schritt 1
Datei hochladen
Wähle die Datei aus, die du von deinem Computer, Google Drive oder Dropbox konvertieren möchtest, oder ziehe sie per Drag-and-Drop auf die Seite
Schritt 2
Schritt 2
Wähle die Sprache und das Ausgabeformat aus
Wähle alle Sprachen aus, die in deinem Dokument verwendet werden. Wähle auch das gewünschte Ausgabeformat aus, zum Beispiel .doc (mehr als 10 Textformate werden unterstützt)
Schritt 3
Schritt 3
Konvertieren und Herunterladen
Klicke auf den Button "Erkennen" und lade dann deine Datei mit dem erkannten Text herunter

Verschiedene Arten von PDF-Dateien

Bevor Sie damit beginnen, Ihren PDF-Text durch OCR durchsuchbar zu machen, ist es wichtig, die verschiedenen Arten von PDF-Dateien zu kennen. Die drei beliebtesten Typen werden unten beschrieben.

  • Nur-Text-PDF - Auch bekannt als wahres PDF oder textbasiertes PDF. Diese Datei wird erstellt, wenn Sie ein Dokument mit einem Textverarbeitungsprogramm als PDF speichern oder eine Funktion/Anwendung zum Speichern in PDF verwenden.
  • Nur-Bild-PDF - Wie der Name schon sagt, werden bildbasierte Dateien erstellt, wenn sie als Bild gescannt oder erfasst werden. Beispiele sind Dateien, die mit einem Scanner, einer Fotografie, der Screenshot-Funktion usw. aufgenommen wurden.
  • OCR-PDF - Bezieht sich auf durch optische Zeichenerkennung (OCR) durchsuchbare Dateien. Der Prozess liest die Dokumentenstruktur und fügt eine Textebene hinzu, die durchsuchbar ist.

Wie man mithilfe von OCR ein PDF durchsuchbar macht

Es gibt mehrere Methoden, um eine PDF durchsuchbar zu machen. Wenn Sie mit Textverarbeitungsprogrammen arbeiten, können Sie das Dokument direkt als PDF veröffentlichen. Wenn Sie jedoch bereits eine Datei haben, die durchsuchbar gemacht werden muss, ist die Verwendung eines OCR-Tools wie 2PDF die beste Wahl. Befolgen Sie diese Schritte, um Ihre PDF mit OCR in 2PDF erfolgreich durchsuchbar zu machen:

  1. PDF OCR öffnen – OCR funktioniert mit bildbasierten Dateien, daher müssen Sie das Dokument scannen oder sicherstellen, dass es als bildbasierte PDF gespeichert ist. Klicken Sie dann auf Alle Tools in der Hauptnavigation und wählen Sie PDF OCR. Dadurch wird das Programm in einem neuen Fenster geöffnet.
  2. PDF hochladen – Es gibt zwei Möglichkeiten, Ihre Datei auf 2PDF hochzuladen. Entweder ziehen Sie die Datei direkt auf die OCR-Oberfläche oder wählen Sie die Datei von Ihrem Computer aus. Der Upload-Vorgang dauert einige Sekunden, abhängig von der Größe der PDF.
  3. PDF OCR durchführen – Um OCR auf Ihrer PDF durchzuführen, legen Sie die gewünschte Sprache und das Format für die endgültige Ausgabe fest und klicken Sie auf die rote Schaltfläche Erkennen. Das Programm macht das Dokument durchsuchbar, danach können Sie die OCR-verarbeitete PDF herunterladen.

Vorteile der Verwendung von 2PDF für OCR

2PDF ist ein praktisches Dienstprogramm, mit dem Sie Bilder und gescannte Dokumente in durchsuchbare und bearbeitbare PDF-, Word-, Excel- und andere Textformate konvertieren können. Hier sind fünf Vorteile der Verwendung von 2PDF für OCR:

  • Kostenlos: 2PDF ist ein kostenloses Tool, mit dem Sie Ihre PDF-Dateien ohne Kosten OCR durchführen können.
  • Sofortig: Das Tool bietet sofortige Konvertierungen, die jederzeit und überall zugänglich sind.
  • Schnell: 2PDF konvertiert PDFs in durchsuchbare, OCR-verstärkte Dateien in nur wenigen Sekunden.
  • Einfach: Der Vorgang ist unkompliziert: Hochladen, Sprache wählen, konvertieren und herunterladen.
  • Bequem: Sie haben die Möglichkeit, Dateien von Ihrem Computer, Telefon, Dropbox, Google Drive oder einfach per Drag & Drop hochzuladen.

Wie funktioniert OCR?

Die Bedeutung von OCR wird am besten vermittelt, wenn man das Akronym ausschreibt. OCR steht für optische Zeichenerkennung, ein elektronischer Prozess, der optische Zeichen erkennt und sie in maschinencodierten Text umwandelt. Optische Zeichen können gescannte Dateien von gedruckten oder handgeschriebenen Dokumenten, Fotografien oder Bildschirmaufnahmen sein, die mit einem Telefon oder Computer aufgenommen wurden.

Wie funktioniert es?

Wenn Sie lernen möchten, wie man Seiten in einem PDF-Dokument teilt, müssen Sie wahrscheinlich auch lernen, wie man PDF-Dokumente zusammenführt, extrahiert, dreht, komprimiert und OCR durchführt. 2PDF ist eine umfassende Suite von Tools, die Verarbeitung von PDF-Dateien vereinfachen soll. Hier sind zwei Tools, die Sie möglicherweise benötigen:

  • PDF zusammenführen - Durch das Teilen von Dateien können Sie bestimmte Abschnitte des Dokuments erhalten oder es in kleinere Teile aufteilen. Im Gegensatz dazu kombiniert das Zusammenführen zwei oder mehr einzelne Dateien, um ein größeres PDF-Dokument zu erstellen.
  • PDF komprimieren - Wenn Ihr Ziel beim Teilen von Dateien darin besteht, ihre Größe zu reduzieren oder Speicherplatz zu sparen, ist die Komprimierung eine überlegene Alternative. Die Komprimierung behält alle Informationen in der Datei bei, minimiert jedoch ihre Größe.

Digitalisierung gescannter Dokumente

Das Beherrschen der Fähigkeit, PDFs zu OCR-Texten umzuwandeln, ist unerlässlich, wenn Sie gescannte Dokumente digitalisieren möchten. Wenn Sie mit physischen Dateien arbeiten, tragen hochwertige Scanner und die Aufnahme von qualitativ hochwertigen Bildern wesentlich zum erfolgreichen OCR-Verarbeitungsprozess bei. Scanner verfügen über verschiedene Fähigkeiten, ebenso wie OCR-Tools. Stellen Sie sicher, dass Sie ein zuverlässiges Tool mit modernster Technologie verwenden, das in der Lage ist, eine Vielzahl von gescannten Dokumenten und Bildern zu erkennen.

Wie man einen PDF-Text durchsuchbar macht

Die Verwendung von OCR für PDF ermöglicht es Ihnen, eine gescannte Datei durchsuchbar und bearbeitbar zu machen. Es gibt jedoch Situationen, in denen Sie eine nicht durchsuchbare PDF-Datei erstellen möchten. Der Prozess konvertiert einfach die Textelemente in ein reines Bildformat, das von herkömmlichen Suchwerkzeugen und -funktionen nicht erkannt wird. Hier sind die zwei besten Methoden, um den Text Ihrer PDF un-durchsuchbar zu machen.

  • Bildbasierte PDF – Sie benötigen keine OCR für PDF, um diese Methode zu verwenden. Speichern Sie das Dokument einfach als bildbasierte PDF in dem von Ihnen verwendeten Programm.
  • 2DPF verwenden – 2PDF ermöglicht es Ihnen, OCR auszuführen, wenn Sie einen Text durchsuchbar machen müssen. Die Seite konvertiert auch durchsuchbare Dokumente in undurchsuchbare bildbasierte PDFs. Wählen Sie einfach die gewünschte Konvertierung im oberen Menü, laden Sie Ihre Datei hoch, konvertieren Sie sie und laden Sie sie herunter. Die Plattform bietet Werkzeuge zum Konvertieren, Zusammenführen, Teilen, Passwortschützen, Entsperren von PDF usw.

Optische Zeichenerkennung

Die optische Zeichenerkennung (OCR) ist ein Prozess, der Bilder von getipptem, handgeschriebenem oder gedrucktem Text in maschinenlesbaren Text umwandelt. OCR-Technologie kann gescannte Dokumente, Fotos von Dokumenten, Szenenfotos oder auf einem Bild überlagerte Untertitel in maschinencodierten Text konvertieren. OCR wird häufig verwendet, um gedruckten Text von Papierdokumenten wie Reisepässen, Rechnungen, Kontoauszügen, Visitenkarten und Briefen zu digitalisieren. Digitalisierter Text kann elektronisch bearbeitet, durchsucht, effizienter gespeichert und in maschinellen Prozessen wie kognitivem Computing, maschineller Übersetzung und Text-Mining verwendet werden. OCR ist ein Forschungsgebiet in der Mustererkennung, künstlicher Intelligenz und Computer Vision. Während frühe OCR-Versionen auf die Bilder jedes Zeichens trainiert werden mussten und jeweils nur eine Schriftart verarbeiteten, sind fortgeschrittene Systeme heute in der Lage, hochgenaue Erkennungsergebnisse für die meisten Schriftarten zu liefern und unterstützen eine Vielzahl von digitalen Bildformate. Einige OCR-Systeme können sogar formatierte Ausgaben reproduzieren, die der Originalseite sehr ähnlich sind, einschließlich Bilder, Spalten und anderer nicht-textlicher Komponenten.