OCR PDF

Taranan Belgeleri ve Görüntüleri Düzenlenebilir Word, Pdf, Excel ve metin çıktı formatlarına dönüştürün

Metin tanıma nasıl yapılır?

1. adım
1. adım
Dosya yükle
Bilgisayarınız, Google Drive, Dropbox’tan dönüştüreceğiniz dosyayı seçin veya dosyayı sürükleyip sayfa üzerine bırakın
2. adım
2. adım
Dil ve çıktı dosya türü seçin
Belgenizde kullanılan tüm dilleri seçin. Ayrıca, .doc gibi istediğiniz herhangi çıktı dosya türünü de seçin (10’dan fazla metin dosyası türü desteklenmektedir)
3. adım
3. adım
Dönüştür ve İndir
"Metin Tanıma" butonuna tıklayın ve sonra da tanınmış metin içeren dosyanızı indirin

Farklı PDF dosyaları türleri

PDF metninizi OCR kullanarak aranabilir hale getirmeye başlamadan önce, farklı PDF dosyası türlerini bilmek çok önemlidir. Üç popüler tür aşağıda açıklanmıştır.

  • Salt Metin PDF – Gerçek PDF veya metin tabanlı PDF olarak da bilinir. Bu dosya, bir kelime işlemci veya herhangi bir PDF'ye kaydetme işlevi/uygulaması kullanarak bir belgeyi PDF olarak kaydettiğinizde yapılır.
  • Yalnızca Resim PDF – Adından da anlaşılacağı gibi, resim- tabanlı dosyalar, tarandıklarında veya görüntü olarak yakalandıklarında oluşturulur. Örnekler, bir tarayıcı, fotoğraf, ekran görüntüsü işlevi vb. tarafından alınan dosyaları içerir.
  • OCR PDF – Optik karakter tanıma (OCR) kullanılarak aranabilir hale getirilen dosyalara atıfta bulunur. İşlem, belge yapısını okur ve aranabilir bir metin katmanı ekler.

OCR ile aranabilir bir PDF nasıl yapılır

Bir PDF'yi aranabilir hale getirmenin çeşitli yolları vardır. Kelime işlemcilerle çalışıyorsanız belgeyi PDF olarak yayınlayabilirsiniz. Ancak, aranabilir hale getirmek istediğiniz bir dosyanız varsa, 2PDF gibi bir OCR aracı en iyi çözümünüzdür. Aşağıda, 2PDF'de OCR ile PDF'yi aranabilir hale getirmek için gereken adımlar verilmiştir.

  1. PDF OCR'sini Aç – OCR, görüntü tabanlı dosyalarda çalışır, bu nedenle veya görüntü tabanlı bir PDF olarak kaydedildiğinden emin olun. Ardından, ana navigasyondan Tüm Araçlar'a tıklayın ve PDF OCR'yi seçin. Bu, programı yeni bir pencerede başlatacaktır.
  2. PDF Yükle – Dosyanızı 2PDF'ye yüklemenin iki yolu vardır. Dosyayı doğrudan OCR'ye sürükleyip bırakabilir veya dosyayı bilgisayarınızdan seçebilirsiniz. İşlem, PDF boyutuna bağlı olarak birkaç saniye sürecektir.
  3. OCR PDF – PDF'nizi OCR yapmak için, son çıktı için istediğiniz dili ve formatı ayarlayın ve kırmızı Tanı düğmesi. Program, belgeyi aranabilir hale getirecek ve ardından OCR'd PDF'yi indirebileceksiniz.

OCR için 2PDF kullanmanın faydaları

2PDF, görüntüleri ve taranmış belgeleri aranabilir ve düzenlenebilir PDF, Word, Excel ve diğer metin biçimlerine dönüştürmenize olanak tanıyan kullanışlı bir araçtır. Aşağıda, OCR için 2PDF kullanmanın beş avantajı bulunmaktadır.

  • Ücretsiz – 2PDF ücretsiz bir araçtır, dolayısıyla PDF dosyalarınızı ücretsiz olarak OCR yapabilirsiniz.
  • Anında – Araç şunları sunar: her zaman, her yerde elde edebileceğiniz çevrimiçi dönüşümler.
  • Hızlı – 2PDF, PDF'yi saniyeler içinde aranabilir OCR'd dosyalarına dönüştürür.
  • Kolay – İşlem basittir; yükleyin, dili belirtin, dönüştürün ve indirin.
  • Kullanışlı – Dosyaları bilgisayarınızdan, telefonunuzdan, Dropbox'tan, Google Drive'dan yükleyebilir veya sürükleyip bırakabilirsiniz.

OCR nedir?

OCR nedir şeklindeki basit soru, en iyi şekilde kısaltmayı ifade ettiğinizde yanıtlanır. OCR, optik karakterleri tanıyan ve bunları makine tarafından kodlanmış metne dönüştüren elektronik bir mekanizmayı ifade eden optik karakter tanıma anlamına gelir. Optik karakter, basılı veya elle yazılmış belgelerin taranmış herhangi bir dosyası, bir fotoğraf veya telefon ya da bilgisayar anlık görüntüleri kullanılarak çekilmiş ekran görüntüsü olabilir.

O nasıl çalışır?

Bir PDF dosyasında OCR çalıştırdığınızda, ilk adım, belgeyi temizleyen ve karakterleri diğer her şeyden ayıran ön işlemedir. Daha sonra süreç, her karakteri izole edecek ve ne olduğunu belirlemek için onu bir kitaplıkla karşılaştıracaktır. Gelişmiş OCR'ler, iki dikey çizgi ve 'H' harfindeki çapraz yatay çizgi gibi karakter yapısını karşılaştırarak el yazısı belgeleri işlemek için daha karmaşık programlar kullanır. Programlar ayrıca karakter gruplarını kelime olarak tanır ve bunları bir sonraki kelime ve cümle ile karşılaştırır.

Bir PDF dosyasında OCR çalıştırdığınızda, ilk adım ön işlemedir, bu da temizler. ve karakterleri diğer her şeyden ayırır. Daha sonra süreç, her karakteri izole edecek ve ne olduğunu belirlemek için onu bir kitaplıkla karşılaştıracaktır. Gelişmiş OCR'ler, iki dikey çizgi ve 'H' harfindeki çapraz yatay çizgi gibi karakter yapısını karşılaştırarak el yazısı belgeleri işlemek için daha karmaşık programlar kullanır. Programlar ayrıca karakter gruplarını kelime olarak tanır ve bunları bir sonraki kelime ve cümle ile karşılaştırır.

Taranan belgeleri dijitalleştirme

Taranan dosyaları dijitalleştirmek istediğinizde PDF'nin nasıl OCR yapılacağını öğrenmek çok önemlidir. Fiziksel belgelere sahipseniz, yüksek kaliteli tarayıcılar kullanmak ve en iyi kalitede görüntüyü yakalamak, başarılı OCR işlemeyi sağlamada uzun bir yol kat edecektir. Tarayıcıların çeşitli yetenekleri vardır ve OCR'ler de öyle. Her tür taranan belgeyi ve anlık görüntüyü tanıyabilen gelişmiş programlara sahip güvenilir bir araç kullandığınızdan emin olun.

Bir PDF metni aranamaz hale nasıl getirilir

PDF için OCR kullanmak, taranan bir dosyayı aranabilir ve düzenlenebilir hale getirmenize olanak tanır. Ancak, aranamayan bir PDF dosyası oluşturmak istediğiniz zamanlar vardır. İşlem, metin öğelerini, standart arama araçlarının ve işlevlerinin tanımadığı salt görüntü biçimine dönüştürür. Aşağıda, PDF metninizi aranamaz hale getirmek için en iyi iki yöntem bulunmaktadır.

  • Yalnızca Resimli PDFPDF için OCR'a ihtiyacınız yoktur. Bu yöntemi kullanmak için. Belgeyi, kullandığınız işlemcide salt görüntü PDF olarak kaydetmeniz yeterlidir.
  • 2DPF Kullan – 2PDF, bir metni aranabilir hale getirmeniz gerektiğinde OCR'yi çalıştırmanıza olanak tanır. Site ayrıca aranabilir belgeleri aranamayan görüntü tabanlı PDF'lere dönüştürür. Üst menüden istediğiniz dönüşümü seçin, dosyanızı yükleyin, dönüştürün ve indirin. Platform, dönüştürme, birleştirme, bölme, parola koruması, PDF'nin kilidini açma vb. için araçlar sunar.

Optik karakter tanıma

Optik karakter tanıma veya optik karakter okuyucu (OCR), daktilo edilmiş, elle yazılmış veya bastırılmış metinlerin resimlerini, taranmış bir belge, bir belgenin fotoğrafı, bir manzara fotoğrafı (örneğin bir manzara fotoğrafında tabelalar ve reklam panoları üzerindeki yazılar) veya bir resim üzerine eklenmiş altyazı metinleri (örneğin bir televizyon yayınından) olması fark etmeksizin makine kodlanmış metin haline elektronik veya mekanik olarak dönüştürülmesidir. Kağıt üzerine yazdırılmış veri kayıtlarından –pasaport belgeleri, faturalar, banka hesap özetleri, alındı çıktıları, kartvizitler, posta, statik verinin çıktıları veya herhangi diğer uygun belgeler– veri girişi amaçlı olarak bu yazdırılmış metinlerin dijitalleştirilmesinde ve böylece elektronik ortamda düzenlenmeleri, aratılmaları, daha az yer kaplayacak şekilde saklanmaları, internette görüntülenmeleri ve bilişsel programlama, makine çeviri, (dışa aktarılmış) metinden konuşmaya, anahtar veri ve metin madenciliği amaçlı sıkça kullanılan bir yöntemdir. OCR örüntü tanıma, yapay zeka ve bilgisayarla görme alanlarında bir araştırma konusudur. Bu teknolojinin ilk sürümleri, her bir karakterin resimleri ile eğitilmesini ve her seferinde bir yazı tipi ile çalışılmasını gerektirmiştir. Çoğu yazı tipi için üst düzey tanıma hassasiyeti sağlayabilen gelişmiş sistemler günümüzde yaygın hale gelmiştir ve çeşitli dijital resim dosyası türünde girdiyi desteklemektedir. Bazı sistemler biçimlendirilmiş çıktının resimler, sütunlar ve diğer metin dışı bileşenler de dahil olmak üzere sayfanın aslı ile yakın benzerlikler göstermesini sağlayabilmektedir.