OCR PDF

Taramalı belgeleri ve görüntüleri düzenlenebilir Word, Pdf, Excel ve metin çıktı formatlarına dönüştürün

Metin nasıl tanınır?

adım 1
adım 1
Dosya yükle
Bilgisayarınızdan, Google Drive'ınızdan, Dropbox'ınızdan dönüştürmek istediğiniz dosyayı seçin veya sayfaya sürükleyip bırakın
adım 2
adım 2
Dil ve çıktı formatını seçin
Belgenizde kullanılan tüm dilleri seçin. Ayrıca, istenen herhangi bir çıktı formatını seçin, örneğin, .doc (10'dan fazla metin formatı desteklenmektedir)
adım 3
adım 3
Dönüştür & İndir
'Recognize' düğmesine tıklayın ve ardından tanınan metinle dosyanızı indirin

Farklı PDF dosya türleri

OCR kullanarak PDF metninizin aranabilir hale getirilmeden önce, farklı PDF dosya türlerini bilmek önemlidir. Popüler olan üç tür aşağıda açıklanmaktadır.

  • Sadece Metin PDF - Ayrıca gerçek PDF veya metin tabanlı PDF olarak da bilinir. Bu dosya, kelime işlemci veya PDF'ye kaydetme işlevi / uygulaması kullanarak bir belgeyi PDF olarak kaydettiğinizde oluşturulur.
  • Sadece Görüntü PDF - Adından da anlaşılacağı gibi, görüntü tabanlı dosyalar tarama veya görüntü olarak yakalandığında oluşturulur. Örnekler arasında bir tarayıcı tarafından alınan dosyalar, fotoğraf, ekran görüntüsü işlevi vb. yer alır.
  • OCR PDF - Optik karakter tanıma (OCR) kullanarak aranabilir hale getirilen dosyalara atıfta bulunur. İşlem, belge yapısını okur ve aranabilir bir metin katmanı ekler.

PDF'yi OCR ile aranabilir hale getirme

Bir PDF'yi aranabilir hale getirmek için birkaç yöntem vardır. Kelime işlemcilerle çalışıyorsanız, belgeyi doğrudan PDF olarak yayınlayabilirsiniz. Ancak, aranabilir hale getirilmesi gereken bir dosyanız varsa, 2PDF gibi bir OCR aracı kullanmak en iyi seçeneğinizdir. PDF'nizi 2PDF'deki OCR ile aranabilir hale getirmek için şu adımları izleyin:

  1. PDF OCR'ı Açın - OCR, görüntü tabanlı dosyalarda çalışır, bu nedenle belgeyi taramanız veya görüntü tabanlı bir PDF olarak kaydedilmesini sağlamanız gerekecektir. Ardından, ana gezinmede Tüm Araçlar'a tıklayın ve PDF OCR'ı seçin. Bu, programı yeni bir pencerede açacaktır.
  2. PDF Yükleyin - Dosyanızı 2PDF'ye yüklemenin iki yolu vardır. Dosyayı OCR arayüzüne doğrudan sürükleyip bırakabilir veya bilgisayarınızdan dosyayı seçebilirsiniz. Yükleme süreci, PDF'nin boyutuna bağlı olarak birkaç saniye sürebilir.
  3. OCR PDF - PDF'nize OCR yapmak için, istenen dil ve çıktı biçimini ayarlayın ve Kırmızı Tanımla düğmesine tıklayın. Program belgeyi aranabilir hale getirecek ve ardından OCR işlenmiş PDF'yi indirebileceksiniz.

OCR için 2PDF kullanmanın faydaları

2PDF, görüntüleri ve taranmış belgeleri aranabilir ve düzenlenebilir PDF, Word, Excel ve diğer metin formatlarına dönüştürmenizi sağlayan kullanışlı bir araçtır. İşte OCR için 2PDF'yi kullanmanın beş avantajı:

  • Ücretsiz - 2PDF ücretsiz bir araçtır ve PDF dosyalarınızı OCR yapmanıza hiçbir maliyet olmadan olanak tanır.
  • Anında - Araç, ihtiyacınız olduğunda ve nerede olursanız olun, anında erişilebilir dönüştürmeler sunar.
  • Hızlı - 2PDF, PDF'leri sadece birkaç saniye içinde aranabilir, OCR geliştirilmiş dosyalara hızlıca dönüştürür.
  • Kolay - Prosedür basittir: yükle, dil seç, dönüştür ve indir.
  • Kolaylık - Dosyalarınızı bilgisayarınızdan, telefonunuzdan, Dropbox, Google Drive'dan veya sadece sürükleyip bırakarak yüklemek için seçenekleriniz vardır.

OCR nedir?

OCR kelimesinin anlamı, kısaltmanın açılımı yazıldığında en iyi şekilde ifade edilir. OCR, optik karakter tanıma anlamına gelir ve optik karakterleri tanıyan ve bunları makine kodlu metne dönüştüren bir elektronik işlemdir. Optik karakterler, yazılı veya el yazısı belgelerin taranmış dosyaları, telefon veya bilgisayarla çekilmiş fotoğraflar veya ekran görüntüleri olabilir.

Nasıl çalışıyor?

Bir PDF'deki sayfaları nasıl ayıracağınızı anlamaya çalışırken, PDF dosyalarını birleştirmeyi, çıkarmayı, döndürmeyi, sıkıştırmayı ve OCR yapmayı öğrenmeniz gerekebilir. 2PDF, PDF dosya işleme sürecini basitleştirmek için tasarlanmış kapsamlı bir araç setidir. İşte belirli bir noktada ihtiyacınız olabilecek iki araç:

  • PDF Birleştirme - Dosyaları bölmek, belgenin belirli bölümlerini elde etmenizi veya daha küçük parçalara ayırmanızı sağlar. Tersine, birleştirme, iki veya daha fazla dosyayı birleştirerek tek, daha büyük bir PDF belge oluşturur.
  • PDF Sıkıştırma - Dosyaları bölmek amacınız dosyaların boyutunu azaltmak veya alanı kaydetmek ise, sıkıştırma daha üstün bir alternatiftir. Sıkıştırma, dosyadaki tüm bilgileri korurken boyutunu en aza indirir.

Taranan belgelerin sayısallaştırılması

Bir PDF'nin OCR işlemi yapmak, tarama yapılan belgeleri dijitalleştirmeyi hedeflediğinizde önemli bir beceridir. Fiziksel dosyalarla çalışırken, en üst düzey tarayıcıları kullanmak ve yüksek kaliteli görüntüler yakalamak başarılı OCR işlemine önemli ölçüde katkıda bulunur. Tarayıcılar çeşitli yeteneklerle birlikte gelir, OCR araçları da öyledir. Geniş bir tarama belgesi ve görüntü yelpazesini tanıyabilen, son teknolojiyle donatılmış güvenilir bir araç kullandığınızdan emin olun.

PDF metni nasıl aranabilir hale getirilir

Optik karakter tanıma

Optik karakter tanıma (OCR), yazılı, el yazısı veya basılı metin görüntülerini makine okunabilir metne dönüştüren bir süreçtir. OCR teknolojisi, taranmış belgeleri, belge fotoğraflarını, sahne fotoğraflarını veya bir görüntü üzerine eklenmiş altyazıları makine kodlu metne dönüştürebilir. OCR genellikle pasaportlar, faturalar, banka dekontları, iş kartları ve posta gibi kağıt kayıtlarındaki basılı metni dijitalleştirmek için kullanılır. Dijitalleştirilmiş metin elektronik olarak düzenlenebilir, aranabilir, daha verimli bir şekilde depolanabilir ve bilişsel hesaplama, makine çevirisi ve metin madenciliği gibi makine işlemlerinde kullanılabilir. OCR, desen tanıma, yapay zeka ve bilgisayar görüşü araştırma alanıdır. Erken OCR sürümleri, her karakterin görüntüleriyle eğitilmesi gerekiyordu ve bir seferde sadece bir fontta çalışıyordu, ancak gelişmiş sistemler şimdi çoğu font için oldukça doğru tanıma yapabilmekte ve çeşitli dijital görüntü dosya biçimlerini desteklemektedir. Bazı OCR sistemleri, hatta görüntüler, sütunlar ve diğer metin dışı bileşenler de dahil olmak üzere orijinal sayfaya yakından benzeyen biçimlendirilmiş çıktı üretebilir.