التعرف الضوئي على الأحرف لملف PDF

قم بتحويل المستندات والصور الممسوحة ضوئيًا إلى تنسيقات Word و Pdf و Excel ونصوص قابلة للتحرير

كيف تتعرف على النص؟

الخطوة 1
الخطوة 1
رفع ملف
حدد الملف الذي تريد تحويله من جهاز الكمبيوتر أو Google Drive أو Dropbox أو اسحبه وأفلته على الصفحة
الخطوة 2
الخطوة 2
حدد اللغة وتنسيق الملفات المخرجة
حدد جميع اللغات المستخدمة في المستند الخاص بك. اختر أيضًا أي تنسيق تريده للملفات المخرجة، على سبيل المثال .doc (يدعم أكثر من 10 تنسيقات نصية)
الخطوه 3
الخطوه 3
التحويل والتحميل
انقر فوق زر "التعرف" ثم قم بتنزيل ملفك بالنص الذي تم التعرف عليه

أنواع مختلفة من ملفات PDF

قبل أن تبدأ في جعل نص PDF الخاص بك قابلاً للبحث باستخدام التعرف الضوئي على الحروف ، من الضروري معرفة الأنواع المختلفة لملفات PDF. الأنواع الثلاثة الشائعة موضحة أدناه.

  • ملف PDF نصي فقط - يُعرف أيضًا باسم PDF الحقيقي أو PDF المستند إلى النص. يتم إنشاء هذا الملف عند حفظ مستند بتنسيق PDF باستخدام معالج النصوص أو أي حفظ إلى وظيفة / تطبيق PDF.
  • ملف PDF للصور فقط - كما يوحي الاسم ، صورة- يتم إنشاء الملفات المستندة عند مسحها ضوئيًا أو التقاطها كصورة. تشمل الأمثلة الملفات التي تم التقاطها بواسطة ماسح ضوئي ، وصورة فوتوغرافية ، ووظيفة لقطة شاشة ، وما إلى ذلك.
  • OCR PDF - تشير إلى الملفات التي أصبحت قابلة للبحث باستخدام التعرف الضوئي على الأحرف (OCR). تقرأ العملية بنية المستند وتضيف طبقة نص يمكن البحث فيها.

كيفية جعل ملف PDF قابلاً للبحث باستخدام التعرف الضوئي على الحروف

هناك طرق عديدة لجعل ملف PDF قابلاً للبحث. يمكنك نشر المستند بصيغة PDF إذا كنت تعمل باستخدام برامج معالجة النصوص. ومع ذلك ، إذا كان لديك بالفعل ملف تريد جعله قابلاً للبحث ، فإن أداة التعرف الضوئي على الحروف مثل 2PDF هي أفضل حل لك. فيما يلي الخطوات المطلوبة لجعل ملف PDF قابلاً للبحث بنجاح باستخدام OCR على 2PDF.

  1. فتح PDF OCR - يعمل التعرف الضوئي على الحروف على الملفات المستندة إلى الصور ، لذا يجب عليك مسح المستند أو تأكد من حفظه كملف PDF قائم على الصور. بعد ذلك ، انقر فوق All Tools من شريط التنقل الرئيسي وحدد PDF OCR. سيؤدي هذا إلى تشغيل البرنامج في نافذة جديدة.
  2. تحميل ملف PDF - هناك طريقتان لتحميل ملفك على 2PDF. يمكنك سحب الملف وإفلاته مباشرة في OCR أو اختيار الملف من جهاز الكمبيوتر الخاص بك. ستستغرق العملية بضع ثوانٍ اعتمادًا على حجم PDF.
  3. OCR PDF - لإجراء التعرف الضوئي على الحروف لملف PDF الخاص بك ، قم بتعيين اللغة والصيغة التي تريدها للمخرجات النهائية ، ثم انقر فوق الزر زر التعرف الأحمر. سيجعل البرنامج المستند قابلاً للبحث وبعد ذلك يمكنك تنزيل OCR’d PDF.

فوائد استخدام 2PDF لـ OCR

2PDF هي أداة ملائمة تتيح لك تحويل الصور والمستندات الممسوحة ضوئيًا إلى تنسيقات PDF و Word و Excel وتنسيقات نصية أخرى قابلة للبحث والتحرير. فيما يلي خمس فوائد لاستخدام 2PDF لـ OCR.

  • مجاني - 2PDF هي أداة مجانية ، لذا يمكنك التعرف الضوئي على الحروف لملفات PDF الخاصة بك مجانًا.
  • فوري - تقدم الأداة يمكنك تحقيق تحويلات عبر الإنترنت في أي وقت وفي أي مكان.
  • سريع - يحول 2PDF PDF إلى ملفات OCR قابلة للبحث في غضون ثوانٍ.
  • سهلة - العملية بسيطة ؛ تحميل وتحديد اللغة وتحويل وتنزيل.
  • ملائم - يمكنك تحميل الملفات من جهاز الكمبيوتر أو الهاتف أو Dropbox أو Google Drive أو السحب والإفلات.

ما هو التعرف الضوئي على الحروف؟

أفضل إجابة عن السؤال البسيط المتمثل في ما هو التعرف الضوئي على الحروف عند التعبير عن الاختصار. OCR يعني ببساطة التعرف الضوئي على الأحرف ، والذي يشير إلى آلية إلكترونية تتعرف على الأحرف الضوئية وتحولها إلى نص مشفر آليًا. يمكن أن تكون الشخصية البصرية أي ملف ممسوح ضوئيًا لمستندات مطبوعة أو مكتوبة بخط اليد أو صورة فوتوغرافية أو لقطة شاشة تم التقاطها باستخدام لقطات الهاتف أو الكمبيوتر.

كيف يعمل؟

عند تشغيل OCR في ملف PDF ، فإن الخطوة الأولى هي المعالجة المسبقة ، والتي تنظف المستند وتفصل الأحرف عن أي شيء آخر. بعد ذلك ، ستقوم العملية بعزل كل حرف ومقارنته بمكتبة لتحديد ما هو عليه. تستخدم OCRs المتقدمة برامج أكثر تعقيدًا لمعالجة المستندات المكتوبة بخط اليد من خلال مقارنة بنية الأحرف مثل الخطين الرأسيين والخط الأفقي المتقاطع في الحرف "H". تتعرف البرامج أيضًا على مجموعات الشخصيات ككلمات وتقارنها بالكلمة التالية والجملة التالية.

رقمنة المستندات الممسوحة ضوئيًا

يعد تعلم كيفية التعرف الضوئي على الحروف على ملف PDF أمرًا حيويًا عندما تريد رقمنة الملفات الممسوحة ضوئيًا. إذا كان لديك مستندات مادية ، فإن استخدام ماسحات ضوئية عالية الجودة والتقاط أفضل صورة بجودة سيقطع شوطًا طويلاً في ضمان معالجة OCR بنجاح. الماسحات الضوئية لها قدرات متفاوتة ، وكذلك OCRs. تأكد من أنك تستخدم أداة موثوقة مع برامج متقدمة يمكنها التعرف على جميع أنواع المستندات واللقطات الممسوحة ضوئيًا.

كيفية جعل نص PDF غير قابل للبحث

يتيح لك استخدام OCR لـ PDF جعل الملف الممسوح ضوئيًا قابلاً للبحث والتعديل. ومع ذلك ، هناك أوقات تريد فيها إنشاء ملف PDF غير قابل للبحث. تقوم العملية ببساطة بتحويل عناصر النص إلى تنسيق للصور فقط لا تتعرف عليه أدوات ووظائف البحث القياسية. فيما يلي أفضل طريقتين لجعل نص PDF غير قابل للبحث.

  • ملف PDF للصور فقط - لست بحاجة إلى التعرف الضوئي على الحروف لملف PDF لاستخدام هذه الطريقة. ما عليك سوى حفظ المستند كملف PDF للصور فقط داخل المعالج الذي تستخدمه.
  • استخدام 2DPF - يتيح لك 2PDF تشغيل التعرف الضوئي على الحروف عندما تحتاج إلى جعل النص قابلاً للبحث. يقوم الموقع أيضًا بتحويل المستندات التي يمكن البحث فيها إلى ملفات PDF قائمة على الصور غير قابلة للبحث. ما عليك سوى تحديد التحويل الذي تريده في القائمة العلوية ، وتحميل ملفك وتحويله وتنزيله. يوفر النظام الأساسي أدوات للتحويل والدمج والتقسيم وحماية كلمة المرور وفتح ملفات PDF وما إلى ذلك.

التعرف الضوئي على الحروف

التعرف الضوئي على الأحرف أو قارئ الأحرف الضوئي (OCR) هو التحويل الإلكتروني أو الميكانيكي لصور النص المكتوب أو المكتوب بخط اليد أو المطبوع إلى نص تم ترميزه آليًا، سواء من مستند ممسوح ضوئيًا أو صورة لمستند أو صورة مشهد (على سبيل المثال النص الموجود على اللافتات واللوحات الإعلانية في صورة أفقية) أو من نص الترجمة المركّب على صورة (على سبيل المثال من البث التلفزيوني). تستخدم على نطاق واسع كشكل من أشكال إدخال البيانات من سجلات البيانات الورقية المطبوعة - سواء مستندات جواز السفر أو الفواتير أو كشوف الحسابات المصرفية أو الإيصالات المحوسبة أو بطاقات العمل أو البريد أو مطبوعات البيانات الثابتة أو أي وثائق مناسبة - فهي طريقة شائعة لرقمنة النصوص المطبوعة بحيث يمكن تحريرها وتعديلها إلكترونيًا والبحث فيها وتخزينها بصورة مدمجة ومضغوطة بدرجة أكبر وعرضها على الإنترنت واستخدامها في العمليات الآلية مثل الحوسبة المعرفية والترجمة الآلية وتحويل النص إلى كلام والبيانات الرئيسية واستخراج النصوص. التعرف الضوئي على الأحرف OCR هو مجال بحثي للكثير من التكنولوجيا المتعلقة بالتعرف على الأنماط والذكاء الاصطناعي ورؤية الكمبيوتر. الإصدارات الأولى كان يجب تدريبها على صور كل حرف من الأحرف، وأن تعمل على نوع واحد من أشكال الخطوط في كل مرة. في الوقت الحالي أصبحت الأنظمة المتقدمة القادرة على تحقق مستوى عال من دقة التعرف لمعظم أشكال الخطوط منتشرة بدرجة كبيرة، وأصبحت كذلك تدعم مجموعة متنوعة من إدخالات تنسيقات ملفات الصور الرقمية. بعض الأنظمة قادرة على إعادة إنتاج مخرجات منسقة تقارب إلى حد كبير الصفحة الأصلية بما في ذلك الصور والأعمدة والمكونات غير النصية الأخرى.

التعرف الضوئي على الأحرف لملف PDF