OCR PDF

تحويل المستندات الممسوحة ضوئيًا والصور إلى تنسيقات قابلة للتحرير: Word، Pdf، Excel والنص

اسحب ملفك هنا

اختر ملف

الإنجليزية OCR الإسبانية OCR الروسية OCR الألمانية OCR الفرنسية OCR الإيطالية OCR

View all

كيفية التعرف على النص?

الخطوة 1

تحميل الملف

اختر الملف الذي تريد تحويله من جهاز الكمبيوتر الخاص بك، أو من Google Drive، أو Dropbox، أو اسحبه وأسقطه على الصفحة

الخطوة 2

اختر اللغة وصيغة النتائج

اختر جميع اللغات المستخدمة في مستندك. كما يمكنك اختيار أي تنسيق إخراج مرغوب ، على سبيل المثال: .doc (أكثر من 10 تنسيقات نصية مدعومة)

الخطوة 3

تحويل وتنزيل

انقر على زر 'التعرف على النص' ثم قم بتنزيل ملفك النصي المعترف به

أنواع مختلفة من ملفات PDF

قبل البدء في جعل نص PDF الخاص بك قابلًا للبحث باستخدام تقنية OCR، من المهم معرفة أنواع مختلفة من ملفات PDF. يتم شرح الأنواع الثلاثة الشائعة أدناه.

نصي PDF فقط - المعروف أيضًا باسم PDF الحقيقي أو النصي. يتم إنشاء هذا الملف عند حفظ المستند كملف PDF باستخدام معالج نصوص أو أي تطبيق / وظيفة حفظ إلى PDF.
صورة PDF فقط - كما يوحي الاسم، يتم إنشاء الملفات القائمة على الصورة عندما يتم مسحها أو التقاطها على شكل صورة. تشمل الأمثلة الملفات التي تم التقاطها بواسطة ماسح ضوئي، كاميرا، وظيفة لقطة الشاشة، وما إلى ذلك.
OCR PDF - يشير إلى الملفات التي تم إنشاؤها بحيث يمكن البحث فيها باستخدام تقنية التعرف الضوئي على الحروف (OCR). تقوم هذه العملية بقراءة هيكل المستند وإضافة طبقة نص قابلة للبحث.

كيفية جعل ملف PDF قابل للبحث باستخدام تقنية التعرف الضوئي على الحروف (OCR)

هناك العديد من الطرق لجعل ملف PDF قابلًا للبحث. إذا كنت تعمل مع معالجات النصوص ، يمكنك نشر المستند مباشرة كملف PDF. ومع ذلك ، إذا كان لديك بالفعل ملف يحتاج إلى جعله قابلًا للبحث ، فإن استخدام أداة OCR مثل 2PDF هو الخيار الأفضل. اتبع هذه الخطوات لجعل ملف PDF الخاص بك قابلًا للبحث بنجاح باستخدام OCR على 2PDF:

فتح PDF OCR - يعمل OCR على الملفات المستندة إلى الصور ، لذا ستحتاج إلى مسح المستند أو التأكد من حفظه كملف PDF يعتمد على الصورة. ثم ، انقر فوق جميع الأدوات في التنقل الرئيسي وحدد OCR PDF. سيفتح البرنامج في نافذة جديدة.
تحميل PDF - هناك طريقتان لتحميل ملفك على 2PDF. يمكنك إما سحب وإسقاط الملف مباشرة على واجهة OCR أو تحديد الملف من جهاز الكمبيوتر الخاص بك. سيستغرق عملية التحميل بضع ثوانٍ ، اعتمادًا على حجم ملف PDF.
OCR PDF - لتنفيذ OCR على ملف PDF الخاص بك ، ضع اللغة والتنسيق المطلوب للإخراج النهائي ، وانقر على الزر الأحمر "تعرف" . سيجعل البرنامج المستند قابلًا للبحث ، بعد ذلك يمكنك تنزيل ملف PDF المعالج بـ OCR.

فوائد استخدام 2PDF لتقنية التعرف الضوئي على الحروف (OCR)

2PDF هي أداة مفيدة تتيح لك تحويل الصور والوثائق الممسوحة ضوئيًا إلى ملفات PDF قابلة للبحث والتحرير و Word و Excel وغيرها من صيغ النصوص. إليك خمسة مزايا لاستخدام 2PDF لـ OCR:

مجاني - 2PDF هي أداة مجانية ، مما يتيح لك تحويل ملفات PDF الخاصة بك إلى ملفات قابلة للبحث دون أي تكلفة.
فوري - يوفر الأداة تحويلات فورية متاحة في أي وقت وأينما تحتاج إليها.
سريع - تحول 2PDF بسرعة ملفات PDF إلى ملفات محسنة بتقنية OCR قابلة للبحث في ثوانٍ فقط.
سهل - الإجراء بسيط: قم بالتحميل واختيار اللغة والتحويل والتنزيل.
مريح - لديك خيار تحميل الملفات من جهاز الكمبيوتر أو الهاتف أو Dropbox أو Google Drive أو ببساطة سحبها وإسقاطها.

ما هو التعرف الضوئي على الحروف (OCR)؟

تعني OCR بالأحرف الأولى Optical Character Recognition، وهي عملية إلكترونية تتعرف على الأحرف البصرية وتحولها إلى نص مشفر آليًا. وتتضمن الأحرف البصرية ملفات ممسوحة ضوئيًا للمستندات المطبوعة أو المكتوبة يدويًا أو الصور أو لقطات الشاشة التي تم التقاطها باستخدام الهاتف أو الكمبيوتر.

كيف يعمل؟

عند البحث عن طريقة كيفية تقسيم صفحات PDF، قد تحتاج على الأرجح إلى تعلم كيفية دمج واستخراج وتدوير وضغط وتحويل ملفات PDF إلى نص. يُعَدُّ 2PDF مجموعة شاملة من الأدوات المصممة لتبسيط معالجة ملفات PDF. هناك أداتان قد تحتاجهما في وقت ما:

دمج PDF - يسمح لك تقسيم الملفات بالحصول على أجزاء محددة من المستند أو تقسيمه إلى أجزاء أصغر. على النقيض من ذلك، يقوم الدمج بدمج ملفين أو أكثر لإنشاء مستند PDF أكبر واحد.
ضغط PDF - إذا كان هدفك في تقسيم الملفات هو تقليل حجمها أو توفير المساحة، فإن الضغط هو بديل متفوق. يحتفظ الضغط بجميع المعلومات في الملف مع تقليل حجمه.

تحويل المستندات الممسوحة ضوئيًا إلى صيغ رقمية

إتقان مهارة تحويل ملفات PDF إلى نص مكتوب باستخدام OCR ضروري عندما تهدف لتحويل المستندات الممسوحة ضوئيًا إلى صيغ رقمية. عند العمل مع الملفات الفعلية، يسهم استخدام الماسحات الضوئية العالية الجودة في إنتاجية عملية OCR بشكل كبير. تأتي الماسحات الضوئية بإمكانيات مختلفة، كما يأتي الأدوات المساعدة للOCR بإمكانيات مختلفة. تأكد من استخدام أداة موثوقة مجهزة بتقنية حديثة، وقادرة على التعرف على مجموعة واسعة من المستندات الممسوحة ضوئيًا والصور.

كيفية جعل نص ملف PDF قابل للبحث

استخدام OCR لل PDF يتيح لك تحويل الملف الممسوح ضوئيًا إلى قابل للبحث والتعديل. ومع ذلك ، هناك أوقات عندما تريد إنشاء ملف PDF غير قابل للبحث. العملية تحول ببساطة عناصر النص إلى صورة فقط لا يتعرف عليها أدوات ووظائف البحث القياسية. فيما يلي أفضل طريقتين لجعل نص PDF غير قابل للبحث.

PDF صورة فقط - لا تحتاج إلى OCR لل PDF لاستخدام هذه الطريقة. ما عليك سوى حفظ المستند كملف PDF صورة فقط في المعالج الذي تستخدمه.
استخدم 2DPF - يتيح لك 2PDF تشغيل OCR عندما تحتاج إلى جعل النص قابلًا للبحث. يحول الموقع أيضًا المستندات القابلة للبحث إلى ملفات PDF مستندات صورية غير قابلة للبحث. ما عليك سوى تحديد التحويل الذي تريده في القائمة العلوية ، تحميل الملف ، التحويل والتنزيل. يوفر الموقع أدوات لتحويل ودمج وتقسيم وحماية بكلمة مرور وفتح PDF ، وغيرها.

التعرف الضوئي على الحروف

التعرف الضوئي على الحروف (OCR) هو عملية تحويل صور النص المكتوب بالآلة أو بخط اليد أو المطبوع إلى نص يمكن قراءته من الحاسوب. يمكن لتقنية OCR تحويل المستندات الممسوحة ضوئيًا، وصور المستندات، وصور المناظر، أو الترجمات المرسومة على الصورة إلى نص مشفر آليًا. يستخدم التعرف الضوئي على الحروف بشكل شائع لتحويل النص المطبوع من الوثائق الورقية مثل جوازات السفر والفواتير وكشوفات الحسابات وبطاقات العمل والبريد إلى نص رقمي. يمكن تحرير النص الرقمي بشكل إلكتروني والبحث فيه وتخزينه بكفاءة أكبر واستخدامه في عمليات الحوسبة المعرفية والترجمة الآلية وتنقيب النص. التعرف الضوئي على الحروف هو مجال بحث في مجال التعرف على الأنماط والذكاء الاصطناعي ورؤية الحاسوب. في حين كانت الإصدارات الأولى من OCR تحتاج إلى تدريب مع كل حرف وتعمل على خط واحد في كل مرة، فإن الأنظمة المتقدمة الآن قادرة على إنتاج التعرف الدقيق لمعظم الخطوط وتدعم مجموعة متنوعة من صيغ ملفات الصور الرقمية. بعض أنظمة OCR يمكنها حتى إعادة إنتاج الناتج المنسق الذي يشبه الصفحة الأصلية بما في ذلك الصور والأعمدة والمكونات غير النصية الأخرى.