イングリッシュ OCR

スキャンされた文書や画像を編集可能なWord、PDF、Excel、およびテキスト出力形式に変換する

テキストの認識方法?

ステップ1
ステップ1
ファイルのアップロード
ファイルを選択してください。パソコン、Googleドライブ、Dropboxから選択するか、またはページにドラッグアンドドロップしてください
ステップ2
ステップ2
言語と出力形式を選択
文書で使用されているすべての言語を選択してください。また、.docなどの任意の出力形式を選択してください(10以上のテキスト形式がサポートされています)
ステップ3
ステップ3
変換・ダウンロード
「認識する」ボタンをクリックし、認識されたテキストを出力形式を選択してダウンロードしてください

光学式文字認識

光学文字認識(OCR)は、タイプ、手書き、または印刷されたテキストの画像を機械読み取り可能なテキストに変換するプロセスです。OCR技術により、スキャンされた書類、書類の写真、シーン写真、または画像に重ねられた字幕を機械符号化されたテキストに変換できます。OCRは、パスポート、請求書、銀行取引明細書、名刺、および郵便物などの紙の記録から印刷されたテキストをデジタル化するために一般的に使用されます。デジタル化されたテキストは、電子的に編集、検索、より効率的に保存し、認知コンピューティング、機械翻訳、およびテキストマイニングなどの機械プロセスで使用できます。OCRは、パターン認識、人工知能、およびコンピュータビジョンの研究分野です。初期のOCRのバージョンは、各文字の画像でトレーニングする必要があり、1つのフォントに対して動作する必要がありましたが、現在では高度なシステムがほとんどのフォントに対して高度な精度の認識を行い、さまざまなデジタル画像ファイル形式をサポートすることができます。一部のOCRシステムは、画像、カラム、およびその他の非テキスト要素を含む、元のページに非常に近いフォーマットの出力を再現することさえできます。