Вьетнамский OCR

Конвертировать отсканированные документы и изображения в редактируемые форматы Word, Pdf, Excel и текстовые файлы

Как распознать текст?

шаг 1
шаг 1
Загрузить файл
Выберите файл, который вы хотите конвертировать с вашего компьютера, Google Drive, Dropbox или перетащите его на страницу
шаг 2
шаг 2
Выбрать язык и выходной формат
Выберите все языки, используемые в вашем документе. Также выберите любой желаемый формат вывода, например, .doc (поддерживается более 10 текстовых форматов)
шаг 3
шаг 3
Преобразование и скачивание
Нажмите кнопку 'Распознать' и затем скачайте файл с распознанным текстом

Распознавание текста

Оптическое распознавание символов или оптическое считывание символов (OCR) - это электронное или механическое преобразование изображений набранного, рукописного или печатного текста в машинно-кодированный текст, будь то отсканированный документ, фотография документа, фотография сцены (например, текст на вывесках и рекламных щитах в альбомной фотографии) или текст субтитров, наложенный на изображение (например, из телевизионной трансляции). Широко используемый в качестве формы ввода данных из печатных бумажных записей данных - будь то паспортные документы, счета-фактуры, банковские выписки, компьютеризированные квитанции, визитные карточки, почта, распечатки статических данных или любая подходящая документация - это распространенный метод оцифровки печатных текстов, чтобы их можно было редактировать в электронном виде, искать, хранить более компактно, отображать в режиме онлайн и использовать в машинных процессах, таких как когнитивные вычисления, машинный перевод, преобразование текста в речь, ключевые данные и интеллектуальный анализ текста. OCR - это область исследований в области распознавания образов, искусственного интеллекта и компьютерного зрения. Ранние версии должны были быть обучены изображениям каждого символа и работать над одним шрифтом за один раз. В настоящее время широко распространены передовые системы, способные обеспечить высокую степень точности распознавания большинства шрифтов, а также с поддержкой различных входных форматов файлов цифровых изображений. Некоторые системы способны воспроизводить форматированный вывод, который близко приближается к исходной странице, включая изображения, столбцы и другие нетекстовые компоненты.