OCR PDF

스캔된 문서와 이미지를 수정 가능한 Word, PDF, Excel 및 텍스트 출력 형식으로 변환하세요

텍스트를 인식하는 방법은 무엇인가요?

1단계
1단계
파일 업로드
컴퓨터, Google Drive, Dropbox에서 변환하려는 파일을 선택하거나 페이지에 끌어다 놓으세요
2단계
2단계
언어와 출력 형식을 선택하세요
문서에서 사용된 모든 언어를 선택하고 원하는 출력 형식을 선택하세요. 예를 들어, .doc와 같은 형식을 선택할 수 있습니다. (10개 이상의 텍스트 형식이 지원됩니다.)
3단계
3단계
변환하여 다운로드하세요
'인식' 버튼을 클릭한 후, 인식된 텍스트가 포함된 파일을 다운로드하세요

PDF 파일의 다양한 유형

PDF 텍스트를 OCR을 사용하여 검색 가능하게 만들기 전에, 다양한 유형의 PDF 파일을 알아야 하는 것이 중요합니다. 아래에는 세 가지 인기 있는 유형에 대해 설명되어 있습니다.

  • 텍스트 전용 PDF - 진정한 PDF 또는 텍스트 기반 PDF로도 알려져 있습니다. 이 파일은 워드 프로세서나 PDF로 저장하는 기능 또는 애플리케이션을 사용하여 문서를 PDF로 저장할 때 만들어집니다.
  • 이미지 전용 PDF - 이름 그대로 이미지 기반 파일로, 스캔하거나 이미지로 캡처한 경우에 생성됩니다. 예시로는 스캐너로 촬영한 파일, 사진, 스크린샷 등이 있습니다.
  • OCR PDF - 광학 문자 인식 (OCR)을 사용하여 검색 가능하게 만든 파일을 의미합니다. 이 과정은 문서 구조를 읽고 검색 가능한 텍스트 레이어를 추가합니다.

OCR로 PDF를 검색 가능하게 만드는 방법

PDF를 검색 가능하게 만드는 여러 가지 방법이 있습니다. 워드 프로세서와 함께 작업하고 있다면 문서를 직접 PDF로 게시할 수 있습니다. 그러나 이미 검색 가능하게 만들어야 할 파일이 있는 경우, 2PDF와 같은 OCR 도구를 사용하는 것이 가장 좋습니다. 다음은 2PDF에서 OCR을 사용하여 PDF를 검색 가능하게 만드는 성공적인 단계입니다::

  1. PDF OCR 열기 - OCR은 이미지 기반 파일에서 작동하므로 문서를 스캔하거나 이미지 기반 PDF로 저장해야 합니다. 그런 다음 주 메뉴에서 "모든 도구"를 클릭하고 "PDF OCR"을 선택하십시오. 이렇게 하면 프로그램이 새 창에서 열립니다.
  2. PDF 업로드 - 파일을 2PDF에 업로드하는 방법은 두 가지가 있습니다. 파일을 OCR 인터페이스로 직접 끌어다 놓거나 컴퓨터에서 파일을 선택할 수 있습니다. 업로드 과정은 PDF의 크기에 따라 몇 초가 걸릴 수 있습니다.
  3. PDF에 OCR 적용 - PDF에 OCR을 수행하려면 최종 결과물의 언어와 형식을 설정한 다음 빨간색 '인식' 버튼을 클릭하십시오. 프로그램은 문서를 검색 가능하게 만들고, 그 후에 OCR 처리된 PDF를 다운로드할 수 있습니다.

2PDF를 사용하는 장점에 대해 알려드리겠습니다

2PDF는 이미지와 스캔된 문서를 검색 가능하고 편집 가능한 PDF, Word, Excel 및 기타 텍스트 형식으로 변환할 수 있는 편리한 도구입니다. 2PDF를 사용하여 OCR을 수행하는 다섯 가지 이점은 다음과 같습니다:

  • 무료 – 2PDF는 무료 도구로, PDF 파일을 OCR 처리할 때 어떠한 비용도 들지 않습니다.
  • 즉시 – 이 도구는 필요할 때 언제 어디서나 접근 가능한 즉시 변환을 제공합니다.
  • 빠르게 – 2PDF는 몇 초 안에 PDF를 검색 가능하고 OCR이 향상된 파일로 빠르게 변환합니다.
  • 쉽게 – 과정은 간단합니다: 업로드, 언어 선택, 변환, 다운로드입니다.
  • 편리하게 – 컴퓨터, 휴대폰, Dropbox, Google Drive에서 파일을 업로드하거나 간단히 파일을 끌어서 놓을 수 있는 옵션이 있습니다.

OCR이란 무엇인가요?

OCR의 의미는 약어를 자세히 설명할 때 가장 잘 표현됩니다. OCR은 광학 문자 인식(optical character recognition)의 약자로, 광학 문자를 인식하고 기계가 인식할 수 있는 텍스트로 변환하는 전자적인 프로세스입니다. 광학 문자는 인쇄된 또는 필기된 문서, 사진, 또는 휴대폰이나 컴퓨터로 캡처한 스크린샷 등의 스캔 파일이 될 수 있습니다.

이것은 어떻게 작동합니까?

PDF에서 페이지를 분할하는 방법을 이해하려면 PDF 파일의 병합, 추출, 회전, 압축 및 OCR 방법을 익힐 필요가 있을 것입니다. 2PDF는 PDF 파일 처리를 간소화하기 위해 설계된 포괄적인 도구 모음입니다. 다음은 언젠가 필요할 수 있는 두 가지 도구입니다:

  • PDF 병합 - 파일을 분할하면 문서의 특정 부분을 얻거나 작은 부분으로 분리할 수 있습니다. 반대로, 병합은 두 개 이상의 개별 파일을 하나의 큰 PDF 문서로 결합합니다.
  • PDF 압축 - 파일을 분할하는 목적이 파일의 크기를 줄이거나 공간을 절약하는 것이라면 압축은 우수한 대안입니다. 압축은 파일의 모든 정보를 유지하면서 크기를 최소화합니다.

스캔 문서 디지털화"라고 합니다

스캔된 문서를 디지털화하려는 경우, PDF의 OCR 기술을 습득하는 것은 매우 중요합니다. 물리적인 문서를 다룰 때에는 우수한 스캐너를 사용하여 고품질의 이미지를 캡처하는 것이 OCR 처리의 성공에 큰 영향을 미칩니다. 스캐너는 다양한 기능을 갖추고 있으며, OCR 도구 역시 그와 마찬가지입니다. 선도적인 기술을 갖춘 신뢰할 수 있는 도구를 사용하여 다양한 스캔된 문서와 이미지를 인식할 수 있는지 확인해야 합니다.

PDF 텍스트를 검색 가능하게 만드는 방법

>PDF의 OCR을 사용하면 스캔된 파일을 검색 가능하고 편집 가능하게 만들 수 있습니다. 그러나 검색이 불가능한 PDF 파일을 만들고 싶은 경우도 있습니다. 이 과정은 텍스트 요소를 표준 검색 도구나 기능에서 인식하지 못하는 이미지 전용 형식으로 변환합니다. 아래에는 PDF 텍스트를 검색할 수 없도록 만드는 두 가지 최상의 방법이 나와 있습니다..

  • 이미지 전용 PDF: 이 방법을 사용하려면 PDF의 OCR을 사용할 필요가 없습니다. 사용 중인 프로세서 내에서 문서를 이미지 전용 PDF로 저장하기만 하면 됩니다.
  • 2PDF 사용: 2PDF를 사용하면 텍스트를 검색 가능하게 만들 때 OCR을 실행할 수 있습니다. 이 사이트는 검색 가능한 문서를 검색할 수 없는 이미지 기반 PDF로 변환하는 기능도 제공합니다. 상단 메뉴에서 원하는 변환을 선택하고 파일을 업로드한 다음, 변환하여 다운로드할 수 있습니다. 이 플랫폼은 PDF 변환, 병합, 분할, 비밀번호 설정, PDF 잠금 해제 등의 기능도 제공합니다.

광학 문자 인식

광학 문자 인식 (OCR)은 타자, 필기 또는 인쇄된 텍스트의 이미지를 기계가 읽을 수 있는 텍스트로 변환하는 과정입니다. OCR 기술은 스캔된 문서, 문서의 사진, 장면 사진 또는 이미지 위에 오버레이된 자막을 기계가 인코딩된 텍스트로 변환할 수 있습니다. OCR은 여권, 송장, 은행 명세서, 명함 및 우편 등 종이 기록으로부터 인쇄된 텍스트를 디지털화하는 데 흔히 사용됩니다. 디지털화된 텍스트는 전자적으로 편집, 검색, 효율적으로 저장되며, 인지 컴퓨팅, 기계 번역, 텍스트 마이닝과 같은 기계 처리 작업에서 사용될 수 있습니다. OCR은 패턴 인식, 인공지능, 컴퓨터 비전의 연구 분야입니다. 초기 버전의 OCR은 각 문자의 이미지로 훈련되어야 하며, 한 번에 한 글꼴에서 작동해야 했습니다. 그러나 현대의 고급 시스템은 대부분의 글꼴에 대해 매우 정확한 인식을 제공하며 다양한 디지털 이미지 파일 형식을 지원합니다. 일부 OCR 시스템은 이미지, 열, 기타 비문자적 요소를 포함한 원본 페이지와 유사한 형식의 출력을 재현할 수도 있습니다.