OCR PDF

Converta documentos e imagens digitalizados em formatos editáveis de Word, PDF, Excel e texto

Como reconhecer texto?

passo 1
passo 1
Carregar arquivo
Selecione o arquivo que você deseja converter do seu computador, Google Drive, Dropbox ou arraste e solte na página
passo 2
passo 2
Selecione o idioma e o formato de saída
Selecione todos os idiomas usados no seu documento. Escolha também qualquer formato de saída desejado, por exemplo, .doc (mais de 10 formatos de texto suportados)
passo 3
passo 3
Converter e Baixar
Clique no botão "Reconhecer" e faça o download do seu arquivo com o texto reconhecido

Reconhecimento óptico de caracteres

O reconhecimento óptico de caracteres ou o leitor óptico de caracteres (OCR) é a conversão eletrônica ou mecânica de imagens de texto digitado, manuscrito ou impresso em texto codificado por máquina, seja de um documento digitalizado, de uma foto de um documento ou de uma foto de cena (ex.: o texto em letreiros e painéis numa foto de paisagem) ou do texto da legenda sobreposta a uma imagem (ex.: de uma transmissão de televisão). Amplamente utilizado como forma de entrada de dados a partir de registros de dados impressos em papel - sejam documentos de passaporte, faturas, extratos bancários, recibos computadorizados, cartões de visita, correio, impressões de dados estáticos ou qualquer documentação adequada - é um método comum de digitalização de textos impressos para que possam ser editados eletronicamente, pesquisados, armazenados de forma mais compacta, visualizados on-line e usados em processos de máquina tais como computação cognitiva, tradução automática, conversão de texto em fala (extraída), dados importantes e mineração de texto. OCR é um campo de pesquisa em reconhecimento de padrões, inteligência artificial e visão computacional. As versões anteriores precisavam ser treinadas com imagens de cada personagem e trabalhadas em uma fonte de cada vez. Os sistemas avançados capazes de produzir um alto nível de precisão de reconhecimento para a maioria das fontes agora são comuns e com suporte a uma variedade de entradas no formato de arquivo de imagem digital. Alguns sistemas são capazes de reproduzir saída formatada que se aproxima da página original, incluindo imagens, colunas e outros componentes não textuais.