Converter PDF em TEXT editável
Converter Documentos e Imagens Digitalizados em formatos de saída editáveis em Word, Pdf, Excel e texto
Largue aqui o seu ficheiro
Escolher ficheiro
Como reconhecer o texto?
passo 1
Carregar ficheiro
Selecione o arquivo que deseja converter do seu computador, Google Drive, Dropbox ou arraste e solte-o na página
passo 2
Seleccionar idioma e formato de saída
Selecione todos os idiomas usados no seu documento. Escolha também o formato de saída desejado, por exemplo, .doc (suportados mais de 10 formatos de texto)
passo 3
Converter & Descarregar
Clique no botão 'Reconhecer' para iniciar o processo de OCR e aguarde a conversão ser concluída. Assim que estiver concluída, você pode baixar o arquivo com o texto reconhecido no formato de saída que você selecionou.
Reconhecimento óptico de caracteres
O reconhecimento óptico de caracteres (OCR) é um processo que converte imagens de texto digitado, escrito à mão ou impresso em texto legível por máquina. A tecnologia OCR pode converter documentos digitalizados, fotos de documentos, fotos de cena ou legendas sobrepostas em uma imagem em texto codificado por máquina. O OCR é comumente usado para digitalizar textos impressos em registros de papel, como passaportes, faturas, extratos bancários, cartões de visita e correio. O texto digitalizado pode ser editado eletronicamente, pesquisado, armazenado com mais eficiência e usado em processos de máquina, como computação cognitiva, tradução automática e mineração de texto. O OCR é uma área de pesquisa em reconhecimento de padrões, inteligência artificial e visão computacional. Embora as primeiras versões do OCR precisassem ser treinadas com imagens de cada caractere e trabalhassem com uma fonte de cada vez, os sistemas avançados agora são capazes de produzir reconhecimento altamente preciso para a maioria das fontes e suportam uma variedade de formatos de arquivo de imagem digital. Alguns sistemas OCR podem até reproduzir saída formatada que se assemelha de perto à página original, incluindo imagens, colunas e outros componentes não textuais.