Carregando...

22 de setembro de 2016 1,382 Visualizações

Converter documento digitalizado em texto

Recuperando texto de documentos escaneados e imagens

Se você precisa recuperar textos de documentos escaneados ou fotografados, você precisará de algum tipo de solução OCR (Reconhecimento Óptico de Caracteres). Muitos aplicativos móveis e softwares para desktop existem para esse fim, mas você pode até encontrar alguns serviços baseados na web que permitem recuperar convenientemente o texto de PDFs escaneados ou imagens diretamente pelo seu navegador web.

Extensões relacionadas:

OCR

OCR iconCom o uso generalizado de câmeras digitais em smartphones, muitos usuários usam o dispositivo para rapidamente tirar uma foto de um documento ou anotações. Às vezes isso é suficiente, mas e se você precisar recuperar o texto novamente?

Bem, nesse caso você precisa buscar alguma solução de conversão de imagem (documento digitalizado) para texto (documento), que normalmente é rotulada como OCR - Reconhecimento Óptico de Caracteres.

O software OCR funciona analisando o documento digitalizado (imagem) e comparando-o com dados de fontes armazenados em um banco de dados interno. Algumas soluções OCR também usam corretor ortográfico para "corrigir" palavras que não foram totalmente reconhecidas. A precisão de 100% é provavelmente impossível, entretanto, uma aproximação próxima é o objetivo geral.

Você pode encontrar soluções profissionais de OCR, mas geralmente são bastante caras e para quem só precisa recuperar um único documento, são desnecessárias. Felizmente, existem várias alternativas gratuitas e neste artigo cobriremos algumas delas.

Conteúdo:

Recuperar o texto diretamente no seu dispositivo móvel

A forma mais conveniente para recuperar o texto seria, naturalmente, usar um aplicativo diretamente no seu smartphone. Muitos aplicativos OCR existem para todas as plataformas móveis (Android, iOS, Windows Phone), infelizmente a qualidade desses aplicativos varia e os realmente bons são tipicamente comerciais e bastante caros para usuários casuais.

Basta navegar pela sua loja de apps no dispositivo e procurar por aplicativos "OCR". É meio inútil dar dicas sobre os "melhores" apps, considerando que novos são adicionados frequentemente e o que é bom hoje pode ser superado amanhã.

Por exemplo, no iOS, alguns dos aplicativos mais populares incluem Scanner Pro ou CamScanner Free e você pode encontrar apps similares para Android no Google Market ou na Windows Store para telefones com Windows 10.

Converter texto digitalizado no seu computador desktop

Em computadores desktop, as opções de programas ou serviços OCR são abundantes. Muitos fornecedores de impressoras/scanners (HP, Canon etc.) oferecem software OCR básico para seus dispositivos, então se você possui um, verifique os CDs/DVDs que foram entregues junto com ele, pois um deles provavelmente contém software.

Além disso, você pode encontrar várias soluções OCR dedicadas desde gratuitas até as mais caras, como OmniPage, ABBYY FineReader, Adobe Acrobat etc. Claro que os programas profissionais (e caros) terão resultados muito melhores.

Conversão online de documentos digitalizados para texto online

Embora você possa buscar software dedicado, verificar serviços online que podem realizar conversão OCR diretamente através do seu navegador pode ser uma abordagem mais conveniente para recuperar textos de imagens ou documentos digitalizados.

Alguns dos sites de OCR online mais notáveis incluem o onlineocr.net (veja a lista de apps no final do artigo) e ele deve ser mais que suficiente para recuperação simples de texto de digitalizações salvas em PDF ou em qualquer formato gráfico possível (.jpg, .png, .tif, .gif etc.).

Uma opção interessante é a função OCR no OneNote do Microsoft Office. Provavelmente é voltada à recuperação de notas manuscritas, mas deve ser utilizável para pequenos documentos também.

onlineocr.net

O site oferece serviço gratuito de OCR (reconhecimento óptico de caracteres) e permite aos usuários converter seus documentos PDF e arquivos de imagem para formato de texto, salvo como .txt ou documento MS Word (.docx) ou planilha MS Excel (.xlsx) diretamente pelo navegador através de upload online.

Funciona razoavelmente bem e também possui outros recursos interessantes, por exemplo, permite traduzir o texto recuperado para qualquer um dos 46 idiomas disponíveis. Assim, você pode recuperar texto de um documento em alemão e usar o serviço para traduzi-lo para o inglês.

O serviço é limitado a arquivos com tamanho máximo de 5 megabytes e obviamente você não deve enviar documentos sensíveis, pois está os enviando para um servidor de terceiros, então um pouco de cautela nunca é demais.

Testamos e parece que o serviço opera com alta precisão e não tem problema com caracteres fora do alfabeto inglês.

Conversão OCR Online

Captura de tela do serviço gratuito de OCR online

É claro que existem vários outros sites que oferecem serviços OCR similares. Se um deles não funcionar corretamente para seus arquivos digitalizados, experimente outros e veja qual oferece os melhores resultados.

Artigos relacionados

28 de junho de 2017

Como extrair texto de uma imagem

Muitos usuários de computador que lidam com documentos eventualmente encontram a situação em que pre...

Leia mais
10 de dezembro de 2013

Renomear múltiplos arquivos em lote no Mac

Quando você reúne grande número de fotos digitais, por exemplo, das suas últimas férias, e pode prec...

Leia mais
11 de fevereiro de 2013

Converter ebooks gratuitamente

Existem centenas de leitores de ebook diversos e dezenas de formatos de arquivo de ebook no mercado....

Leia mais
11 de maio de 2012

Como renomear rapidamente um grande número de arquivos

Todos que já precisaram renomear uma grande quantidade de arquivos sabem o quão horrível é fazer iss...

Leia mais