Ładowanie...

22 września 2016 1,386 wyświetleń

Konwersja zeskanowanego dokumentu na tekst

Odzyskiwanie tekstu ze zeskanowanych dokumentów i obrazów

Jeśli potrzebujesz odzyskać teksty ze skanowanych lub fotografowanych dokumentów, będziesz potrzebować jakiegoś rodzaju rozwiązania OCR (Optical Character Recognition). Istnieje wiele aplikacji mobilnych i oprogramowania na komputery stacjonarne przeznaczonych do tego celu, a także możesz znaleźć niektóre usługi internetowe, które umożliwiają wygodne odzyskiwanie tekstu ze skanowanych plików PDF lub zdjęć bezpośrednio przez przeglądarkę internetową.

Powiązane rozszerzenia:

OCR

OCR iconWraz z powszechnym używaniem aparatów cyfrowych w smartfonach, wielu użytkowników korzysta z urządzenia, aby szybko zrobić zdjęcie dokumentu lub notatek. Czasami to wystarcza, ale co jeśli trzeba ponownie odzyskać tekst?

W takim przypadku trzeba poszukać rozwiązania do konwersji obrazu (zeskanowanego dokumentu) na tekst (dokument), które zazwyczaj oznacza się jako OCR - Optical Character Recognition.

Oprogramowanie OCR działa poprzez analizę zeskanowanego dokumentu (obrazu) i porównanie go z danymi czcionek przechowywanymi w wewnętrznej bazie danych. Niektóre rozwiązania OCR korzystają także ze słownika ortograficznego, aby „poprawić” słowa, które nie zostały całkowicie rozpoznane. 100% dokładność jest najprawdopodobniej niemożliwa, jednak ogólnym celem jest jak najbliższe przybliżenie.

Można znaleźć profesjonalne rozwiązania OCR, ale zazwyczaj są one dość drogie i dla osoby, która potrzebuje odzyskać pojedynczy dokument, dość niepotrzebne. Na szczęście istnieje kilka darmowych alternatyw i w tym artykule omówimy niektóre z nich.

Spis treści:

Odzyskaj tekst bezpośrednio na swoim urządzeniu mobilnym

Najwygodniejszym sposobem na odzyskanie tekstu jest oczywiście użycie aplikacji bezpośrednio na smartfonie. Istnieje wiele aplikacji OCR dla wszystkich platform mobilnych (Android, iOS, Windows Phone), niestety jakość tych aplikacji bywa różna, a naprawdę dobre są zazwyczaj komercyjne i dość drogie dla przeciętnego użytkownika.

Wystarczy, że przeszukasz swój sklep z aplikacjami na urządzeniu i poszukasz aplikacji „OCR”. Podawanie wskazówek dotyczących „najlepszych” aplikacji jest dość bezcelowe, gdyż nowe pojawiają się często, a to, co jest dobre dziś, może jutro zostać prześcignięte.

Na przykład na iOS do najpopularniejszych aplikacji należą Scanner Pro lub CamScanner Free, a podobne aplikacje znajdziesz na Google Market dla Androida lub Windows Store dla telefonów z Windows 10.

Konwertuj zeskanowany tekst na komputerze stacjonarnym

Na komputerach stacjonarnych wybór programów OCR lub usług jest duży. Wielu producentów drukarek/skanerów (HP, Canon itd.) oferuje podstawowe oprogramowanie OCR do swoich urządzeń, więc jeśli posiadasz takie urządzenie, sprawdź płyty CD/DVD dołączone do zestawu, ponieważ jedna z nich prawdopodobnie zawiera takie oprogramowanie.

Ponadto można znaleźć kilka dedykowanych rozwiązań OCR, od darmowych po najdroższe, takie jak OmniPage, ABBYY FineReader, Adobe Acrobat itd. Oczywiście profesjonalne (i drogie) programy oferują znacznie lepsze efekty.

Konwersja zeskanowanych dokumentów na tekst online

Choć można poszukać dedykowanego oprogramowania, sprawdzenie usług online, które mogą wykonać konwersję OCR bezpośrednio z przeglądarki internetowej, może być wygodniejszym rozwiązaniem do odzyskiwania tekstów z obrazów lub zeskanowanych dokumentów.

Jedną z najbardziej znanych stron z OCR online jest onlineocr.net (lista aplikacji na końcu artykułu), która powinna w zupełności wystarczyć do prostego odzyskiwania tekstu ze skanów zapisanych w formacie PDF lub dowolnym formacie graficznym (.jpg, .png, .tif, .gif itd.).

Ciekawą opcją jest też funkcja OCR w OneNote z Microsoft Office. Jest ona przeznaczona głównie do odzyskiwania ręcznie pisanych notatek, ale powinna sprawdzić się także w przypadku małych dokumentów.

onlineocr.net

Strona oferuje darmową usługę OCR (optycznego rozpoznawania znaków) i pozwala użytkownikom konwertować swoje dokumenty PDF oraz pliki graficzne na pliki tekstowe, zapisane jako .txt lub dokumenty MS Word (.docx) albo arkusze kalkulacyjne MS Excel (.xlsx) bezpośrednio przez przeglądarkę internetową poprzez przesyłanie plików online.

Usługa działa całkiem dobrze i ma też inne ciekawe funkcje, na przykład możliwość tłumaczenia odzyskanego tekstu na dowolny z dostępnych 46 języków. Można więc odzyskać tekst z dokumentu w języku niemieckim i skorzystać z usługi do przetłumaczenia go na angielski.

Usługa jest ograniczona do plików o maksymalnym rozmiarze 5 megabajtów i oczywiście nie należy przesyłać dokumentów poufnych, ponieważ przesyłasz je na serwer osoby trzeciej, więc odrobina ostrożności nie zaszkodzi.

Przetestowaliśmy ją i wygląda na to, że usługa działa z wysoką dokładnością i nie sprawia problemów z znakami spoza alfabetu angielskiego.

Online OCR Conversion

Zrzut ekranu darmowej usługi OCR online

Oczywiście istnieje wiele innych stron internetowych oferujących podobne usługi OCR. Jeśli jedna z nich nie działa dobrze dla twoich zeskanowanych plików, wypróbuj inne i sprawdź, która daje najlepsze wyniki.

Powiązane artykuły

28 czerwca 2017

Jak uzyskać tekst z obrazu

Wielu użytkowników komputerów pracujących z dokumentami prędzej czy później napotyka sytuację, gdy p...

Czytaj więcej
10 grudnia 2013

Batchowe zmienianie nazw wielu plików na Macu

Gdy gromadzisz dużą liczbę zdjęć cyfrowych, na przykład z ostatnich wakacji, i być może będziesz mus...

Czytaj więcej
11 lutego 2013

Konwertuj e-booki za darmo

Na rynku dostępnych jest setki różnych czytników ebooków oraz dziesiątki formatów plików ebooków. Cz...

Czytaj więcej
11 maja 2012

Jak szybko zmienić nazwę dużej liczby plików

Każdy, kto kiedykolwiek musiał zmieniać nazwy dużej liczby plików, wie, jak okropne jest robienie te...

Czytaj więcej