Powiązane rozszerzenia:
Jak szybko uzyskać tekst z obrazka lub zdjęcia
Wielu użytkowników komputerów, którzy pracują z dokumentami, prędzej czy później napotyka sytuację, gdy muszą uzyskać (odzyskać) tekst z obrazka, aby móc go użyć lub dalej edytować w edytorze tekstu lub procesorze tekstu. Zazwyczaj dotyczy to faksów, skanów dokumentów lub po prostu stron, które zostały przechwycone za pomocą dedykowanego narzędzia lub po prostu za pomocą metody PrtScrn.
Jeśli nie chcesz przepisywać całego tekstu ręcznie, pokażemy Ci kilka najprostszych sposobów, jak możesz uzyskać tekst z obrazu.
Narzędzia OCR
Aby to zadziałało, będziesz musiał użyć jednego z wielu narzędzi OCR, które można znaleźć w Internecie. OCR, czyli optyczne rozpoznawanie znaków, to metoda służąca do rozpoznawania tekstu i innych znaków na edytowalne i przeszukiwalne dane. Istnieje wiele programów OCR, od prostych, darmowych narzędzi po kompleksowe rozwiązania kosztujące setki dolarów.
Do naszego artykułu użyjemy narzędzi dostępnych za darmo, co oznacza, że mogą nie być najlepsze, ale powinny wystarczyć do większości zadań związanych z odzyskiwaniem tekstu.
FreeOCR
Jeśli szukasz narzędzia, którego możesz używać offline, gdy tylko zechcesz, FreeOCR może być dobrym wyborem. To małe narzędzie dostępne w 12 językach (angielski, duński, niemiecki, fiński, francuski, włoski, niderlandzki, norweski, polski, hiszpański i szwedzki) i działa na komputerach z systemem Windows XP i nowszymi.
FreeOCR było ostatnio aktualizowane w 2015 roku i może nie jest najładniejsze, ale bazuje na silniku Tesseract, który został pierwotnie stworzony przez HP, a obecnie jest utrzymywany przez Google. Niemniej jednak działa bez problemów nawet na najnowszym Windows 10.

Główne okno FreeOCR
Odzyskiwanie tekstu to dość prosty proces. Wczytaj obrazek za pomocą funkcji Open (BMP, JPEG, TIFF, GIF, PNG) lub Open PDF, a następnie użyj funkcji OCR, aby rozpoznać tekst z bieżącej strony lub ze wszystkich stron.
Gdy tekst zostanie wyodrębniony, możesz go ręcznie skopiować i wkleić do dowolnego edytora tekstu lub programu do dokumentów, w którym możesz zapisać tekst w dowolnym wybranym formacie.
Internetowe rozwiązania OCR
Zamiast instalować program OCR, możesz chcieć szybko odzyskać tekst za pomocą jednej z usług OCR dostępnych na stronach internetowych. Istnieje kilka odpowiednich serwisów, ale opisujemy tylko te najpopularniejsze. Działają one w zasadzie tak samo, więc to kwestia preferencji osobistych. Przykładem jest Free Online OCR.

Serwis Free Online OCR
Internetowe rozwiązania OCR działają tak samo: wczytujesz obrazek lub dokument PDF, wybierasz język tekstu, wybierasz format wyjściowy i to wszystko. Strona wygeneruje nowy plik, który możesz zapisać na komputerze.
Odzyskiwanie nie jest idealne?
Podobnie jak w przypadku innych procesów zautomatyzowanych, w pliku wynikowym mogą pojawić się błędy lub brakujące znaki. Dlatego najlepiej jest ręcznie sprawdzić plik i poprawić brakujące litery lub błędnie rozpoznany tekst. Generalnie im wyższa jakość pliku źródłowego, tym większe szanse na dokładne odzyskanie tekstu.