Skanowanie tekstu OCR - kiedy się na nie zdecydować?

03.08.2020

Zdarza się, że trafiamy na materiały drukowane, które są nam potrzebne lub zwyczajnie nam się podobają, ale nie możemy ich mieć na własność. Tak bywa z wszystkim, czego już nie ma w sklepach, a jeszcze nie ma wersji cyfrowej. Studenci poznają ten ból zwłaszcza podczas korzystania z bibliotek.

Oczywiście można daną pozycję wypożyczyć, przeczytać i spisać notatki. Albo odwiedzić punkt ksero i zamówić kopię całej książki bądź jej fragmentów, oddać do bindowania i odtąd mieć własny egzemplarz roboczy. Okazuje się jednak, że istnieją już nowocześniejsze rozwiązania.

Skanowanie OCR

Przykładowo, warto papierowe materiały oddać do znanego powszechnie skanowania, które uczyni z nich pliki PDF lub JPG, a następnie zamówić skanowanie OCR (ang. Optical Character Recognition). Efektem będzie plik tekstowy w pełni edytowalny, ponieważ urządzenia wykonujące skan rozpoznają w obrazie tekst i zamieniają go na popularną formę odpowiednią dla programu Word lub Exel. Tym samym uzyskujemy nie tylko wersję elektroniczną danego materiału, lecz także mamy dostęp do edycji i formatowania, możemy dodawać i usuwać fragmenty, zmieniać czcionkę, wstawiać obrazki itd.

Notatki

To nadzwyczajnie praktyczna metoda. Dostęp do niej oznacza, że na przykład każdy tekst posiadany na papierze mamy możliwość zamienić na wersję elektroniczną, dopisać swoje notatki i wysłać innym osobom. Takie rozwiązanie może zainteresować studentów wymieniających się materiałami naukowymi lub osoby wykonujące korektę tekstów.

Dokumenty

Jeśli nie posiadamy wzoru jakiejś umowy lub innego dokumentu, możemy spróbować zeskanować egzemplarz już wypełniony, który jest pod ręką, a następnie w edytorze tekstu wprowadzić potrzebne dane, wydrukować i gotowe. Również dokumenty sprzed lat warto zabezpieczyć, wykonując ich kopię elektroniczną.

Obrazy

Bywa, że posiadamy interesującą treść, której potrzebujemy do swoich celów, jednak mieści się ona na obrazku JPG lub zdjęciu, z którego nie możemy jej wydobyć inaczej, jak tylko przepisując. Skanowanie OCR poradzi sobie nawet ze zdjęciem tekstu i zamieni go na plik, który przerobimy według uznania.

Odzyskiwanie

Może się też zdarzyć, że zechcemy zmienić coś w naszych plikach, ale pierwotny projekt został utracony. Jeśli posiadamy wersję papierową, odzyskamy plik elektroniczny dzięki skanowaniu OCR. Metoda ta sprawdzi się również w archiwach i ucieszy zwłaszcza tych, którzy duże ilości materiałów papierowych chcieliby wreszcie mieć na komputerze.