Systemy skanowania i OCR

Systemy optycznego rozpoznawania znaków OCR (Optical Character Recognition) należą do narzędzi umożliwiających osobom niewidomym i słabowidzącym dostęp do informacji drukowanych. Technologia OCR polega na rozpoznawaniu przez odpowiednie oprogramowanie tekstu dostępnego w formie obrazu.

System skanowania

Systemy te składają się z trzech zasadniczych elementów: skanowania, optycznego rozpoznawania znaków, często określanego jako OCR, oraz odczytywania tekstu za pomocą syntezowanej mowy.

Aby skorzystać z tej technologii, użytkownicy potrzebują trzech komponentów: skanera płaskiego, komputera z kompatybilną kartą dźwiękową i specjalistycznego oprogramowania OCR z wyjściem mowy. Dzięki tej technologii użytkownicy mogą skanować wydrukowany, ale nie pisany ręcznie tekst i albo odczytać go w syntetycznej mowie, albo zapisać na swoim komputerze jako plik, do którego można uzyskać dostęp później. Gdy użytkownicy umieszczają wydrukowany dokument w skanerze i wydają polecenie rozpoczęcia skanowania, skaner robi zdjęcie wydrukowanego tekstu i wysyła je do komputera. Następnie oprogramowanie OCR analizuje obraz, rozpoznaje znaki i konwertuje informacje do pliku elektronicznego. Ten plik jest przekazywany do wbudowanego czytnika ekranu, który używa karty dźwiękowej komputera lub dedykowanego syntezatora mowy do odczytania tekstu.

Dokładność skanowania

Chociaż technologia OCR jest bardzo dokładna podczas skanowania prostego tekstu, dokładność może być znacznie zmniejszona, jeśli jakość skanowanego wydruku nie jest dobra lub jeśli dokument zawiera mieszane kolumny, wykresy, diagramy lub grafiki. Ważne jest zatem, aby użytkownicy zrozumieli, że technologia OCR nie jest cudownym narzędziem, na którym można polegać w 100% pod względem dokładności w każdych okolicznościach.

Oprogramowanie OCR

Dostępnych jest wiele skanerów, ale specjalistyczne oprogramowanie OCR nie działa idealnie ze wszystkimi modelami. Przed zakupem skanera użytkownicy powinni odwiedzić strony internetowe sprzedawców i zapoznać się z zalecanymi modelami skanerów. Istnieje kilka istotnych pytań, które powinno się zadać:

Czy system OCR wymaga instalacji na komputerze, czy jest to jednostka autonomiczna?
Czy rozpoznaje szeroką gamę dokumentów pisanych na maszynie i składanych, w tym książki, czasopisma, katalogi wysyłkowe, gazety i wyciągi bankowe?
Czy do jego obsługi wymagana jest minimalna wiedza komputerowa?
Czy będzie dostępna pomoc online, z której można będzie korzystać podczas użytkowania systemu, i czy producent zapewnia stałe wsparcie techniczne?

Obecna generacja systemów OCR zapewnia dobrą dokładność i możliwości formatowania prostego tekstu, w cenach nawet dziesięciokrotnie niższych niż kilka lat temu. Systemy te stanowią wartościową inwestycję dla użytkowników, którzy potrzebują dostępu do drukowanych dokumentów wszelkiego typu.

Urządzenia lektorskie

Umożliwiają osobom niewidomym i słabowidzącym łatwe i samodzielne czytanie materiałów drukowanych. Składają się ze skanera z oprogramowaniem do optycznego rozpoznawania znaków i syntezatora mowy, połączonych w jedno łatwe w obsłudze urządzenie. Przykład syntezowanej mowy: „Klawisz skanowania, naciśnij ten klawisz, aby rozpocząć skanowanie...przygotowywanie strony”

Urządzenia te są obsługiwane w podobny sposób jak normalny skaner. Użytkownik umieszcza wydrukowany materiał w skanerze, który jest następnie skanowany i odczytywany na głos w czystej, klarownej syntetycznej mowie. Użytkownicy mogą czytać stronę w sposób ciągły, wiersz po wierszu lub słowo po słowie, a także zapisywać dokumenty, a nawet całe książki, w prostym systemie plików urządzenia. Osoby słabowidzące mogą również przeglądać materiały drukowane na ekranie komputera lub telewizora, za pomocą dużej czcionki. Inteligentna technologia potrafi wykryć, kiedy papier jest położony do góry nogami lub bokiem. Kiedy tak się dzieje, maszyna automatycznie dostosowuje obraz. Gdy dokument znajdzie się na powierzchni skanowania, użytkownik po prostu naciska przycisk skanowania, a urządzenie skanuje obraz strony. Obraz ten jest następnie konwertowany na tekst, który jest wypowiadany przez syntezator mowy. Użytkownicy mogą odsłuchać całą stronę lub użyć klawiatury do czytania, aby przeczytać określone sekcje dokumentu. Podczas słuchania dokumentu użytkownicy mogą dostosować tempo i głośność syntezowanego głosu. Urządzenie automatycznie zapisze dokumenty po wyłączeniu.

Dostępnych jest kilka marek urządzeń lektorskich. Są one zazwyczaj większe od typowych skanerów, mierząc około 12" x 15" x 5". Ich cena jest różna, ale większość kosztuje powyżej ośmiu tysięcy złotych.

Czytanie tekstu drukowanego za pomocą smartfona

Obecnie smartfony są na tyle inteligentne, że mogą przejąć wymagające procesora zadanie przekształcania obrazów tekstu w tekst, który można wypowiedzieć. Smartfony zawierają również wbudowany aparat, co oznacza, że mają wszystko, czego potrzebują, aby stać się „urządzeniami do czytania” typu „wszystko w jednym”.

Android oraz iOS mogą identyfikować i rozpoznawać tekst. Aplikacje, zostały zoptymalizowane do wykonywania wyłącznie tych zadań. Te aplikacje mają jednak tendencję do bycia bardziej niż trochę kapryśnymi. Musisz ustawić tekst idealnie prostopadle i trzymać telefon absolutnie nieruchomo i w odpowiedniej odległości od strony. Nie trzeba dodawać, że nie są to umiejętności, w których wybitnych jest wiele osób z dysfunkcją wzroku.

Aplikacje korzystają z najnowszych i najbardziej zaawansowanych możliwości rozpoznawania tekstu a oprogramowanie to znajduje się w aplikacji. Nie trzeba czekać, aż obraz zostanie przesłany na serwer firmy i tam rozpoznany.