Czy robot może czytać dokumenty papierowe?

Odpowiedź

Tak, choć wymaga to dodatkowego kroku w postaci wstępnej cyfryzacji dokumentów z wykorzystaniem silnika OCR (Optical Character Recognition). Dzięki temu robot może czytać skany dokumentów papierowych a następnie „przeczytane” w ten sposób dane wykorzystywać w procesach biznesowym. Doskonałym przykładem jest obsługa z wykorzystaniem robotów faktur spływających do firmy od kontrahentów.

Proces „rozumienia” skanowanego dokumentu składa się z kilku kroków:

  • cyfryzacji za pomocą silnika OCR
  • klasyfikacji, czyli określenia z jakim rodzajem dokumentu mamy do czynienia
  • ekstrakcji danych, czyli wyodrębnieniu istotnych danych z przetwarzanego dokumentu
  • walidacji danych, czyli sprawdzenia czy dane są poprawne

Dostępnych jest wiele silników OCR, które mogą być wykorzystywane do cyfryzacji dokumentów na potrzeby RPA, np.:

  • Google Tesseract
  • Microsoft MODI
  • Kofax OmniPage
  • Abbyy Fine Reader
  • Abbyy Flexi Capture
  • Ephesoft Transact
  • Google Vision
  • Microsoft Vision
  • Amazon Rekognition
  • AWS Textract

Klasyfikacja dokumentu i ekstrakcja danych mogą być realizowane na wiele sposobów: od najprostszych – jak wyszukiwanie tekstu za pomocą wyrażeń regularnych czy z wykorzystaniem wcześniej przygotowanego szablonu, aż po najbardziej efektywne – jak modele uczenia maszynowego. Warto zaznaczyć, że w trakcie przetwarzania dokumentów można wykorzystywać kilka sposobów jednocześnie. To najlepsza metoda na uzyskanie doskonałych wyników.

Ostatni krok, czyli walidacja danych może być wykonywana automatycznie poprzez porównanie danych odczytanych z dokumentu z danymi w systemach firmowych. Dodatkowo w walidację może być zaangażowany człowiek. Przykładowo, jeśli robot ocenia poprawność odczytanych danych poniżej ustawionego progu (np. 90%), to zadanie danych jest przekazywane do obsługi ręcznej. Odpowiedzialny za to pracownik otrzymuje na jednym ekranie zarówno dane odczytane z dokumentu, jak i sam skan dokumentu – to znacznie ułatwia i przyspiesza sprawdzenie poprawności automatycznego odczytu.

Przykładowa prezentacja wyników do sprawdzenia przez człowieka:

Polecane artykuły

Pomimo początkowych trudności, RPA napędza cyfrową transformację dystrybutora IT

Pomimo początkowych trudności, RPA napędza cyfrową transformację dystrybutora...

Tarsus Distribution to najdłużej działający dystrybutor IT w Afryce Południowej.

Jak roboty pomagają usprawnić ochronę zdrowia

Jak roboty pomagają usprawnić ochronę zdrowia

W miarę jak rośnie liczba pacjentów, wyzwania, z jakimi muszą mierzyć...

Fabryka robotów sposobem na transformację biznesu Orange Spain

Fabryka robotów sposobem na transformację biznesu Orange Spain

W założeniach zapoczątkowanej w 2016 r. głębokiej transformacji biznesowej Orange Spain...