Sztuczna inteligencja pomoże w zbieraniu danych

globiq

Spółka ciepłownicza PEC z niewielkiego miasta w Polsce przechowywała dane na temat swojej sieci w dokumentacji papierowej, magazynując je w archiwum. Były one względnie uporządkowane, jednak całość zajmowała wiele metrów bieżących papieru. Przy przechowywaniu dokumentów w taki sposób ciężko o regularne aktualizacje, dane są trudno dostępne, często niekompletne i rozproszone. Problemem jest także fakt, że nowi pracownicy nie zawsze posiadali kompleksowej wiedzy o sieci, a ci doświadczeni odchodzili na emeryturę lub po prostu zmieniali pracę.

Aby usprawnić korzystanie z danych, cała dokumentacja dotycząca sieci została zeskanowana. Proces zaowocował zbiorem dokumentów w wersji cyfrowej, udało się je także wstępnie podzielić na obszary (szafami – analogicznie do tego, jak były składowane). Okazało się jednak, że szukanie konkretnego dokumentu wciąż zajmuje dużo czasu, a dane bywają niekompletne lub nieaktualne. Brakowało też szczegółowych informacji, po których można szybko wyszukać dokument dotyczący konkretnego fragmentu sieci, obszaru lub zakresu dat. Dokumenty nie zostały w całości skategoryzowane, a samo przyspieszenie pracy okazało się niewielkie.

Przedsiębiorstwo chciało wykorzystać dane w różnych aplikacjach biznesowych, jednak ze względu na nieuporządkowane dane koszty takiego projektu przekraczały możliwości firmy. Żeby przekazać dokumenty zewnętrznemu wykonawcy, należało je szczegółowo skategoryzować – dotychczasowe oznaczenia były bowiem niewystarczające, co podnosiło koszt projektu. Dla pracowników kategoryzowanie i opis poszczególnych dokumentów to kilkaset godzin żmudnej, frustrującej pracy, często trudnej do pogodzenia z codziennymi obowiązkami. Zadanie wymaga dużego skupienia i wiedzy na temat dokumentów, aby moc je właściwie i rzetelnie opisać.

globiq00

Brzmi znajomo?

Z podobnym problemem styka się wiele przedsiębiorstw, nie tylko z branży ciepłowniczej. Nasze ostatnie eksperymenty i prace przy projekcie GlobIQ pokazują, że opisane problemy mogą zostać rozwiązane z pomocą sztucznej inteligencji.

Platforma GlobIQ ma służyć zbieraniu danych o obiektach majątku technicznego rozproszonych w przestrzeni, w sposób naturalny – bazujący na komunikacji za pomocą głosu i obrazu. Ma ona także umożliwiać konwersję zebranych informacji do postaci strukturalnej, w której dalej można przetwarzać dane w specjalizowanych aplikacjach biznesowych. Na podstawie platformy planujemy stworzyć 3 rozwiązania dla poszczególnych branż: energetyki, telekomunikacji oraz służb miejskich.

Poprawiając jakość dokumentów, rozpoznając treść (także z pisma odręcznego) oraz analizując ich zawartość, sztuczna inteligencja może dokonać automatycznej kategoryzacji i indeksacji dokumentów. Pozwala to na zrezygnowanie z monotonnej, powtarzalnej pracy związanej z ręcznym analizowaniem i kategoryzowaniem dokumentów oraz skutkuje przyspieszeniem procesów i obniżeniem kosztów.

Jak to wyglądało?

Pracowaliśmy na grupie 6200 dokumentów, które zawierały ponad 24 tysiące stron A4 – były to projekty techniczne i podwykonawcze, szkice itp. Zeskanowane dokumenty musiały zostać odpowiednio przygotowywane – podzielono je na pojedyncze strony, przetworzono i poprawiono ich jakość, testując różne opcje. Użyto kilku rozwiązań, które miały za zadanie rozpoznać strukturę dokumentu i przenalizować treść. Grupa ucząca obejmowała 470 dokumentów.

Co odkryliśmy?

Ponad 90% dokumentów zostało poprawnie rozpoznanych i skategoryzowanych – wynik jest o tyle imponujący, że do ręcznego przeglądania zamiast całości zostaje niewielka część dokumentacji. Obliczając ten wynik, porównaliśmy liczbę dobrych predykcji do liczby wszystkich dokumentów. Większość pracy została wykonana za pracowników, nieporównywalnie mniejszym nakładem czasu i wysiłku.

globiq4

Korzyści

Korzystając z GlobIQ, nasze przedsiębiorstwo może w krótkim czasie uporządkować i zebrać wszystkie informacje, tworząc kompleksową, zaktualizowaną bazę danych na temat infrastruktury sieci. Stworzona dokumentacja będzie odpowiednio opisana, co znacząco skróci proces szukania potrzebnych informacji o sieci. Korzystać z niej będzie mogło wielu użytkowników jednocześnie, a dane można na bieżąco aktualizować. Skategoryzowane dokumenty będą mogły być wykorzystane do aplikacji usprawniających działania w przedsiębiorstwie.

Co niesie przyszłość?

Obecnie pracujemy nad kolejnymi aspektami, które GlobIQ może usprawnić. Problematyczne obszary, na których skupiają się badania, to między innymi:

  • wyczytywanie parametrów technicznych z dokumentacji i jej indeksacja przestrzenna – przedsiębiorstwa potrzebują danych jak najbardziej szczegółowych, ułożone chronologicznie i skategoryzowane według ważności dokumentów
  • wprowadzanie danych z tabel współrzędnych – proces jest bardzo czasochłonny ze względu na zróżnicowaną jakość kopii
  • budowanie przebiegu sieci ze szkicu – pojedynczy rysunek może zawierać bardzo dużo informacji, często nie oddaje również rzeczywistego wyglądu na mapie

O postępach i rozwoju platformy GlobIQ będziemy informować na bieżąco!