iDoc LLM

iDoc, rozwiązanie, które przekształca fizyczne dokumenty w cenne, cyfrowe bazy dokumentacji za pomocą zaawansowanych modeli AI/ML, otwiera nowy rozdział.

Dzięki integracji z dużymi modelami językowymi (LLM), iDoc niesie nowe możliwości wyszukiwania informacji i redefiniuje sposób, w jaki użytkownicy wchodzą w interakcje z cyfrową bazą dokumentów.

iDoc wykorzystuje modele AI/ML do kategoryzacji dokumentów i ekstrakcji danych z tych dokumentów. Chodzi tu m.in. o różnego rodzaju umowy, dokumenty prawne, decyzje czy dokumentację techniczną.

Do tej pory system umożliwiał wyszukiwanie danych po zdefiniowanych atrybutach (np. typie dokumentu i wybranych informacjach) oraz wyszukiwanie pełnotekstowe (użytkownik wpisywał dowolny tekst w oknie wyszukiwania, a w odpowiedzi iDoc wynajdywał wszystkie dokumenty w bazie zawierające taką treść).

Dzięki warstwie LLM iDoc idzie teraz o krok dalej. Obok wyszukiwania po atrybutach i pełnotekstowego, systemowi można teraz zadać złożone pytanie.

ai-zapytania-jezyk-naturalny

Model AI/LLM działa jako warstwa semantyczna nad dokumentami. Jest to głębszy poziom analizy – system nie tylko odczytuje metadane, ale przetwarza pełne zdania, kontekst oraz zależności logiczne między akapitami i pojęciami.

Z perspektywy użytkownika oznacza to, że aplikacja iDoc zyskała rolę inteligentnego asystenta ds. dokumentacji, który rozumie treść aktów, decyzji, umów i protokołów i potrafi ją interpretować. Dostarcza wiedzę wynikającą zarówno z treści jak i kontekstu dokumentów.

LLM w iDocu – przykłady zastosowania

Jaki jest praktyczny wymiar współpracy iDoca z dużymi modelami językowymi? Najlepiej zobaczyć na przykładzie. Załóżmy, że przedsiębiorstwo energetyczne dysponuje cyfrowym archiwum dokumentów iDoc – z aktami notarialnymi, decyzji administracyjnymi i dokumentacją techniczną.

Dzięki współpracy iDoca i LLM, zamiast wyszukiwać odpowiednie informacje po konkretnych wartościach atrybutów jak typ kabla YAKY 4×35 można wydać polecenie bardziej zbliżone do języka naturalnego i prowadzić konwersację doprecyzowując odpowiedzi, np.:

Znajdź inwestycje, które wykonał Bud-Net oraz podaj, czy Inspektorem danej inwestycji jest Marcin Wesołowski.

W odpowiedzi, iDoc podaje listą teczek inwestycyjnych, ogólny opis danej inwestycji, listę urządzeń, datę ich załączenia oraz podaje dokumenty takie jak np. protokół odbioru, gdzie inspektorem jest dana osoba.

To bardzo prosty przykład i w tym przypadku można stwierdzić, że wyszukiwanie pełnotekstowe poradziłoby sobie równie dobrze.

Jednak wykorzystanie LLM zaczyna mieć przewagę wtedy, gdy chcemy nie tylko wyszukać konkretną wartość, ale znaleźć informacje, które niekoniecznie są napisane wprost w dokumentach, ale które można wydedukować z ich treści, na przykład:

Podaj listę dokumentów, w których występuje przyłącze kablowe typu YAKXS. Jaki przekrój ma to przyłącze? Czy zawsze jest [w naszej dokumentacji] takie samo?

W odpowiedzi, iDoc znajduje dokumenty, w których występuje przyłącze kablowe, którego szukamy oraz odpowiada na pytanie. W tym przypadku podaje, ile wynosi przekrój przyłącza oraz informuje, że występują też inne (podane) wartości, a więc przekrój nie zawsze jest taki sam.

iDokowi można zadać pytania o konkretne wartości, jak w poprzednim przykładzie, ale też o informacje, które nawiązują do nich semantycznie, np.:

Które dokumenty dotyczą zgody na czasowe wykorzystanie części drogi gminnej? Wskaż fragmenty, które o tym świadczą.

Mimo, że dokumenty niekoniecznie zawierają w treści pojęcie „czasowe wykorzystanie”, a wyrażenia synonimiczne, iDoc, rozumie, że wskazują one na zgodą na wykorzystanie części drogi gminnej z treści zapytania.

W odpowiedzi podaje takie dokumenty jak:

  • „Decyzja na zajęcie pasa drogowego w celu umieszczenia infrastruktury technicznej”
  • oraz „Dokument z warunkami zezwolenia”, wraz z cytowaniem fragmentów tekstów świadczącym o poprawnym doborze tego dokumentu oraz listę tych dokumentów z ich pełnymi metadanymi i linkami do ich podglądu.

Także ponownie dostaliśmy w czasie kilku sekund pełną, precyzyjną informację na zadany temat z ogromnego magazynu naszych scyfryzowanych dokumentów.

Jakie korzyści daje wyszukiwanie informacji w iDocu z pomocą LLM?

Bardziej trafne i pełniejsze wyniki
Wyszukiwanie nie wykorzystuje tylko konkretnych fraz i atrybutów, ale dodatkowo zrozumienie i interpretację tekstu.

Szybsze odpowiedzi na konkretne pytania użytkowników
Zamiast wyszukiwania po hasłach czy atrybutach, aby następnie przeanalizować samodzielnie wyszukane dokumenty, użytkownik dostaje konkretną odpowiedź na swoje pytanie w kilka sekund.

Zwiększenie użyteczności dokumentów historycznych i długich
Wielostronicowe decyzje, protokoły czy umowy stają się źródłem wiedzy. System wyręcza użytkownika z konieczności czytania całego dokumentu (choć pozostawia taką możliwość dzięki odniesieniom/linkom do wyszukanych plików i stron) i pomaga znaleźć odpowiedź bazując na wszystkich dokumentach w bazie danych.