Start z polskim AI – od pomysłu do wdrożenia #Gaius-Lex
Start z polskim AI to cykl rozmów, którego celem jest przedstawienie doświadczeń związanych z polskimi modelami językowymi AI oraz praktykami firm i instytucji we wdrażaniu tych rozwiązań. Zapraszamy do rozmowy z Witoldem Wydmańskim, dyrektorem ds. technologii (CTO) w firmie Gaius-Lex.
Na początku odnieśmy się do motywacji i celów biznesowych. Co było powodem wdrożenia modelu Bielik w Gaius-Lex? Jaki sposób doszło do nawiązania współpracy i jakie czynniki stały za decyzją o rozpoczęciu wspólnych działań?
Jesteśmy przede wszystkim firmą produktową. Realizujemy również usługi, jednak pozostają one u nas na drugim planie. Wdrożenie modelu Bielik było więc bezpośrednio związane z potrzebą ulepszenia naszego produktu, który oferujemy klientom.
Nasz system w dużej mierze opiera się na modelach językowych. Zanim pojawił się Bielik, korzystaliśmy z dostrojonej przez nas wersji Llamy 3, którą samodzielnie trenowaliśmy pod kątem języka polskiego. Problem polegał jednak na tym, że nie był to model, który natywnie dobrze radził sobie z językiem polskim. Nasze modyfikacje poprawiały jego jakość, ale wciąż były to rozwiązania dalekie od optymalnych.
W momencie premiery Bielika 2.1 pojawiła się możliwość znaczącej poprawy jakości działania naszego systemu. Testy szybko pokazały, że Bielik wypadał zdecydowanie lepiej niż model rozwijany przez nas własnymi siłami. Z tego względu zdecydowaliśmy się na jego implementację. Wdrożyliśmy Bielika, bo potrzebowaliśmy lepszego modelu językowego do naszego produktu.
Wasze rozwiązanie pełni funkcję asystenta prawnego, warto doprecyzować, w jakich konkretnych obszarach i procesach organizacji został wdrożony model Bielik. Jakie usprawnienia udało się osiągnąć dzięki wykorzystaniu Bielika oraz jak z perspektywy czasu oceniane są efekty tego wdrożenia?
Jeśli chodzi o sam produkt, warto zacząć od wyjaśnienia, do czego służy. Gaius-Lex to asystent prawny wspierający prawników, kancelarie prawne i podatkowe, a także wewnętrzne działy prawne w firmach w prowadzeniu researchu prawnego. W sytuacji, w której prawnik standardowo korzystałby z dostępnych baz aktów prawnych i samodzielnie analizował zebrane dokumenty, nasz system automatyzuje ten etap.
Umożliwia to połączenie autorskiego mechanizmu wyszukiwania z wykorzystaniem modeli językowych, dzięki czemu cały proces jest szybszy, bardziej precyzyjny i mniej obciążający dla prawnika.
Czy głównym modelem językowym wykorzystywanym jest Bielik?
Bielik odpowiada obecnie za około 90% wykorzystania modeli językowych w procesie przygotowywania analizy dla użytkownika. Równolegle korzystamy także z rozwiązań, które częściowo rozwijaliśmy samodzielnie- nie ograniczamy się wyłącznie do dużych modeli generatywnych, lecz wykorzystujemy również mniejsze modele, m.in. do wektoryzacji. W tym obszarze mamy kilka własnych rozwiązań, a jednym z używanych przez nas modeli wektoryzacyjnych jest polski model MMLW autorstwa Sławomira Dadasa, rozwijany w ramach Ośrodka Przetwarzania Informacji- Państwowego Instytutu Badawczego (OPI PIB).
Bielik jest jednak wykorzystywany w najszerszym zakresie w naszym systemie. Przede wszystkim automatyzuje etap analizy dokumentów prawnych. Gdy prawnik formułuje zapytanie, nasz autorski silnik wyszukiwania przeszukuje bazę polskich aktów prawnych-orzeczeń, ustaw i innych materiałów. Następnie znalezione dokumenty trafiają do Bielika, który przygotowuje wstępne wnioski wynikające z tego korpusu.
Oprócz tego Bielik wspiera nas przy weryfikacji poprawności cytowani- sprawdza, czy przywołane orzeczenia rzeczywiście uzasadniają wnioski generowane przez system. Model wykorzystujemy także do analizy umów pod kątem klauzul abuzywnych: każda klauzula jest sprawdzana pod względem zgodności z aktualnym orzecznictwem.
Kolejnym obszarem jest analiza compliance, czyli ocena zgodności dokumentów z wewnętrznymi wytycznymi organizacji- zarówno pod kątem stylu komunikacji, jak i spełnienia wymogów formalnych.
Bielik wspiera nas też przy analizie umów spółek. Użytkownik może przesłać dokument, a system sprawdza m.in. poprawność reprezentacji, weryfikuje skład zarządu i ocenia, czy zapisy umowy spółki umożliwiają dokonanie danej reprezentacji.
To są obecnie najważniejsze obszary, w których wykorzystujemy Bielika.
Co przesądziło o wyborze modelu Bielik? Czy kluczowe okazały się kwestie jakości języka, bezpieczeństwa i zgodności z regulacjami, czy również fakt, że jest to polskie rozwiązanie, pozwalające zachować większą suwerenność nad danymi i procesami?
Bielik ma tę dodatkową zaletę, że jest modelem stosunkowo kompaktowym, dzięki czemu możemy uruchamiać go na własnej infrastrukturze. W naszym przypadku ma to kluczowe znaczenie, ponieważ pracujemy na danych wrażliwych. Z tego względu wszystkie dane muszą być przechowywane w Europie, a im większą kontrolę nad ich przetwarzaniem mamy, tym bezpieczniej przebiega cały proces. Możliwość wdrożenia Bielika na serwerach, które w pełni kontrolujemy, jest więc dla nas jednym z istotnych czynników. W przypadku wielu komercyjnych modeli nie bylibyśmy w stanie zagwarantować takiego poziomu kontroli, co mogłoby budzić obawy naszych użytkowników.
Wracając jeszcze do pytania o pomiar satysfakcji, korzystamy z systemu ocen, w którym użytkownik może wskazać, czy odpowiedź spełniła jego oczekiwania. To jest nasza podstawowa metryka jakości, oparta na bezpośredniej i mierzalnej informacji zwrotnej.
Dodatkowo opracowaliśmy model również oparty na Bieliku, który potrafi z dużą dokładnością przewidzieć, czy odpowiedź będzie satysfakcjonująca, nawet jeśli użytkownik nie udzieli oceny. W połączeniu tworzy to pełniejszy obraz efektywności systemu i pomaga nam w jego dalszej optymalizacji.
Chciałbym zapytać o Pana o ostatnie wdrożenie. W jaki sposób przebiegał cały proces od fazy koncepcji do uruchomienia rozwiązania, jak długo trwała realizacja oraz jakie etapy okazały się kluczowe z perspektywy projektu?
Technicznie rzecz biorąc, ostatnie wdrożenie miało miejsce około miesiąc–dwa miesiące temu, kiedy przechodziliśmy z poprzedniej wersji Bielika na najnowszą wersję 3.0. Natomiast za właściwe, pełnoskalowe wdrożenie warto uznać wcześniejszą migrację z naszego własnego modelu językowego na Bielika 2.1. Ta kluczowa zmiana miała miejsce około półtora do dwóch lat temu, w momencie premiery wersji 2.1.
Otrzymaliśmy wtedy informację od Fundacji SpeakLeash o udostępnieniu modelu, co zbiegło się z początkiem naszej współpracy. Cała implementacja była jednak realizowana wyłącznie przez nasz zespół — nie korzystaliśmy z zewnętrznego wsparcia Fundacji. W praktyce proces okazał się bardzo zbliżony do podejścia „plug and play”. Poza koniecznością przepisania modułów odpowiedzialnych za interakcję z modelem, cała migracja zamknęła się w około 10 godzinach roboczych.
W jaki sposób oceniali Państwo jako organizacji efektywność wdrożenia? Czy zostały przyjęte konkretne wskaźniki, na przykład związane z czasem realizacji zadań lub jakością obsługi i które z tych miar okazały się kluczowe z Państwa perspektywy?
Korzystamy z zestawu wewnętrznych testów oceniających jakość rozwiązania. To testy typu end‑to‑end: zadajemy pytanie, otrzymujemy odpowiedź i weryfikujemy jej poprawność. Była to nasza podstawowa metryka przy wyborze modelu językowego do wdrożenia. Bielik wypadł w nich na tyle dobrze, że skłonił nas do rozszerzenia całego zestawu testowego. Drugim źródłem oceny były opinie użytkowników, ich informacje zwrotne dotyczące przydatności udzielanych odpowiedzi.
Jakie są Państwa dalsze plany dotyczące rozwoju i wykorzystania modeli językowych w organizacji? Czy rozważane są nowe obszary ich zastosowania lub dodatkowe funkcjonalności, które mogłyby zostać wdrożone w kolejnych etapach?
Obecnie pracujemy nad zwiększeniem autonomii systemu. Do tej pory jego działanie polegało na tym, że użytkownik zadaje pytanie i otrzymuje odpowiedź, choć w praktyce proces ten jest znacznie bardziej złożony i trwa kilka minut. Teraz zmierzamy w kierunku podejścia zadaniowego.
Rozpoczynamy testy, w których system Gaius-Lex będzie otrzymywał do wykonania konkretne zadania badawcze, takie jak przeprowadzenie researchu. Celem jest umożliwienie mu realizacji większej liczby samodzielnych kroków analitycznych, tak aby dochodził do finalnych wniosków w sposób bardziej autonomiczny, a jednocześnie dostarczał pełniejsze i bogatsze odpowiedzi.
Równolegle współpracujemy z fundacją SpeakLeash, przekazując jej publicznie dostępne dane prawne- zarówno z polskiego, jak i czeskiego systemu prawa. Wynika to z planowanej ekspansji na rynek czeski oraz potrzeby obsługi kancelarii pracujących z prawem polskim i czeskim.
Co, Pana zdaniem, najbardziej przyspieszyłoby adopcję polskich modeli językowych w biznesie? Czy kluczowa byłaby tu większa edukacja, szersza dostępność gotowych rozwiązań, czy może odpowiednie regulacje?
Myślę, że kluczowe są dwa obszary. Po pierwsze edukacja. Obecnie obserwujemy duże zainteresowanie modelami językowymi, które często przeradza się w podejście: „chcemy wdrożyć model, ale jeszcze nie wiemy po co”. Dlatego tak istotne jest budowanie świadomości w zakresie identyfikowania mierzalnych, konkretnych i obserwowalnych procesów, które można realnie zautomatyzować lub usprawnić dzięki modelom językowym. Dopiero wtedy można przejść od wdrażania „dla samego wdrażania” do wdrażania, które wynika z policzonych korzyści-np. redukcji czasu o X% czy obniżenia kosztów o Y%. Po drugie jest to dostępność API. W tej chwili bardzo niewiele podmiotów oferuje dostęp do Bielika poprzez API. Oczywiście można go uruchomić samodzielnie na własnej infrastrukturze, co jest jego dużą zaletą, ale wymaga to posiadania lub wynajęcia odpowiedniego sprzętu- a to już stanowi realny próg wejścia.
Dlatego znaczącym ułatwieniem dla firm mogłoby być szersze udostępnienie prostego w użyciu API do modeli takich jak Bielik czy PLLuM. Obecnie podmioty, które to oferują, zazwyczaj wymagają podpisania umowy i posiadania działalności gospodarczej. To oznacza, że pojedynczy użytkownik, np. programista- nie może samodzielnie przetestować modelu, zanim przejdzie przez pełną procedurę formalną. Uproszczony dostęp, także dla indywidualnych odbiorców, mógłby znacząco przyspieszyć adopcję polskich modeli językowych.