Przejdź do treści
Publikacje Data publikacji: 25 marca 2026

Start z polskim AI – od pomysłu do wdrożenia #AISay

Autor Patryk Bitner Młodszy Specjalista ds. rozwoju innowacji, Departament Rozwoju Innowacji | Polski Fundusz Rozwoju S.A.
Autor Magdalena Bryś Ekspertka ds. rozwoju innowacji, Departament Rozwoju Innowacji | Polski Fundusz Rozwoju S.A.
Polski Fundusz Rozwoju S.A.

Start z polskim AI to cykl rozmów, którego celem jest przedstawienie doświadczeń związanych z polskimi modelami językowymi AI oraz praktykami firm i instytucji we wdrażaniu tych rozwiązań. Zapraszamy do rozmowy z zespołem AISay, w którego skład wchodzą: Krzysztof Chibowski, Patryk Kwiecień oraz Izabela Babis.

Dlaczego zdecydowali się Państwo wdrożyć model językowy Bielik i jakie kluczowe potrzeby biznesowe stały za tą decyzją?

Krzysztof: Tak naprawdę nasza motywacja była bardzo konkretna: potrzebowaliśmy modelu językowego, który naprawdę dobrze rozumie język polski. To kluczowe, ponieważ nasz startup działa w obszarze dysfunkcji i zaburzeń mowy u dzieci. Na co dzień pracujemy z danymi mówionymi, które następnie przekształcamy w tekst. Jakość tej transkrypcji i zdolność uchwycenia kontekstu są dla nas absolutnie krytyczne.

Bielik okazał się tutaj świetnym rozwiązaniem. Nie tylko pomaga nam precyzyjnie strukturyzować tekst, ale przede wszystkim bardzo dobrze rozumie kontekst rozmowy, co jest fundamentem dla dalszej analizy i przetwarzania danych.

Istotnym powodem wyboru była również możliwość uruchomienia modelu w środowisku całkowicie on‑premise. Jako że pracujemy bez dostępu do chmury publicznej i mamy określone ograniczenia infrastrukturalne, potrzebowaliśmy lekkiego, skutecznego modelu, niewymagającego zasobów klasy HPC. Bielik dokładnie spełnia te wymagania - jest polski, efektywny, bezpieczny i gotowy do pracy w naszym środowisku.

Warto też dodać, że współpracujemy z zespołem Bielika od początku projektu, dzieląc się kompetencjami i wspierając jego rozwój. Dlatego korzystanie z modelu, który w pewnym stopniu współtworzyliśmy, daje nam dodatkową satysfakcję i naturalnie wzmacnia decyzję o jego wdrożeniu.

Jakie potrzeby Państwa organizacji udaje się zaspokoić dzięki temu rozwiązaniu?

Patryk: Nasza aplikacja działa w sposób ciągły, „nasłuchując” rozmów toczących się w otoczeniu telefonu. Na podstawie ich treści i kontekstu system automatycznie dobiera odpowiednie kategorie oraz przypisane do nich piktogramy. Ponieważ język polski jest bardzo złożony i pełen niuansów, potrzebowaliśmy modelu, który potrafi możliwie najtrafniej rozpoznać temat rozmowy i wskazać właściwą kategorię - zwłaszcza że rodzic, opiekun czy terapeuta może stworzyć ich naprawdę wiele.

Przykładowo: jeśli rozmowa dotyczy jedzenia, ale pojawia się wątek poranka, system powinien poprawnie zasugerować śniadanie. Właśnie taka umiejętność uchwycenia kontekstu była dla nas kluczowa, a żaden inny model językowy nie radził sobie z tym w języku polskim tak dobrze jak Bielik. Co więcej, nawet gdy pojawiają się elementy gwary, np. śląskiej, Bielik jako jeden z nielicznych potrafi je poprawnie zinterpretować i zachować ciągłość analizy.

Krzysztof: Dodatkowym wyzwaniem jest mowa potoczna, często występująca w dialogach między dzieckiem a rodzicem lub terapeutą. Nawet największe modele potrafią mieć z nią trudność. Tymczasem w naszym rozwiązaniu dokładne przełożenie języka naturalnego na piktogramy jest absolutnie kluczowe - to właśnie dzięki nim dzieci i dorośli niemówiący mogą komunikować się za pomocą prostych obrazków. Aby dobrać odpowiednie piktogramy, model musi bardzo precyzyjnie zrozumieć zarówno kontekst wypowiedzi, jak i intencję rozmówcy.

Dlatego tak ważne było dla nas narzędzie, które potrafi uchwycić sens wypowiedzi, poprawnie sklasyfikować jej temat i wskazać właściwe wizualne reprezentacje - a Bielik spełnił te wymagania znakomicie.

Chciałbym dopytać o sam proces wyboru partnera technologicznego. Pan Krzysztof wspomniał wcześniej, że współpracowali już Państwo z zespołem Bielika i że model bardzo dobrze radzi sobie z językiem polskim. Czy przy wyborze dostawcy brali Państwo pod uwagę także inne aspekty?

Patryk: Przede wszystkim mogliśmy uruchomić model lokalnie, na naszej własnej infrastrukturze, co dało nam pełną swobodę testowania i rozwijania rozwiązań już na wczesnym etapie. Dzięki temu mogliśmy szybko dodawać funkcje, których potrzebowaliśmy, aby rozszerzać nasze usługi o komponenty oparte na LLM‑ie.

Istotne było też to, że wszystkie dane przetwarzane w aplikacji pozostają u nas - nie trafiają na zewnętrzne serwery ani do chmury publicznej. Choć nie operujemy na danych wrażliwych, dużo większy spokój daje nam świadomość, że całość ruchu odbywa się na sprzęcie, którego jesteśmy właścicielami i nad którym mamy pełną kontrolę.

Czyli można powiedzieć, że aspekt bezpieczeństwa również odegrał tu istotną rolę.

Krzysztof: Tak, zdecydowanie. Mamy pełną świadomość, jak dynamicznie rozwija się zarówno SpeakLeash, jak i sam model Bielik. Pojawiają się kolejne wersje, zapowiadane są modele multimodalne, a cały ekosystem Bielika jako projektu tworzonego w Polsce bardzo szybko dojrzewa.

Z naszej perspektywy kluczowe jest zapewnienie długofalowego rozwoju i stabilnego wsparcia technologicznego. Wiemy, że do modelu stale trafiają nowe dane, a jego jakość systematycznie rośnie. Dostęp do niedużego, wydajnego modelu, połączony z zapleczem Cyfronetu i możliwością pracy z modelem w sposób bezpośredni, jest dla nas ogromną wartością.

W praktyce trudno znaleźć na rynku porównywalne rozwiązanie lokalne pod kątem jakości rozumienia języka polskiego, możliwości wdrożenia oraz tempa rozwoju, dlatego Bielik okazał się naturalnym wyborem.

Czy rozwijają Państwo również własne, autorskie modele językowe?

Krzysztof: Plan jak najbardziej istnieje. Współpracujemy już z Cyfronetem przy AGH . Na tym etapie jesteśmy jednak wciąż we wczesnej fazie rozwoju, więc nie dysponujemy jeszcze tak dużym zbiorem danych, jakiego potrzebowalibyśmy do stworzenia pełnoprawnego modelu.

Docelowo chcemy zbudować model dedykowany generowaniu piktogramów -  uwzględniający polski kontekst językowy, kulturowy i regionalny. Na tym bardzo nam zależy i w tym kierunku konsekwentnie zmierzamy. Wierzymy też, że mamy potencjał, aby stworzyć rozwiązanie, które będzie wyraźnie różniło się od tego, co obecnie jest dostępne na rynku, bo dobrze rozumiemy specyficzne potrzeby naszych użytkowników i efekt, jaki chcemy osiągnąć.

Na ten moment korzystamy z istniejących modeli, ale w kolejnych etapach albo będziemy rozwijać je we współpracy być może z Fundacją SpeakLeash, albo zdecydujemy się na budowę własnego modelu ukierunkowanego na generowanie piktogramów i technologie powiązane z ich wykorzystaniem.

Patryk: Na razie koncentrujemy się na zbieraniu danych potrzebnych do przeprowadzenia fine-tuningu pod nasze potrzeby i wygląda na to, że jesteśmy na dobrej drodze. Czy opłaci się w przyszłości tworzyć w pełni „skrojony na miarę” model dowiemy się dopiero za jakiś czas, kiedy będziemy mogli realnie ocenić skalę korzyści i możliwości jego wykorzystania.

W kontekście wdrożenia Bielika - z jakimi największymi wyzwaniami musieli się Państwo zmierzyć? Dotyczyły one kwestii technologicznych, pracy z danymi, integracji z obecnymi systemami, czy może również zmian w kulturze organizacyjnej?

Patryk: Zacznę od tego, że w naszym przypadku decyzje podejmuje niewielki, trzyosobowy zespół, więc cały proces przebiega szybko i bardzo sprawnie. Od strony technicznej samo wdrożenie nie sprawiło nam większych trudności - wcześniej korzystaliśmy już z innych modeli, dlatego integracja Bielika sprowadzała się głównie do jego uruchomienia i połączenia z istniejącą infrastrukturą.

Mieliśmy już przygotowaną bazową konfigurację, ponieważ w naszych testach regularnie porównujemy różne modele, również zagraniczne, aby tworzyć wewnętrzne benchmarki i sprawdzać, jak poszczególne rozwiązania radzą sobie w różnych zadaniach językowych. Dzięki temu przejście na Bielika było dla nas naturalnym i stosunkowo prostym krokiem.

Czy mogliby Państwo podać konkretne przykłady zastosowania tego rozwiązania w praktyce?

Krzysztof: Jeśli chodzi o zakres zastosowań i funkcjonalności, z których korzystamy, jest on naprawdę szeroki. Zaczynamy od fundamentu, o którym wspomnieliśmy wcześniej, czyli od rozumienia kontekstu. Analizowana przez nas mowa to nie klasyczne dialogi, ale często krótkie komunikaty pełne emocji i silnie osadzone w sytuacyjnym tle. Dlatego dla nas kluczowe jest uchwycenie zarówno znaczenia wypowiedzi, jak i intencji osoby mówiącej.

W tym celu wykorzystujemy Bielika, który pomaga nam odczytać kontekst, ale również rozpoznać emocje zawarte w komunikacie. To niezwykle ważne, bo dzięki temu możemy odpowiednio zaznaczyć w aplikacji, czy dziecko jest np. zdenerwowane, smutne czy szczęśliwe. Analizujemy więc nie tylko treść, lecz także emocjonalny ton wypowiedzi i te informacje wykorzystujemy technologicznie w dalszych etapach działania aplikacji.

Sama aplikacja już dziś świetnie tłumaczy mowę naturalną na piktogramy, m.in. właśnie dzięki Bielikowi. Jednak praca nad tym obszarem otworzyła przed nami kolejne możliwości. Widzimy, że modele językowe mogą wspierać nas również w tworzeniu opisów nowych piktogramów oraz w budowaniu ich standaryzacji. Generatywna sztuczna inteligencja pozwala nam przygotowywać precyzyjne, dobrze skrojone opisy, które później wykorzystujemy do konsekwentnego rozwijania naszej bazy wizualnej.

Kontekst, emocje, a także informacja zwrotna - to trzy filary, na których opiera się nasze podejście. Nie tylko „słuchamy” użytkownika, ale jesteśmy też w stanie wygenerować poprawną odpowiedź. Tu znów kluczową rolę odgrywa model językowy, który pomaga nam budować zdania zgodne z zasadami polskiej gramatyki. Jest to dla nas szczególnie ważne, ponieważ chcemy wspierać dzieci i młodzież w kształtowaniu poprawnych konstrukcji językowych. Dzięki temu, jeśli mowa w przyszłości zacznie się rozwijać lub wróci, będą miały już utrwalone poprawne wzorce zdań.

Patryk: Właśnie to chciałem podkreślić - ogromną wartością jest to, że generowane odpowiedzi są poprawne gramatycznie. To był dla nas szczególnie ważny aspekt, na który zwracały uwagę także panie profesor współpracujące z nami przy analizach i przekazujące uwagi dotyczące funkcjonalności. Pod tym względem Bielik sprawdza się naprawdę doskonale.

Krzysztof: Tak, to prawda. Patryk słusznie zwrócił uwagę na jeszcze jeden ważny aspekt - nie działamy w tym obszarze sami. Korzystamy z solidnego, merytorycznego wsparcia ekspertów. Współpracujemy z trzema ośrodkami akademickimi specjalizującymi się w logopedii, neurologopedii i szeroko rozumianym językoznawstwie: Uniwersytetem Komisji Edukacji Narodowej w Krakowie, Uniwersytetem im. Adama Mickiewicza w Poznaniu oraz Uniwersytetem Marii Skłodowskiej-Curie w Lublinie.

Od początku przyjęliśmy zasadę, że najważniejsze jest to, by nie zaszkodzić użytkownikom. Dlatego każdą funkcjonalność, każdą operację i każdy nowy element technologiczny konsultujemy szeroko z ekspertami. Chcemy mieć pewność, że rozwiązania, które dodajemy, także te typowo technologiczne, tzw. featury będą miały pozytywny wpływ na użytkowników, a na pewno nie spowodują żadnych niepożądanych efektów.

To podejście sprawia, że aplikacja rozwija się odpowiedzialnie i w sposób, który realnie zwiększa jej użyteczność.

Jeśli chodzi o samo wdrożenie - jak długo trwało i jakie były jego kluczowe etapy? Czy mogliby Państwo opowiedzieć, jak przebiegał cały proces?

Patryk: Samo wdrożenie przebiegło u nas bardzo szybko, głównie dlatego, że większość konfiguracji mieliśmy już przygotowaną wcześniej. Zaczynaliśmy od integracji z OpenAI i Chatem GPT, więc podłączenie kolejnego modelu niezależnie od tego, czy byłby to Bielik, czy inny - sprowadzało się właściwie do wyklikania kilku ustawień i dostosowania parametrów pod naszą aplikację. W praktyce zajmuje to naprawdę niewiele czasu i nie stanowi dla nas żadnego wyzwania.

Gdybym miał wskazać element, który może być trudniejszy, to raczej warstwa sprzętowa. Żeby model działał z odpowiednią szybkością, potrzebna jest wydajna maszyna. W naszym przypadku ma to szczególne znaczenie, bo oprócz generowania odpowiedzi analizujemy także sposób prowadzenia rozmowy - m.in. ton komunikatów, emocjonalne zabarwienie czy sygnały agresji. Te procesy nie muszą działać w czasie rzeczywistym, ale i tak wymagają solidnej mocy obliczeniowej, aby cały system funkcjonował płynnie.

Krzysztof: Rzeczywiście, cały proces wdrożenia przebiegł u nas bardzo sprawnie, głównie dlatego, że technologią zajmujemy się od lat. Znamy modele, rynek, różnice między rozwiązaniami online’owymi i on‑prem, a także swobodnie poruszamy się w pracy z API. Dzięki temu podłączenie kolejnego modelu - czy byłby to Bielik, czy jakikolwiek inny jest dla nas naturalnym, szybkim etapem i nie stanowi większego wyzwania.

Warto jednak podkreślić, że wiele firm wciąż nie ma świadomości, jak łatwo można dziś uruchomić takie rozwiązania. Wiedza jest dostępna, narzędzia są dojrzałe, a wdrożenie da się przeprowadzić naprawdę efektywnie. Co więcej, w praktyce często obserwujemy, że duże modele językowe są wykorzystywane do bardzo prostych zadań, zupełnie niepotrzebnie. Jeśli potrzebujemy odpowiedzi typu „tak/nie” albo krótkiego komunikatu, nie ma sensu uruchamiać ogromnej infrastruktury, skoro można to zrobić lokalnie, mniejszym modelem. To nie tylko oszczędność zasobów i energii, ale też bardziej świadome podejście technologiczne.

Oczywiście, nawet kompaktowy model taki jak Bielik wymaga pewnej mocy obliczeniowej, zwłaszcza przy skalowaniu czy szerzej zakrojonych testach. Dodatkowo pracujemy nie tylko w języku polskim. Dzięki temu, że Bielik obsługuje wiele języków, rozwijamy aplikację również międzynarodowo i dziś mamy już zaimplementowanych 7 języków. Dostrzegamy potrzeby rynku i tam, gdzie pozwala nam na to infrastruktura, dokładamy kolejne elementy korzystające z lokalnie uruchamianych modeli.

Jakie są Państwa dalsze plany dotyczące rozwoju wykorzystania modeli językowych?

Krzysztof: Z planów rozwojowych: chcemy rozszerzać funkcjonalności modeli - języki są dla nas kluczowe, a Bielik daje tu bardzo duże możliwości. Myślimy również o uruchomieniu dodatkowego serwisu do generowania piktogramów, a także o nowych formach współpracy, które już zaczynają się otwierać. Na razie nie chcę zdradzać wszystkiego, ale faktem jest, że przed nami kolejne możliwości, które będą wymagały zarówno wsparcia finansowego, jak i merytorycznego, zwłaszcza na etapie testowania.

Każda nowa funkcjonalność generuje kolejne pomysły i to jest fascynujące. Jednocześnie dbamy o to, aby aplikacja rozwijała się stabilnie i organicznie, bez nadmiernego „rozpychania” jej o dodatki, które mogłyby zaburzyć spójność. Pomysłów mamy naprawdę dużo: od nowych języków, przez rozwój piktogramów, aż po ulepszenia związane z mobilnością, integracjami i współpracą z instytucjami zewnętrznymi. Rynek, gdy tylko się go dotknie, sam pokazuje, jak ogromny ma potencjał i jak wiele jeszcze można zrobić.

Co Państwa zdaniem mogłoby najszybciej przyspieszyć adopcję polskich modeli językowych w biznesie? Czy kluczowe są tu kwestie regulacyjne, większa edukacja rynku, czy może przede wszystkim łatwiejszy dostęp do samych rozwiązań?

Krzysztof: Wydaje mi się, że na ten moment kluczowa jest edukacja. Owszem, mamy regulacje i wdrożyliśmy je dość szybko - może nawet zbyt szybko, ale dziś to właśnie budowanie świadomości rynku ma największe znaczenie. Chodzi o to, by ludzie wiedzieli nie tylko, że istnieją polskie modele językowe, ale też czym różnią się od rozwiązań zagranicznych i do jakich zastosowań są najlepiej dopasowane. Globalne modele, takie jak OpenAI czy Mistral, są bardzo widoczne, a tymczasem lokalne rozwiązania potrafią być równie skuteczne i zdecydowanie bardziej adekwatne w wielu obszarach.

Widać, że inicjatywy edukacyjne się rozwijają - zarówno przy Ministerstwie Cyfryzacji, jak i w ramach projektów otwartych, jednak w porównaniu z realnym zapotrzebowaniem to nadal za mało. Kolejnym krokiem powinno być wprowadzenie tej tematyki na uczelnie, ale również do szkół średnich. W praktyce edukacja technologiczna przesunęła się właśnie na ten poziom - to tam młodzi ludzie powinni uczyć się, czym są modele językowe, jak działają i jak z nimi pracować. To wymaga odpowiednich programów, dostępu do samych modeli oraz infrastruktury obliczeniowej.

W Polsce powstają już zasoby, z których można korzystać jak Gaja czy Piast w PCSS i to bardzo dobry kierunek. Aby jednak ta infrastruktura miała realne przełożenie na rozwój rynku, musi jej towarzyszyć szeroka edukacja: świadomość tego, jak działają modele, jak funkcjonują dane, czym jest ich suwerenność czy grawitacja. Bez tego młode pokolenia będą czerpały wiedzę głównie z mediów społecznościowych, używając technologii bez refleksji nad jej mechanizmami i konsekwencjami.

Istotne jest również to, że Polacy jako społeczeństwo bardzo szybko adaptują nowe technologie, szczególnie w życiu prywatnym. Warto tę otwartość skierować w stronę zastosowań edukacyjnych i naukowych, a nie wyłącznie rozrywkowych.

Drugim równie ważnym elementem są dane. Modele takie jak Bielik mogą się dalej rozwijać, jeśli dostarczymy im większe, wysokiej jakości polskie zbiory danych. Dzięki temu będą dokładniejsze, bardziej efektywne i lepiej przygotowane do realnych zastosowań w biznesie.

Izabela: Dodam jeszcze, że w kontekście adopcji modeli językowych w biznesie kluczowe jest połączenie realnych use case’ów z twardymi danymi - miernikami, konkretnymi wskaźnikami i rzeczywistym ROI. Jesteśmy na etapie, w którym firmy coraz lepiej rozumieją, gdzie modele językowe mogą się przydać, zarówno te globalne, jak i polskie, ale wciąż brakuje im potwierdzenia w postaci udokumentowanych wdrożeń i precyzyjnych rezultatów. To byłby ważny impuls edukacyjny, szczególnie z perspektywy biznesowej. Organizacje potrzebują argumentów opartych na faktach, nie tylko na obietnicach.

Znaczenie ma również aspekt bezpieczeństwa oraz możliwość wdrożeń on‑premise. To często jeden z głównych warunków, o których wspominają firmy, zwłaszcza działające w sektorach regulowanych. Do tego dochodzi rosnący ekosystem partnerów i integratorów, który zaczyna budować się wokół Bielika i całej fundacji. Ta rosnąca „symbioza” - prostsze wdrożenia, gotowe integracje, wsparcie techniczne - będzie stopniowo ułatwiać firmom wdrażanie polskich modeli językowych w praktyce.

A na końcu i tak wracamy do fundamentu, czyli edukacji, absolutnie podstawowego elementu całego procesu.

Krzysztof: Od samego początku wychodziliśmy od bardzo konkretnego zastosowania. Najpierw pojawił się use case, a dopiero później dobieraliśmy do niego technologię. Teraz rozwijamy kolejne elementy i podnosimy jakość rozwiązań dokładnie pod to, czego wymaga ten scenariusz. Gdy robi się odwrotnie - najpierw wybiera technologię, a dopiero później szuka dla niej zastosowania, często kończy się to rozczarowaniem. Później widać to w raportach: projekty nie dowożą, pojawia się frustracja, a rzeczywistość odbiega od marketingowych obietnic.

U nas sytuacja jest o tyle klarowna, że dokładnie wiemy, jaki efekt chcemy osiągnąć. Gdy biznes startuje z jasnym celem, znacznie łatwiej dobrać odpowiednią technologię: określić, czy potrzebny jest model duży czy kompaktowy, on‑premise czy w chmurze, jaka jakość i jaki język są kluczowe. Zadawanie sobie takich pytań na etapie budowania use case’u pozwala uniknąć rozczarowań i realistycznie ocenić możliwości danej technologii.

My mamy bardzo jasno zdefiniowane oczekiwania i bardzo dobrze wiemy, w czym Bielik realnie wspiera nasz produkt.

Dziękujemy za rozmowę!

 

Cykl rozmów „Start z polskim AI – od pomysłu do wdrożenia” jest realizowany w ramach programu Centrum Kompetencji AI.