Start z polskim AI # Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego Uniwersytetu Warszawskiego
Start z polskim AI to cykl rozmów prezentujących doświadczenia związane z polskimi modelami językowymi AI oraz praktyki wdrożeniowe firm i instytucji. W rozmowie wzięli udział Karolina Szafranek i Wojciech Sylwestrzak z Interdyscyplinarnego Centrum Modelowania Matematycznego i Komputerowego Uniwersytetu Warszawskiego.
Czym zajmuje się ICM i jaką rolę odgrywa w budowie polskiego ekosystemu AI oraz wysokowydajnych obliczeń?
Wojciech Sylwestrzak: Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego Uniwersytetu Warszawskiego. Nazwa jest długa, ale bardzo dobrze oddaje to, czym się zajmujemy. Celowo nie mówimy o sobie „centrum superkomputerowe”. Moc obliczeniowa jest dla nas przede wszystkim narzędziem, a nie produktem samym w sobie. Naszą rolą jest modelowanie, czyli wykorzystywanie technologii, danych i kompetencji naukowych do lepszego rozumienia oraz opisywania złożonych zjawisk.
Ta nazwa towarzyszy nam od ponad 30 lat i nadal pozostaje aktualna. Naszą działalność można opisać poprzez trzy główne filary.
Pierwszym jest modelowanie zjawisk złożonych, takich jak pogoda, klimat, środowisko morskie, a także procesy społeczne i gospodarcze. Łączymy wiedzę dziedzinową, dane oraz zaawansowane metody obliczeniowe, aby tworzyć modele, które pomagają analizować rzeczywistość i wspierać decyzje.
Drugim filarem są infrastruktura wiedzy i unikalne zasoby danych. Jesteśmy aktywni w obszarze otwartej nauki, ale przede wszystkim pozycjonujemy się jako centrum danych. Utrzymujemy krajowe i europejskie zasoby wspierające otwarty dostęp do wiedzy. Przykładem jest zaplecze grafu wiedzy zasilającego Europejską Chmurę Otwartej Nauki, EOSC. Prowadzimy również różne platformy, w tym jedną z największych w Europie platform czasopism otwartego dostępu.
Trzeci filar to zdolność do długofalowego utrzymywania i rozwijania systemów produkcyjnych. Nie ograniczamy się do tworzenia prototypów czy realizacji projektów, które kończą się wraz z finansowaniem. Budujemy rozwiązania, które działają przez lata, są rozwijane, aktualizowane i wykorzystywane w praktyce. Dotyczy to zarówno modeli numerycznych prognozowania pogody, jak i infrastruktury otwartej nauki czy grafów wiedzy.
Sztuczna inteligencja nie jest dla nas osobnym, czwartym filarem. Traktujemy ją jako warstwę przekrojową, która wzmacnia wszystkie trzy obszary naszej działalności, czyli modelowanie, pracę z danymi oraz rozwój i utrzymanie systemów.
Nasza rola w krajowym ekosystemie jest komplementarna wobec innych ośrodków. Tam, gdzie część instytucji koncentruje się przede wszystkim na budowie surowej mocy obliczeniowej lub dużych modeli językowych, my skupiamy się na praktycznych zastosowaniach technologii w konkretnych dziedzinach. Dostarczamy dane, modele zjawisk i trwałą infrastrukturę, bez których nawet najbardziej zaawansowane modele AI pozostają jedynie demonstracją możliwości technologicznych.
Stawiamy więc nie tylko na technologię, lecz przede wszystkim na jej zastosowanie w nauce, gospodarce, administracji publicznej i rozwiązywaniu realnych problemów społecznych.
ICM od lat rozwija infrastrukturę obliczeniową dla nauki. Jak zmieniły się potrzeby użytkowników wraz z rozwojem generatywnej AI?
Wojciech Sylwestrzak: Działalność naukowa i badawcza pozostaje naszym fundamentem, ponieważ jesteśmy jednostką Uniwersytetu Warszawskiego. To właśnie z tej roli wynika nasza podstawowa misja.
Największa zmiana, którą obserwujemy, dotyczy potrzeb użytkowników. Oczywiście rośnie zapotrzebowanie na GPU oraz na inferencję realizowaną na dużą skalę. Jednocześnie widzimy, że główne wąskie gardło coraz częściej nie dotyczy już samej mocy obliczeniowej.
Historycznie działamy jako centrum HPC, czyli wysokowydajnych obliczeń komputerowych. Kilka lat temu użytkownicy przychodzili przede wszystkim po cykle obliczeniowe. Dziś znacznie częściej zgłaszają problemy związane z danymi.
Pytają, jak integrować dane z wielu źródeł, jak je porządkować i oczyszczać, jak budować stabilne potoki przetwarzania oraz jak utrzymać cały system w trybie produkcyjnym. Przykładem jest graf wiedzy, o którym wspominałem wcześniej. W takim rozwiązaniu wielu użytkowników dostarcza własne dane, które muszą zostać zintegrowane, przetworzone i stale aktualizowane.
Najważniejsze wyzwanie polega więc na budowie systemów, które nie tylko integrują dane, ale również działają niezawodnie przez długi czas. Model językowy jest w takim systemie ważnym elementem, ale tylko jednym z wielu. Często większym wyzwaniem pozostaje cały obszar data science, zarządzania danymi oraz utrzymania infrastruktury.
Coraz rzadziej rozmawiamy też o jednorazowych eksperymentach. Klienci oczekują usług, dostępnych w sposób ciągły i rozwijanych wraz ze zmieniającymi się potrzebami.
To obszar, w którym mamy wieloletnie doświadczenie. Operacyjne systemy prognostyczne utrzymujemy od ponad 20 lat. Dlatego odpowiadamy na rosnące potrzeby związane z GPU, inferencją i uczeniem maszynowym, ale równie mocno koncentrujemy się na danych. Modele AI trzeba czymś zasilać, a dane stają się dziś jednym z najbardziej krytycznych elementów całego procesu.
W jaki sposób w ICM powstają projekty AI — czy częściej wychodzą z potrzeb naukowców, biznesu czy administracji publicznej?
Karolina Szafranek: Wszystkie trzy filary naszej działalności łączy jedno: punktem wyjścia jest zawsze konkretny problem naukowy lub dziedzinowy. Zaczynamy od zrozumienia zjawiska, a następnie rozwijamy rozwiązania, które z czasem znajdują zastosowanie w gospodarce lub administracji publicznej.
Dobrym przykładem jest prognozowanie meteorologiczne. Podstawowym obszarem działalności zespołu meteorologicznego od wielu lat jest rozwój modeli numerycznych atmosfery i usług prognostycznych. Przez wiele lat rozwijaliśmy kompetencje w tym obszarze i właśnie z tego ICM jest szeroko znany (www.meteo.pl) . Dziś prognozy pogody stanowią usługę wykorzystywaną przez wiele sektorów gospodarki, między innymi energetykę, rolnictwo i lotnictwo.
Innym przykładem jest wsparcie analizy spójności prawa. Rozwiązanie to wyrosło z badań nad przetwarzaniem języka prawnego, a jego odbiorcą stał się proces legislacyjny.
Podobnie wygląda modelowanie pracy sieci kanalizacyjnych w warunkach ekstremalnych opadów. Punktem wyjścia jest fizyka zjawiska i jego szczegółowe zrozumienie. Odbiorcami rezultatów tych prac są zarządcy miast, przedsiębiorstwa wodociągowe oraz spółki komunalne.
Bardzo aktualnym przykładem jest również projekt Infostrateg, zainicjowany bezpośrednio przez administrację publiczną. W ostatnich dniach została podpisana umowa dotycząca jego realizacji. Projekt strategiczny jest finansowany przez Narodowe Centrum Badań i Rozwoju na zlecenie Ministerstwa Sportu i Turystyki. Uniwersytet Warszawski, wspólnie z Akademią Górniczo-Hutniczą, został wybrany jako jedno z dwóch konsorcjów realizujących projekt.
Celem projektu jest stworzenie systemu wykorzystującego sztuczną inteligencję do monitorowania i prognozowania ruchu turystycznego w Polsce. Impuls do jego powstania wyszedł z administracji publicznej, jednak rozwiązanie będzie opierać się na kompetencjach rozwijanych przez wiele lat: modelowaniu złożonych systemów, analizie danych z wielu źródeł oraz budowie modeli predykcyjnych.
Ta kolejność nie jest przypadkowa. Najpierw staramy się zrozumieć mechanizm i problem, a dopiero później budujemy narzędzie. Nie zaczynamy od pytania, jak wykorzystać sztuczną inteligencję. Gdy punktem wyjścia jest sama technologia, łatwo zacząć szukać problemu, do którego można ją zastosować.
Niezależnie od tego, czy impulsem są badania naukowe, potrzeby administracji czy wyzwania biznesowe, wspólnym mianownikiem pozostaje oparcie rozwiązań na wiedzy dziedzinowej i wcześniej zbudowanych kompetencjach, a nie wyłącznie na samej technologii sztucznej inteligencji.
Jak wygląda droga „od pomysłu do wdrożenia” w projektach AI realizowanych przez ICM?
Karolina Szafranek: Komercjalizacja wyników badań jest dla nas bardzo ważnym obszarem działalności. Wypracowaliśmy model, w którym ICM prowadzi prace badawczo-rozwojowe, a wdrożenia realizujemy wspólnie z partnerami przemysłowymi lub za pośrednictwem spółek spin-off.
Dobrym przykładem jest spółka spin-off Meteo, powołana w 2018 roku w celu komercjalizacji rozwiązań prognostycznych rozwijanych w ICM. Od wielu lat tworzymy metody i modele obliczeniowe służące do prognozowania pogody, natomiast spółka odpowiada za ich operacyjne wykorzystanie przez klientów z różnych sektorów gospodarki.
Z rozwiązań korzystają między innymi firmy z branży energetycznej, rolniczej, transportowej, lotniczej i logistycznej. W praktyce niemal każda branża jest w pewnym stopniu zależna od warunków pogodowych. Sam fakt, że spółka z powodzeniem działa na rynku od kilku lat, jest istotnym sukcesem komercjalizacyjnym. Dodatkowo od początku działalności wygenerowała dla Uniwersytetu Warszawskiego około 4 milionów złotych przychodów. To pokazuje, że wyniki badań mogą przekładać się na trwałą wartość gospodarczą i komercyjną.
Drugim ważnym filarem wdrożeń są projekty badawczo rozwojowe realizowane wspólnie z partnerami przemysłowymi. Ich celem jest doprowadzenie rozwiązań do pełnego wdrożenia i komercjalizacji.
Przykładem są projekty realizowane z firmą Globema, naszym wieloletnim partnerem z branży energetycznej. Wspólnie opracowaliśmy rozwiązania prognostyczne dostosowane do potrzeb energetyki odnawialnej. Następnie partner rozwinął je do postaci komercyjnych systemów, które obecnie znajdują się w jego ofercie.
Kolejnym przykładem jest projekt SOBEK, realizowany wspólnie z firmą KartGIS w którym ICM pełni funkcję lidera konsorcjum. Projekt ma wartość około 20 milionów złotych, z czego 17 milionów złotych stanowi dofinansowanie NCBR. Dotyczy modelowania pracy sieci kanalizacyjnych w warunkach ekstremalnych opadów. Jego odbiorcami są zarządcy miast, spółki komunalne i przedsiębiorstwa wodociągowe. Projekt nadal trwa, a jego wdrożenie i komercjalizacja są planowane w najbliższym czasie.
Warto wspomnieć również o projekcie MERMAID, który dopiero się rozpoczyna, ale od początku zakłada ścisłą współpracę z przyszłymi użytkownikami rozwiązań. Projekt jest realizowany wspólnie z Instytutem Oceanologii PAN oraz Instytutem Budownictwa Wodnego PAN w ramach konkursu TEAM NET, finansowanego przez Fundację na rzecz Nauki Polskiej. Jego założeniem jest łączenie doskonałości naukowej z potencjałem wdrożeniowym.
Już na etapie przygotowania projektu włączyliśmy partnerów reprezentujących przyszłych użytkowników rozwiązań, między innymi Zrzeszenie Rybaków Morskich, Polski Rejestr Statków oraz Urząd Morski w Gdyni. Kolejne instytucje i przedsiębiorstwa zadeklarowały udział w dalszych pracach. Dzięki temu możemy tworzyć rozwiązania możliwie najlepiej dopasowane do rzeczywistych potrzeb odbiorców.
Wszystkie te działania łączy dążenie do praktycznego wykorzystania wyników badań. Publikacje naukowe pozostają ważnym rezultatem naszej pracy, ale równie istotne są dla nas wysoka gotowość technologiczna, współpraca z użytkownikami oraz doprowadzanie rozwiązań do etapu rzeczywistego wdrożenia.
Jak ICM patrzy na rozwój polskich modeli językowych i budowę krajowej niezależności technologicznej?
Wojciech Sylwestrzak: Warto rozdzielić dwie kwestie: rozwój polskich modeli językowych oraz krajową niezależność technologiczną.
Rozwój krajowych modeli językowych jest potrzebny i wartościowy. Buduje kompetencje, bez których trudno byłoby rozwijać ten obszar w Polsce. Sami korzystamy z Bielika, udostępniając go klientom w lokalnych instancjach.
Nie należy jednak utożsamiać suwerenności technologicznej wyłącznie z posiadaniem własnego modelu językowego. Model jest tylko jednym elementem znacznie większego ekosystemu. O niezależności decyduje kontrola nad całym stosem technologicznym: danymi, infrastrukturą obliczeniową, procesami przetwarzania oraz kompetencjami zespołów, które utrzymują te rozwiązania.
Można mieć własny model, a jednocześnie pozostawać zależnym od zewnętrznych dostawców danych, infrastruktury lub usług. Można też korzystać z modelu stworzonego poza Polską, zachowując kontrolę nad tym, co w praktyce jest najważniejsze: danymi, sposobem ich przetwarzania i środowiskiem, w którym rozwiązanie działa.
W ICM budujemy niezależność przede wszystkim w warstwie danych i infrastruktury wiedzy. Utrzymujemy unikalne zasoby, nad którymi mamy pełną kontrolę i które są wykorzystywane przez partnerów w Polsce i Europie.
Dlatego potrzebujemy zarówno krajowych modeli językowych, jak i trwałej kontroli nad danymi, infrastrukturą oraz kompetencjami. Dopiero połączenie tych elementów tworzy rzeczywistą suwerenność technologiczną.
Sam rozwój polskich modeli językowych postrzegam przede wszystkim przez pryzmat budowania kompetencji. Dzięki temu w Polsce rozwija się grono specjalistów, którzy nie są wyłącznie użytkownikami gotowych narzędzi, ale rozumieją technologię, potrafią ją rozwijać, dostosowywać do konkretnych potrzeb i odpowiedzialnie wdrażać.
Czy polskie organizacje są dziś gotowe, aby rozwijać własne modele AI zamiast opierać się wyłącznie na rozwiązaniach zagranicznych?
Wojciech Sylwestrzak: Warto doprecyzować, co rozumiemy przez zagraniczne modele. Polskie modele językowe również często bazują na otwartych modelach podstawowych, takich jak Mistral czy Qwen. Jest to normalna i racjonalna praktyka, stosowana na całym świecie.
Większość zaawansowanych modeli nie powstaje od zera, lecz poprzez adaptację modeli bazowych o otwartych wagach. Tak rozwijane są między innymi Bielik i PLLuM. Trening modelu od podstaw byłby bardzo kosztowny i miałby uzasadnienie głównie jako przedsięwzięcie badawcze, a nie jako standardowa droga do budowania niezależności technologicznej.
Kluczowe pytanie nie brzmi więc, czy model bazowy powstał w Polsce, Chinach czy we Francji. Istotniejsze jest to, nad czym organizacja ma realną kontrolę: nad danymi wykorzystywanymi do dostrajania modelu, infrastrukturą obliczeniową, procesem oceny, wdrożeniem oraz późniejszym utrzymaniem rozwiązania.
To właśnie dane, infrastruktura i kompetencje decydują o suwerenności technologicznej. Model bazowy może pochodzić z zagranicy, a mimo to organizacja może zachować pełną kontrolę nad rozwiązaniem, jeśli samodzielnie zarządza jego dostrajaniem, środowiskiem działania i zastosowaniem.
Wybór modelu powinien też zależeć od konkretnego zastosowania. W niektórych przypadkach ważny będzie model dobrze dostosowany do języka polskiego i lokalnego kontekstu. W innych, na przykład w zadaniach programistycznych, lepszym wyborem może być inny model bazowy.
Polskie organizacje są gotowe do budowania tej kontroli. Kluczowe jest jednak właściwe rozumienie suwerenności technologicznej: nie jako posiadania jednego modelu stworzonego od podstaw, lecz jako kontroli nad całym łańcuchem, od danych i infrastruktury po kompetencje oraz utrzymanie rozwiązania.
Jakie znaczenie dla bezpieczeństwa danych i konkurencyjności ma rozwój krajowej infrastruktury obliczeniowej?
Wojciech Sylwestrzak: W obszarze bezpieczeństwa danych kluczowa jest fizyczna kontrola nad tym, gdzie i w jaki sposób dane są przetwarzane. To jeden z fundamentów niezależności technologicznej.
Dobrym przykładem jest graf wiedzy wspierający Europejską Chmurę Otwartej Nauki. Jego zaplecze techniczne działa na naszej infrastrukturze. Oznacza to, że krajowy ośrodek utrzymuje pod własną kontrolą unikalny zasób o znaczeniu europejskim.
Graf wiedzy jest stale rozwijany i aktualizowany. Nie jest to zbiór danych, który można łatwo skopiować lub odtworzyć z dnia na dzień. Jego wartość wynika nie tylko z samej infrastruktury, ale również z ciągłości działania, jakości danych, procesów integracji oraz kompetencji zespołu, który go utrzymuje.
Konkurencyjność zależy jednak nie tylko od obecnych zasobów. Równie istotna jest zdolność do ich rozwoju oraz gotowość na kolejne generacje technologii i sprzętu. Nasze centrum danych dysponuje zapasem mocy i przestrzeni oraz chłodzeniem ciepłą wodą, co jest warunkiem wstępnym dla najgęstszych systemów GPU kolejnych generacji, których nie da się już chłodzić powietrzem, a zarazem realną oszczędnością energii. Bezpieczeństwo i przewaga technologiczna wymagają więc zarówno kontroli nad tym, co działa dziś, jak i przygotowania na przyszłe potrzeby.
Przykładem takiego myślenia o przyszłości jest projekt PLGrid ICON, w ramach którego modernizujemy nasze środowisko obliczeniowe i rozbudowujemy infrastrukturę chmurową dla zastosowań AI i data science, a także udział w Gaia AI Factory, krajowej fabryce AI budowanej w ramach europejskiej inicjatywy EuroHPC, w której odpowiadamy za rozwój dziedzinowych zastosowań i wdrożeń sztucznej inteligencji.
ICM współpracuje z administracją, uczelniami i przedsiębiorcami. Jak różnią się potrzeby tych trzech grup?
Karolina Szafranek: W naszej działalności wyróżniamy trzy główne grupy odbiorców: środowisko naukowe, administrację publiczną oraz biznes. Każda z nich ma inne potrzeby i oczekiwania, dlatego współpraca z nimi wymaga odmiennego podejścia.
Dla nauki najważniejsze są skala, swoboda eksperymentowania oraz możliwość realizacji niestandardowych obliczeń bez nadmiernych ograniczeń. Badacze są świadomi, że część prób może się nie udać. Ryzyko, błędy i niepowodzenia są naturalnym elementem procesu badawczego.
Administracja publiczna oczekuje przede wszystkim uporządkowania, zgodności z regulacjami, audytowalności oraz transparentności. Istotne jest dla niej również bezpieczeństwo danych i pewność, że pozostają one pod kontrolą. Administracja odpowiada bowiem za swoje działania przed obywatelami.
Biznes z kolei potrzebuje przewidywalności. Liczą się stabilność działania usług, jasne koszty, sprawne wsparcie oraz krótka droga od testu do wdrożenia produkcyjnego. Firmy oczekują rozwiązań, które można szybko zweryfikować i skutecznie wykorzystać w praktyce.
Warto również rozróżnić potrzeby indywidualnych użytkowników i całych instytucji. Pojedynczy badacz lub specjalista zazwyczaj pyta o dostęp do zasobów i narzędzi. Uczelnia, urząd czy firma częściej koncentrują się na ciągłości działania, odpowiedzialności oraz długoterminowym utrzymaniu rozwiązania.
Wspólnym mianownikiem dla wszystkich tych grup jest potrzeba współpracy z partnerem, który rozumie ich problem. Nie chodzi wyłącznie o udostępnienie procesorów czy mocy obliczeniowej. Użytkownicy chcą rozmawiać o swoich wyzwaniach z zespołem, który potrafi je zrozumieć i pomóc w znalezieniu właściwego rozwiązania.
Coraz częściej oczekują też nie jednorazowego wyniku, lecz trwałej usługi, zapewniającej utrzymanie, ciągłość i rozwój w czasie.
Najczęściej spotykamy trzy wyzwania.
Pierwszym jest przekonanie, że wystarczy połączyć gotowy model z posiadanymi danymi, aby szybko uzyskać wartościowe rozwiązanie. W praktyce o powodzeniu projektu decydują przede wszystkim jakość, kompletność i właściwa integracja danych. To zazwyczaj najbardziej pracochłonny oraz wymagający etap całego procesu.
Drugim wyzwaniem jest niedoszacowanie kosztów utrzymania rozwiązania. Zbudowanie działającego prototypu może być stosunkowo szybkie i niedrogie. Znacznie większego wysiłku wymaga jednak wdrożenie produkcyjne, bieżące aktualizowanie, skalowanie oraz zapewnienie stabilnego działania systemu w dłuższej perspektywie.
Trzecia kwestia to właściwy dobór narzędzi. Często zakłada się, że odpowiedzią na każdy problem musi być sztuczna inteligencja lub duży model językowy. Tymczasem w wielu zastosowaniach lepiej, taniej i skuteczniej sprawdzają się klasyczne modele predykcyjne, analityka danych lub prostsze metody statystyczne.
Sztuczna inteligencja nie jest potrzebna w każdym projekcie. Najważniejsze jest dobranie technologii do rzeczywistego problemu, a nie dopasowywanie problemu do aktualnie popularnego narzędzia.
Jakie branże w Polsce najaktywniej szukają wsparcia ICM w obszarze AI i analizy danych?
Karolina Szafranek: To, z jakimi organizacjami najczęściej współpracujemy, wynika w dużej mierze z obszarów, w których ICM jest rozpoznawalny. Są to różne sektory, ale można wskazać trzy główne grupy zastosowań.
Pierwsza obejmuje prognozowanie i modelowanie zjawisk zależnych od pogody oraz klimatu. W tym obszarze współpracujemy między innymi z podmiotami z sektora energetyki odnawialnej, rolnictwa, gospodarki wodnej i gospodarki miejskiej.
Dla energetyki kluczowe jest prognozowanie produkcji energii z wiatru i słońca, czyli określanie, ile energii wytworzą farmy wiatrowe i fotowoltaiczne oraz ile energii trafi do systemu energetycznego. Pogoda jest tu jednym z najważniejszych czynników wpływających na działalność całego sektora.
Druga grupa to podmioty, które potrzebują integrować i analizować dane pochodzące z wielu źródeł. Wartość takich projektów wynika często z połączenia zbiorów danych, które wcześniej nie były analizowane wspólnie.
Przykładem jest analiza ruchu turystycznego z wykorzystaniem cyfrowego bliźniaka populacji. Model ten został opracowany między innymi na potrzeby analiz związanych z pandemią COVID-19, aby wspierać modelowanie rozprzestrzeniania się choroby. Obecnie może zostać wykorzystany do analizowania i prognozowania ruchu turystycznego.
Trzecia grupa obejmuje zastosowania, w których szczególnie ważne są wyjaśnialność, zgodność z regulacjami oraz zaufanie do działania systemu. Dotyczy to przede wszystkim sektora publicznego, prawa i finansów. W tych obszarach nie wystarczy, aby rozwiązanie działało skutecznie. Trzeba również rozumieć, dlaczego podejmuje określone decyzje, móc je zweryfikować i zapewnić zgodność z obowiązującymi wymaganiami.
To trzy najczęstsze grupy zastosowań, z którymi spotykamy się w naszej pracy.
Co najczęściej blokuje organizacje przed przejściem z pilotażu AI do pełnego wdrożenia?
Wojciech Sylwestrzak: Największą barierą jest zwykle niedoszacowanie skali i kosztów utrzymania rozwiązania. Wiemy to z własnego doświadczenia, bo realizujemy zarówno pilotaże i projekty badawczo rozwojowe, jak i późniejsze wdrożenia produkcyjne oraz ich wieloletnie utrzymanie.
Produkcja oznacza działanie systemu bez przerwy, na danych, które stale się zmieniają. Oznacza także odpowiedzialność za jego wyniki, bezpieczeństwo, dostępność oraz skutki podejmowanych na jego podstawie decyzji.
W przeszłości często traktowano wdrożenie AI jak jednorazową inwestycję. Powstawał prototyp, następnie system był uruchamiany i zakładano, że będzie działał samodzielnie. Dziś coraz wyraźniej widać, że model produkcyjny wymaga zupełnie innego podejścia.
Utrzymanie obejmuje między innymi stałą integrację ze zmieniającymi się systemami, aktualizację danych i modeli, monitoring działania, reagowanie na błędy oraz zapewnienie ciągłości usługi. To trwały koszt operacyjny, który wymaga zespołu odpowiedzialnego za system w dłuższej perspektywie.
Nasze doświadczenie pokazuje, że zdolność do utrzymania rozwiązania produkcyjnego jest często trudniejsza do zbudowania niż sam pilotaż. Systemy operacyjnych prognoz, które utrzymujemy, działają od lat i są uruchamiane wielokrotnie w ciągu doby. To właśnie długofalowe utrzymanie, a nie jednorazowe wdrożenie, decyduje o realnej wartości rozwiązania.
Jakich kompetencji najbardziej brakuje dziś organizacjom, które chcą skutecznie wdrażać AI?
Wojciech Sylwestrzak: Z naszych obecnych doświadczeń wynika, że najbardziej brakuje kompetencji, którą można określić jako inżynierię zastosowań AI. Chodzi o zdolność przełożenia konkretnego problemu biznesowego, naukowego lub administracyjnego na działające rozwiązanie, wykorzystujące modele, symulacje lub analizę danych, a następnie utrzymywane i rozwijane przez lata.
Pierwszym elementem tej kompetencji jest inżynieria danych. Sama analiza danych i data science rozwijają się coraz lepiej, ale wciąż dużym wyzwaniem pozostaje przygotowanie danych do użycia. Dotyczy to ich jakości, kompletności, integracji z wielu źródeł oraz bieżącego utrzymania. Dane nie są przecież statyczne, zmieniają się i wymagają stałej aktualizacji.
Drugim elementem jest zdolność do utrzymania rozwiązania w środowisku produkcyjnym. Zbudowanie systemu jednorazowo nie wystarcza. Rozwiązania oparte na AI są systemami żywymi, które trzeba rozwijać, aktualizować, skalować i dostosowywać do zmieniających się potrzeb. Coraz lepiej rozumie to biznes, natomiast w administracji publicznej nadal często dominuje przekonanie, że wystarczy kupić gotowy system, wdrożyć go i zamknąć projekt. Tymczasem największa część kosztów i odpowiedzialności pojawia się często właśnie po wdrożeniu.
Trzecim, być może najważniejszym elementem, jest zdolność do łączenia wiedzy dziedzinowej z technologią. Potrzebni są ludzie, którzy rozumieją zarówno realne problemy danej branży, jak i możliwości oraz ograniczenia technologii. Bez takiego połączenia mogą powstawać rozwiązania poprawne technicznie, ale nieodpowiadające na rzeczywiste potrzeby użytkowników.
Te kompetencje wzajemnie się uzupełniają. Ich rozwój zależy również od skali i ambicji organizacji. Część dużych podmiotów będzie chciała budować je wewnętrznie. My wspieramy przede wszystkim organizacje, które nie muszą posiadać wszystkich kompetencji u siebie, ale potrzebują partnera zdolnego przeprowadzić je od problemu do trwałego, działającego rozwiązania.
Gdyby dziś polska firma, uczelnia lub instytut badawczy chciały rozpocząć swoją przygodę z AI - od czego powinny zacząć?
Wojciech Sylwestrzak: Przede wszystkim należy zacząć od właściwego zdefiniowania problemu, a nie od założenia, że organizacja chce rozpocząć przygodę ze sztuczną inteligencją. W przeciwnym razie łatwo stworzyć rozwiązanie, dla którego dopiero później będzie się szukało zastosowania.
Najpierw warto określić, jaki konkretny problem ma zostać rozwiązany, jakie dane są dostępne oraz jakie efekty organizacja chce osiągnąć. Dopiero na tej podstawie można ocenić, czy sztuczna inteligencja jest właściwym narzędziem. Nie w każdym przypadku będzie najlepszym rozwiązaniem.
Karolina Szafranek: Nie warto zaczynać od zera ani samodzielnie powtarzać drogi, którą inni już przeszli. Jeśli można skorzystać z doświadczeń partnerów, którzy mają za sobą podobne wdrożenia, warto to zrobić. Najlepiej uczyć się na cudzych błędach, zamiast ponosić koszty własnych.
Dziękujemy za rozmowę!
Cykl rozmów „Start z polskim AI – od pomysłu do wdrożenia” jest realizowany w ramach programu Centrum Kompetencji AI.