Na Slovensku by sme o niekoľko rokov mohli vedieť lepšie pracovať s umelou inteligenciou (AI), a to aj v oblastiach, kde je málo dát na jej trénovanie. Pokrok vo vývoji jazykových modelov pre slovenčinu je jedným zo smerov výskumu v projekte lorAI. „Cieľom je, aby Slovensko bolo lepšie v umelej inteligencii a aby sme ju mohli lepšie využívať,“ priblížila pre TASR generálna riaditeľka Kempelenovho inštitútu inteligentných technológií (KInIT) Mária Bieliková.
Šesťročný projekt má inštitút pozdvihnúť na centrum excelentnosti a prepojiť akademickú sféru s biznisom. Vďaka tomu by sa podľa Bielikovej po jeho skončení malo aj na Slovensku lepšie pracovať s AI. „V slovenskom jazyku je omnoho menej textov a dát, ako máme v angličtine. Človeku sa bežne môže zdať, že je to dosť dobré, ale keď to chcete použiť v zdravotníctve, finančníctve, energetike alebo iných oblastiach, zistíte, že to až také dobré nie je. Jazykové modely niektorým slovám jednoducho nerozumejú,“ uviedla.
Ozrejmila, že cieľom je preto namiesto budovania veľkých jazykových modelov snaha o vytvorenie menších. „Pre malú krajinu ako Slovensko je to cesta, lebo sa vieme takto dostať medzi špičku v nejakej oblasti. Asi nemá teraz zmysel dobiehať veľké firmy, ktoré nám tu produkujú veľké modely, ktoré využívajú rôzne chatboty, ako napríklad ChatGPT. Myslím si, že na to nemáme zdroje, čiže by to bola márna práca,“ skonštatovala Bieliková.
V dôsledku nedostatku dát fungujú jazykové modely, ktoré spracovávajú prirodzený jazyk, v slovenčine horšie a poskytujú horšie výsledky. „V rámci projektu sa zameriame na výskum a návrh metód, ktoré budú vedieť fungovať aj nad takýmito obmedzenými dátami. Scenáre sú rôzne. Častokrát modely umelej inteligencie učíme ako v škole, keď si zoberieme príklad s rozpoznávaním fotiek, že na tejto fotke je gauč, na tejto auto a podobne. Sú však aj aplikácie, kde je označkovanie dát veľmi drahé, pretože to väčšinou musí robiť človek a je to opakujúca sa nezáživná manuálna práca. Tam sa zase snažíme navrhnúť metódy, aby dosahovali dobrú úspešnosť, aj keď majú málo značiek,“ povedal pre TASR vedecký riaditeľ KInIT Michal Kompan. Doplnil, že snahou je tiež navrhnúť metódy, ktoré by potrebovali menej zdrojov, napríklad energie, na trénovanie.
Minister školstva Tomáš Drucker (Hlas-SD) vidí význam projektu v prepojení výskumu s priemyslom a zameraní na udržateľnosť. „Udržateľnosť je dnes veľkou výzvou pri rozvoji v oblasti umelej inteligencie. Dátové centrá majú obrovské energetické nároky,“ poznamenal pre TASR. „Táto príležitosť v oblasti umelej inteligencie, ktorú vníma celá spoločnosť v dôsledku rôznych chatovacích technológií, nám umožňuje to, aby sme nemuseli hrať hru na doháňanie, ale dokonca môžeme byť v nejakej oblasti lídrom,“ zdôraznil.
KInIT získal na projekt lorAI - Low Resource AI 10,9 milióna eur z Európskej výskumnej agentúry v grantovom programe Horizon Europe, spolufinancuje ho ministerstvo školstva a prispel aj súkromný sektor, firmy Eset a Innovatrics. Budú na ňom spolupracovať odborníci z nemeckého centra pre výskum umelej inteligencie (DFKI), experti na digitálny obsah z centra ADAPT združujúceho sedem univerzít v Írsku, ako aj výskumný tím z gréckeho inštitútu CERTH.