Az OTP Bank 2021 novemberében jelentette be, hogy szerződést kötött a SambaNova Systems-szel arra, hogy megépítsenek egy rendkívül erős, mesterséges intelligencia fejlesztésre használható szuperszámítógépet. Megnéztük, mit lehet tudni a projektről.
Trükkös terület a mesterséges intelligencia, mert másfajta környezetre van szükség a fejlesztéséhez és a futtatásához. Legegyszerűbben a képelemzéstől a gépi fordításig terjedő mély tanulással működő rendszereken lehet ezt megmutatni. Ezeknél a rendszereknél a tanulás és a használat ugyanis teljesen elkülönül.
A folyamat nagyon leegyszerűsítve úgy néz ki, hogy a neurális hálónak rendkívüli mennyiségű példát mutatnak a tanítási adatbázisból. Majd tesztelik olyan adatokon a mesterséges intelligenciát, amelyek hasonlók a tanítási adatbázisban találhatókhoz, de még nem látta azokat a rendszer.
Például megmutatunk egymillió képet macskákról, majd elkezdjük egyéb állatos képekkel bombázni a rendszert, abban a reményben, hogy a macskákat már ki tudja válogatni. (Illetve azt megállapítani, hogy az egyes képek milyen valószínűségben tartalmaznak macskát.)
Kell az izom
A milliónyi macska – vagy nyelvi példamondat, orvosi diagnózis satöbbi – feldolgoztatásához jelentős erőforrások szükségesek. Még gyors gépeken is komoly időt vesz igénybe egy neurális háló tanítása. Arról nem is beszélve, hogy ha a háló esetleg valamit rosszul tanul meg, akkor a munka kezdődhet az elejéről. Régi klasszikus példa, hogy egy nőket és férfiakat szortírozó képfelismeréses kód tanítása egyszer félrecsúszott. Az arcvonások helyett a kép alján látható dátum alapján dolgozott a program. Azért tehette ezt, mert a tanítási adatbázis női képei egy páros, a férfi fotói pedig a rá következő páratlan napról származtak.
A betanított neurális háló használatához azonban már nincs szükség szuperszámítógépre. Helyet sem foglal igazán sokat. Egy átlagos, pár éves telefonban több olyan funkció van, amit mesterséges intelligencia tesz jobbá vagy hatékonyabbá. Ne vezessen félre az intelligencia szó, ezek valójában olyan célprogramok, amik a mobilos fotózást vagy a gépi fordítást teszik jobbá. Nem a vasember Jarvis nevű asszisztense – idősebbeknek: KITT – fut a telefonban, hanem egy végletekig finomított statisztikai jellegű szoftver.
Mit vesz az OTP?
A fentiek egyben magyarázatul is szolgálnak arra, miért gondolja úgy az OTP, hogy szuperszámítógépre van szüksége.
A szupergépek között is jelentős különbségek vannak. Elég a legnagyobb számítási kapacitású gépek negyedévente frissített lisájára, a Top500-ra ránézni, hogy ez a különbség fel is tűnjön.
A lista élén jellemzően hangárnyi méretű térben működő, több millió processzormagot tartalmazó monstrumok találhatók,
amelyeknél már a gépek összekötésének a technológiája is úgy van optimalizálva, hogy minél kevesebb teljesítményt veszítsen a rendszer. A csúcson jelenleg a Fugaku nevű japán számítógép található a maga 7,6 millió processzormagjával, több mint ötmillió gigabájt memóriájával és a másodpercenként végrehajtott 400 billiárd (azaz tíz a tizenötödiken) számításával.
A top tízben azonban már 250 ezer processzorral is be lehet kerülni, ami még mindig nem fér el egy panellakás nappalijában, de lényegesen kisebb terem kell neki. Ez a tízes lista végén található Voyager-EUS2 nevű gép egyébként a Microsoft egyik, mesterséges intelligencia fejlesztésére használt gépe.
Az OTP közleménye a technikai részletekből nem sokat árult el, azon túl, hogy rack szerverekből építkeznek. Ez azonban csak annyit mond, hogy a gépek szerverszekrénybe lesznek szerelve. Salgó polcon mégsem állhatnak.
A SambaNova maga is szűkszavú az MI-megoldásokhoz készített, újrakonfigurálható Cardinal processzoraival kapcsolatban. Az viszont önmagában információ, hogy a cég saját szervereket gyárt saját tervezésű chipekkel.
Tünde agyad mit gondol, Legolas?
A számítógépeknél érdekesebb, hogy a SambaNova Systems a saját GPT megoldását szállítja majd, az OTP pedig nyelvi modell kidolgozásáról beszél. A GPT generatív előtréningezett transzformer modellt jelent. A kifejezés úgy tűnhet, mint jelentés nélküli szavak egymás után, de van jelentőségük. Olyan nyelvi modellt írnak le, amely képes hosszabb szöveget létrehozni. Stílusában konzisztens, összefüggő, valósnak tűnő szöveget tud írni így a kód, amit nem egy konkrét feladatra tréningeztek, hanem a nyelv használatára. Egy ilyen modellel például jelentősen jobb minőségű gépi fordítású szöveget lehet generálni. (Ugyan egyik sem GPT-s megoldás, de a gépi fordítás iránt érdeklődők hasonlítsák össze a DeepL és a Google Fordító eltérő megoldásait ugyanarra a szövegre. Remek játék!)
Felmerülhet a kérdés, hogy minek ehhez az OTP, ha egyszer a GPT-nyelvmodelleket jóval nagyobb cégek már kutatják. A magyar nyelv nem számít igazán kicsinek, benne van a top százban az anyanyelvi beszélők száma szerint, megelőzve nem egy régiós nyelvet. Ugyanakkor ahhoz kicsi, hogy a Google-nek vagy a Facebooknak az első ötletei között legyen nyelvtechnológiai eszközöket fejlesztenie a magyarhoz. Kantoni kínai, angol, spanyol vagy francia fejlesztésekkel nagyságrendekkel több embert érnek el. A nyelvtechnológiával tehát magunkra maradtunk, mint Horn Gyula a lakossági fórumon. A Wordben azért volt jó helyesírás-ellenőrző, mert a MorphoLogic lefejlesztette, az open source szoftverekben pedig azért, mert a Magyar Ispell projektből – illetve a Hunspellből – általános, több nyelvre alkalmazható eszközt készítettek a fejlesztői.
Az a klub, amibe beengednek
A SambaNova még nem igazán nagy cég, de már határozottan nem egy garázsban működő startup. Garázsban chipet gyártani amúgy sem lehet legalább ötven éve.
A cégbe több, mint egymilliárd dollárnyi kockázati tőkét fektettek eddig, az értékelése pedig több, mint ötmilliárd dollár.
Nem rossz egy olyan vállalattól, amit alig négy éve alapítottak. A befektetők között ráadásul ott a Google Ventures, az Intel Capital és a Blackrock. A cég gépei pedig ott dolgoznak az amerikai Energetikai Minisztérium Lawrence Livermore laboratóriumában és Los Alamosban is.