Verset, esszét, CV-t, üzleti-pénzügyi hátteret ír, mindent tud(ni vél) – továbbra is hódít az Open AI tavaly novemberben élesített csetbotja, a Chat GPT. De még közel sem tökéletes: arra a kérdésünkre, hogy ki a leggazdagabb magyar, meglepő választ adott. Bár vannak kiemelkedő eredmények egyes területeken, messze vagyunk attól, hogy az MI elérje, vagy akár meghaladja az általános emberi intelligenciát. A Chat GPT gyerekbetegségeiről Tilesch György mesterséges intelligencia szakértővel beszélgettünk.
A Chat GPT még tavaly év végén szólt nagyot: ahogyan arról mi is írtunk, több éves fejlesztés után élesítették az első, egyelőre azóta is ingyenes verzióját, aminek öt nap alatt egymillió felhasználója lett. A fejlesztő Open AI épp múlt héten jelentette be, hogy érkezik a prémium üzleti verzió demója is.
Tilesch György, a Szilícium-völgyben dolgozó MI szakértő és tanácsadó, a PHI Institute for Augmented Intelliegence alapító elnöke a Forbes.hu-nak elmondta: azokban a technológiákban, amelyeket AI (artificial intelligence, vagyis mesterséges intelligencia – MI) néven emlegetünk, potenciálisan benne van a lehetőség, de legalábbis a szándék, hogy legalább az emberi kognitív képességekkel egyenértékű, gondolkodó és öntanuló gépeket hozzanak létre. Tulajdonképpen mindenkinek, aki 1956 óta mesterséges intelligencia-fejlesztéssel foglalkozott, ez volt az ambíciója.
„Ugyanakkor az teljesen biztos, hogy nem tartunk még itt.”
Teljesítmény tekintetében, bizonyos területeken már jobb a mesterséges intelligencia, mint az ember. Ugyanakkor a jelenlegi, mainstream AI technológia több sebből vérzik: az általános mesterséges intelligencia (artifical general intelligence) tekintetében, ami az emberi intelligenciával egyenértékű, még messze vagyunk ettől a céltól, sőt Tilesch szerint a jelenleg rendelkezésre álló mainstream technológiákkal nem is fogunk eljutni oda.
Lesznek ennél jobbak is
A Chat GPT a mesterséges intelligencia egy olyan alterülete, amit úgy hívnak, hogy conversational MI, vagyis egy olyan csetbot, amellyel társalogni lehet. Tilesch kifejtette: a Chat GPT azért különleges, mert nagyon impresszív teljesítményt tudott mutatni – meg persze egy csomó hibát is, ami miatt szét is szedték – és nagyon gyorsan reagált rá a piac, a felhasználói tömegek, és a média szárnyain most mennybe ment el. „Bármennyire is impresszív ez a megoldás, még nagyon sok jön majd a nyomában, lesznek a mostani szintnél jobbak is.”
A mesterséges intelligenciát döntéstámogató rendszerként számos területen használják az önvezető autóktól kezdve az egészségügyig, míg az átlagfelhasználó fantáziáját leginkább a tartalomgeneráló mesterséges intelligenciák ragadták meg.
A 2022-es év alapvetően arról szólt, hogy kép-, videó, programkód és nyelvgeneráló programok uralták le a piacot.
Hónapok alatt átrajzolhat iparágakat
Vannak olyan statisztikák, amelyek szerint az online tartalmaknak a 90 százalékát 2025-re már mesterséges intelligencia állíthatja elő. Tilesch György szerint annyi biztos, hogy ha van felvevőpiaca, akkor az MI hónapok alatt képes átrajzolni a tartalomgyártási ipart. A kérdés inkább az, hogy a szabályozók mennyire kapcsolódnak rá ezekre a trendekre. A Chat GPT-nél láttuk, hogy egy csomó iskolának és oktatási intézménynek az volt a természetes reakciója, hogy betiltották a használatát a diákok számára.
A New York-i iskolákban például azonnal letiltották a Chat GPT IP-címét, hogy ne használhassák dolgozatírásra a diákok. „Ez nem biztos, hogy jó döntés volt, de ez volt az első reakció, és egy csomó ilyen érkezhet még, vagyis kiszámíthatatlan, hogy milyen korlátozó tényezők jelennek meg.” Arra a kérdésre, hogy az oktatásban vagy a tudományos életben hogyan lehet korrekt módon használni az AI-t a jelenlegi fejlettségi szinten, Tilesch György kifejtette: a kockázatok és a mellékhatások elég komolyan benne van a rendszerben.
Amikor az AI hallucinál
Kockázatos, ha olyanok használják, akik nem pontosan tudják, hogy hol mehet félre az egész. Ha a kritikus gondolkodásunk, felkészültségünk az AI tekintetében jobb lenne üzleti és társadalmi szinten, akkor Tilesch szerint könnyebb lenne megtalálni azt, amiben jó, és amiben károkat okoz. A Chat GPT egyelőre még sokszor hallucinál. Így nevezik azt, hogyha nem áll rendelkezésére a megfelelő tudás, akkor kitalál dolgokat. A szakember tud olyan kollégáiról, akik megkérték a Chat GPT-t, hogy rakja össze a szakmai önéletrajzukat, és
a chatbot elkezdett behazudni olyan egyetemeket, és munkahelyeket, amelyekhez semmi közük nem volt.
Vagy: feltettek a Chat GPT-nek egy olyan kérdést, hogy milyen nemű lesz az Egyesült Államok első női elnöke. Erre kapásból adott egy olyan konzerv választ, hogy nem az a fontos, hogy milyen nemű, hanem, hogy milyen a felkészültsége. Majd amikor elkezdték nyomogatni a regenerate, vagyis az újragenerálás gombot, előbb-utóbb előkerült Hillary Clinton korábbi elnökjelölt neve, akiről a Chat GPT teljes bizonyossággal állította, hogy Hillary Clinton volt az USA elnöke 2017 és 2022 között. A hallucináció nagyon veszélyes dolog, hangsúlyozza Tilesch György.
A hónap kérdése a Forbesnál januárban mindig az, hogy ki a leggazdagabb magyar, úgyhogy megkérdeztük a Chat GPT-t. (Itt fontos, hogy a csetbot tudása a 2021 végéig tanult dolgokra korlátozódik.)
Átírják az egész internetes keresést
Ami a Chat GPT konkurenciáját illeti, a Google Sparrow nevű konkurens terméke pár hónap múlva jelenik meg. Tilesch úgy tudja, hogy pontosan azért nem engedték még rá a piacra a saját terméküket, mert úgy akarnak megérkezni, hogy a hallucinációs problémát már kiküszöbölték. Ebből a szempontból az Open AI a szakember szerint egy kicsit gyorsan ment a piacra, viszont tőlünk, felhasználóktól tanul és optimalizálja magát.
Arra a kérdésre, hogy a Chat GPT fel tudja-e támasztani a Microsoft keresőjét, a Binget, és ezzel veszélyezteti-e a Google-kereső piaci dominanciáját, Tilesch György kifejtette: a Chat GPT csak az első fecske, sok conversational AI fog még megjelenni a piacon, és ezek egyre jobbak és jobbak lesznek, mert iszonyatos a piaci verseny.
A Microsoft szerinte nagyon jót húzott azzal, hogy nemcsak a Binget fogja feltámasztani, hanem gyakorlatilag az Office-ba is integrálja a Chat GPT-t. Az összes Office program – a Word, az Excel, a Power Point, illetve az Azure szolgáltatások – mind valamilyen Chat GPT alapú algoritmust fog használni, ami azért írhatja át az egész kereső iparágat, mert ahogy az egyik AI szakértő ismerőse fogalmazott,
a Chat GPT és a konverzációs AI általában arra képes, hogy feltálalja az ételt. A Google kereső jelen formájában pedig csak azt tudja, hogy megmondja, hogy az étel hozzávalóit melyik boltban lehet megvenni.
A Microsoft arra apellál, hogy az embereknek sokkal inkább szüksége van arra a fajta élménygazdag tapasztalásra az AI kapcsán, ami gyakorlatilag összefoglal minden kérdésre mindent, minthogy linkeket küldjön stb., vagyis amit a Google csinál. „Ez egy sokkal durvább evolúciós fázis, amennyiben a piac készen áll rá. Ezt még nem tudjuk.”
A Microsoft egyébként erre nem kevés pénzt áldoz: ahogyan arról mi is írtunk, épp múlt héten jelentették be, hogy még több pénzt fektetnének a Chat GPT-be: 10 milliárd dollárt (kb. 3700 milliárd forintot) terveznek beletenni, az üzletet egyelőre nem ütötték nyélbe.
Nem intelligens, nincs józan esze
Tilesch György a Chat GPT technológiai hátterével kapcsolatban hangsúlyozta: mindent, ami szöveges az interneten, azt megtisztítva feltölti és az alapján elkezd egy olyan tanítási folyamatot, amiben felváltva vannak emberek és gépi intelligencia. Vagyis emberek értékelik, és így finomítják a gép válaszait. Nagyon fontos azonban, hogy ettől a Chat GPT például nem lesz intelligens, hiába hívjuk mesterséges intelligenciának.
„A Chat GPT az én és a szakma többségének fogalmai szerint nem intelligens, csak borzasztóan erős a hatékonyságát és teljesítményét tekintve.
Nagyon könnyen tudja manipulálni az emberi agyat és húha-érzést kelteni, de alapvetően nem érti azt, amit mond. És nagyon-nagyon egyszerű dolgokkal meg lehet vezetni.
Például olyan alapvető logikai feladványokkal, amiket egy 8-10 éves gyerek meg tud csinálni, ki lehet babrálni a Chat GPT-vel. Nincs meg benne az a fajta józan ész, common sense, ami az emberi intelligencia talán legfontosabb fundamentuma”, mondja Tilesch arról, hogy csak annyit tud, amit beletöltöttek, és amire megtanították. A tanítás után képesek megjósolni, hogy egy adott kérdésre milyen szó után milyen szó következik. Vagyis szavakból, szövegfragmentumokból mixel olyan válaszokat, amiket az ember az esetek jelentős többségében nagyon impresszívnek talál, de ennyit tud összesen: szavakat prediktálni és témákat röviden összefoglalni. Nem gondolkozik, nincs józan esze, nem bírálja felül magát, abból dolgozik, amije van, és ez az internet szöveges állományának 2021 előtti része. Semmit nem tud, ami most történt/ik, fejtette ki.
A lecserélhetőség narratívája nem áll meg, de…
Arról, hogy milyen munkaköröket veszélyeztethet, vagy esetleg alakíthat át, Tilesch elmondta: a tartalomipar perspektíváit már most rendesen átszerkesztgette. Ugyanakkor nem ért egyet azzal az elterjedt narratívával, hogy bizonyos szakmákban dolgozók egy az egyben lecserélhetők lesznek a mesterséges intelligenciára. Inkább arról van szó, hogy az MI újfajta kölcsönhatást hoz létre az ember és a gép között. Ennek persze vannak olyan közgazdasági konzekvenciái is, hogy egy feladat megoldásához valószínűleg kevesebb emberre lesz szükség, és pár, géppel összekapcsolt ember fog dolgozni.
Az újságírásból hozott példát: a Microsoft hírek, az MSN évek óta mesterséges intelligencia segítségével gyártja a sport- vagy akár a helyi választási híreket, és minden olyan hírt, ami adatalapon nagyon könnyen generálható.
Sportújságírókat maximum nagy elemzésekhez használ fel, de az, hogy mennyi volt a meccs végeredménye, azt az AI sokkal könnyebben és gyorsabban tudja és írja meg, mint az ember.
„Én azt mondanám, hogy az a kor jön, amikor az ember és a gép sokkal nagyobb hatékonysággal összekapcsolódva tud látványosan impresszívebb eredményeket elérni. Ez számomra pozitív szcenárió, mondja. Persze lehet az a negatív forgatókönyv is, hogy a kapitalizmus vaslogikája érvényesül, és a cégek arra fognak hajlani, hogy aki lecserélhető, az le is cserélhető legyen, csak én nem gondolom, hogy ez automatizmus lesz.”
Honlapkészítés vezényszóra
A szakértő szerint a mesterséges intelligencia terjedésének következő pár évét a hangalapú asszisztenseknél használt technológia fogja meghatározni. Ennek az alapjai már le vannak rakva, Siri, vagy a Google asszisztens ott van a telefonokban. Ezek még nem annyira látványosan okosak, mert de ha a Chat GPT-t vagy a Sparrow-t össze lehet majd kötni a saját asszisztensekkel, akkor sokkal okosabb lesz, mint amit a mostani asszisztensek tudnak.
„A következő határ az lesz, amikor az emberek el fognak kezdeni a saját hangjukon instrukciókat adni egy gépnek, és záros határidőn belül simán eljuthatunk oda, hogy mondjuk, amikor én egy új weboldalt akarok dizájnoltatni a cégemnek, akkor egy ilyen szoftvernek adok szóban hat utasítást, és elmondom, milyen menüpontokat akarok, milyen oldalak dizájnját nézze meg, és az alapján elkezd majd webdizájnokat pörgetni.” Itt megint csak az a kérdés, hogy milyen gyorsan megy rá a piac ezekre a fejlesztésekre, és milyen gyorsan jut el a felhasználókhoz. Ami biztos, hogy technológiailag ez már most megcsinálható.
Az MI egyik legimpresszívebb benyomulásai az úgynevezett kódolási asszisztensek. Ezek a programozók keze alá dolgoznak, és meglehetősen vegyesek a reakciók. Sok San Francisco-i kódoló ismerőse ma már nem is nagyon tud megmozdulni ezek nélkül a kódoló asszisztensek nélkül. Egyszerűen mert a munkájának azt a részét, amit a legjobban utál – kódsorok kitalálása és begépelése –, annak a jelentős részét jobban és gyorsabban meg tudja csinálni a gép.
Viszont van egy olyan pszichés reakció, hogy „na jól van, akkor nekem meddig lesz jó a munkám?”
Ezek a kódolási asszisztensek a fejlesztőcégek állítása szerint a munka 40-50 százalékát tudják levenni egy programozó válláról, de két év múlva ez már nyolcvan lehet. És ebben az a fontos mindenkinek, aki nem programozó, hogy sokkal hozzáférhetőbbé válik ez a fajta tudás, mert csak mondani kell a gépnek, hogy mit szeretnél leprogramozni. Ezt a Chat GPT például már tudja egy Excel-táblával, és szinte mindenre tud programkódot generálni. Mindössze hónapokra vagyunk attól, hogy elérkezzünk addig, hogy laikusok is képesek legyenek kódokat generálni. Erről korábban öt év egyetem nélkül nem is álmodhattunk.
És hogy ki a leggazdagabb magyar, de tényleg? A legfrissebb Forbes-listát, amelyet hónapokig számolt háromtagú listacsapatunk, a januári Forbesban találod, az online összefoglalóját pedig itt.