A telefonos kisasszonyoktól a liftkezelőkön át a színészekig a mesterséges intelligencia (AI) térhódításáról beszélgettünk Victor Tamás Mátéval, az Oxfordi Egyetem mesterséges intelligencia szakos hallgatójával. Tamás szerint a valódi AI-forradalom a következő két évben inkább a háttérben fog zajlani, de az is nagy változásokkal jár majd.
Victor Tamás Máté, a Hold Alapkezelő vagyonkezelője és az Oxfordi Egyetem mesterséges intelligencia szakos hallgatója. Oxfordban ez a negyedik év, hogy – másfél éves, posztgraduális képzésként – van egyáltalán mesterséges intelligencia szak, Tamás pedig az első magyar, aki itt tanul. Nagyjából ötvenen vannak a szakon, osztálytársa például a Netflix egyik biztonsági vezetője, az Amazon egyik projektmenedzsere, illetve a Bloomberg és a Vodafone egy-egy adatkezelési vezetője. A képzés a mesterséges intelligencia üzleti felhasználási területeire fókuszál, olyan tantárgyakkal, mint a „Big data és gépi tanulás”, „Statisztikai modellek alapjai”, „Deep learning (mély tanulás) és neurális hálók” vagy az „AI etika”.
Egyenletesen szórják-e a pizzára a sajtot?
Tamás tizenhatodik éve dolgozik a Hold Alapkezelőnél, ahol 60 milliárd forintnyi befektetési portfólióért felelős. Pénzügyi szakemberként úgy látja, hogy a mesterséges intelligencia a befektetési döntéshozatal menetét is átírja majd, mivel sokkal gyorsabban, hatékonyabban lehet majd adatokat összegezni, tisztázni, egyszerűsíteni. Nagyon könnyű lesz ledönteni a nyelvi korlátokat is, például egy török vállalat elemzéséhez sokkal kevésbé kell majd törökül tudni.
A másik oldalra, az ügyfélkiszolgálásra már most berobbant az AI és láthatóan nagy a nyomás, hogy mindenki elkezdjen vele foglalkozni. Itt azonban úgy tűnik, messze vagyunk még a tökéletestől, legalábbis a szigorúan szabályozott pénzügyi szférában.
„A bankom néhány napja bevezette a saját mesterséges intelligencia asszisztensét a mobilalkalmazásba, és meglepődtem, mennyire nem tudott választ adni semmilyen kérdésemre,
legyen szó euró-forint árfolyamról vagy arról, hogy mennyi pénz van a számlámon” – fejtette ki Tamás. Merthogy az MI mindenképp válaszol, ha kérdezed. „És ez az, amit például a bankok nem engedhetnek meg maguknak, – és láthatólag nem is engednek meg-, hogy pontatlanul válaszoljanak. Ezért van az, hogy a bankom chatbotjától nagyjából bármit kérdezhetek, kitérő választ ad. Mert valószínűleg nem tudna száz százalékos pontossággal válaszolni.”
Nagyon messze vagyunk még attól, hogy amit a magánéletünkben a mesterséges intelligencia chat programok használatában élvezhetünk, azt a színvonalú beszélgetést a pénzügyi szférában is abszolválni tudjuk, de el fogunk ide jutni.
Nagyon sok szolgáltatás mögött, amit igénybe veszünk, már most is valamilyen mesterséges intelligencia alapú szoftver van. Sőt, tulajdonképpen sok területen már el is foglalta az életünket.
- a világ legnagyobb taxitársasága, az Uber – pedig egyetlen taxija sincs, csak egy mesterséges intelligencián is alapuló szoftvere
- a világ legnagyobb médiatársaságai a Facebook és a Google – pedig nem gyártanak médiatartalmat, csak van megfelelő szoftveres hátterük. A Google-nál is egy tanuláson alapuló gépi mechanizmus segíti, hogy a megfelelő találatot kapjuk az internetes keresésben. Az Instagram, a Facebook és a Tiktok folyamatosan figyeli, milyen hosszan nézünk egy adott képet vagy videót. Majd újabb és újabb tartalmak felkínálásával szűri le még pontosabban, hogy milyen téma érdekes az adott felhasználónak.
- a világ legnagyobb szállásadója, az Airbnb – pedig egyetlen szállása sincs, csak egy megfelelően optimalizált, mesterséges intelligencián alapuló szoftverek
– sorolja a példákat
Tamás azt mondja, egyetért Andrew Ng-vel, a Google Brain (a Google korábbi AI kutatócsoportja – a szerk.) egyik alapítójával, aki szerint a legtöbb, pénzben mérhető értéknövekedés az AI területén a háttérben fog zajlani a következő egy-két évben. Méghozzá olyan vállalati megoldásokkal, amelyeket eddig túl sokba került volna kifejleszteni, míg most, hogy a nagy nyelvi programok segítenek a hatékony programozásban, a korábban egy év alatt elkészíthető modellek egy hét alatt elérhetővé váltak.
Van például egy nagy pizzalánc, amely konkrétan Andrew Ng-nél is érdeklődött, hogy lehetne-e csinálni egy olyan, kamerákkal a pizzák elkészítését figyelő algoritmust, ami biztosítja, hogy egyenletesen szórják a sajtot a pizzákra. „Ez számukra hasznos, de azért annyira nem hasznos, hogy az egy évvel ezelőtti technológiával is megérte volna megcsinálni. Most, hogy ez egy egyhetes programozás és néhány, akár már most is a konyhában ott lévő térfigyelő kamera összehangolása, már megéri létrehozni ezt a megoldást.”
Húsz év alatt átveszi a munka felét
A McKinsey idén nyáron közzétett tanulmányában arra jutott, hogy első körben négy olyan terület lesz, ahol nagyon sok munkát fog átvállalni vagy megkönnyíteni az AI.
- Marketing: a szövegek létrehozása mellett a kép- és videóalkotást is
- Ügyfélkapcsolattartás: egyre több chatbotot és telefonos asszisztenst élesítenek a különböző szolgáltatók
- Programozás
- Kutatás-fejlesztés
A McKinsey általános prognózisa szerint pedig az AI 20 év alatt átveszi a munka 50 százalékát az emberiségtől.
Tamás igyekezett kontextusba helyezni az elsőre ijesztőnek tűnő arányokat. Kifejtette: az emberiségnek sok tapasztalata van abban, hogy milyen, amikor egy új technológia munkahelyeket szüntet meg.
„A mi generációnknak természetes, hogy a taxiban ül sofőr, de a liftben nem. Két generációval előttünk természetes volt, hogy a liftben is kell ülnie egy liftkezelőnek, ahogy a taxiban is ül egy sofőr. Míg az én unokámnak valószínűleg nyilvánvaló lesz, hogy sem a liftben, sem a taxiban nincs olyan, aki vezetné.”
A következő generáció számára mindig természetes a változás vagy az új helyzet, és inkább azoknak nehéz, akik éppen megélik azt.
Száz éve a Bell Telephone Company volt a legtöbb – több százezer – nőt foglalkoztató vállalat az Egyesült Államokban, olyan sok telefonközpontosra volt szükség. Ötven évvel ezelőtt ugyanakkor már nem is létezett az a szakma. Kutatásokban vizsgálva a korábbi telefonközpontosok utóéletét, rájöttek, hogy bár közülük sokan nem találtak olyan jó és kellemes állást, mint a telefonközpontban, de a következő generáció, az ő gyerekeik már sokkal jobb munkahelyek közül válogathattak annak köszönhetően, hogy valamilyen nagyon manuális dolgot automatizáltak. „Idő kell, amíg az emberek átállnak, alkalmazkodnak. Egyébként pedig hiába szűnt meg a telefonközpontos munka, a konzervatívabb vállalat- és hivatalvezetők a mai napig a titkárnőjüket kérik meg, hogy hívjon fel nekik valakit és kapcsolja be az irodába.”
Az AI-forradalommal új munkakörök is megjelentek: például a prompt mérnökök (prompt engineer) és a ChatGPT tanácsadók, vagyis minden olyan munkakör, ami ahhoz kapcsolódik, hogy hogyan kell minél pontosabban instruálni egy nagy nyelvi modellt. Erre egyrészt azért van szükség, hogy valaki tanácsot adjon a felhasználóknak, hogy pontosan hogyan írják meg a feladataikat megkönnyítő és jelentősen lerövidítő kéréseket, utasításokat. A másik oldalon pedig a nagy nyelvi modellek fejlesztőinél egyre több embert kell alkalmazni ahhoz, hogy kiszűrjék a hallucinációt a válaszoknál. A techóriások sokat dolgoznak azon, hogy minél jobban pontosítsák a válaszokat, így ezen a téren is lesz fejlődés, de Tamás szerint az igazán precíz és minőségi munkához továbbra is kell majd emberi közreműködés.
Ami biztos: ugyanakkora eredmény megtermeléséhez összességében kevesebb munkára lesz szüksége az emberiségnek. „Lehet szomorkodni, hogy mi történik az állásokkal. És biztosan lesznek nagyon sajnálatos történetek is, de összességében az emberiség számára mégiscsak jobb, hogyha kényelmesebb és több erőforrást nyújtó életet tud élni.” Úgy látja, akik attól tartanak, hogy az embereknek egyszerűen nem jut már munka, azok ennek kapcsán szokták az alapjövedelmek bevezetését emlegetni. „Ez a téma nagyon messzire vezet. A fejlődés önmagában jó dolog, főleg, ha ez fenntarthatóan, a környezetet is jobban kímélve történik.” Erre példaként a különböző közlekedési társaságok útvonaloptimalizálását említette, amivel nemcsak üzemanyagot, hanem károsanyag-kibocsátást is lehet spórolni.
A pénzügyi szektor nagy tévedése
A pénzügyi szektorban mindenki lázasan fejleszti az ügyfeleket segítő AI-tanácsadókat. Tamás szerint ugyanakkor ez a pénzügyi szektor nagy tévedése, mert az emberek három-öt éven belül meg fogják szokni, hogy van a saját telefonjukon egy univerzális tanácsadójuk, akit majd elneveznek és egész nap vele fognak beszélgetni.
„Őt kérik majd meg, hogy estére éttermet foglaljon, meetinget szervezzen, vagy ott helyettesítsen. Ezek a személyes virtuális asszisztensek nemcsak arra képesek, hogy meghallgassanak és összefoglaljanak mondjuk egy Zoom vagy Teams meetinget, hanem arra is, hogy az ember helyett szólaljanak fel a tárgyalásokon. „Az emberek meg fogják szokni, hogy ott van a mobiljukon az univerzális személyi asszisztensük, akivel egész nap intéznek dolgokat, beleértve a befektetéseiket és a bankügyeiket. A bankok szerintem még néhány évig fogják tudni használni az AI-tanácsadóikat, és utána inkább arra kell felkészülniük, hogy az ügyfelek meghatalmazást adnak majd saját, személyi asszisztensüknek a különböző tranzakciókra.”
A filmek területe a másik, ahol Tamás szerint nagy változások várhatók, és akár a teljes szinkronszínész szakma is teljesen feleslegessé válhat. A színészeknek elsősorban nem attól kell félniük, hogy a hangjukat az engedélyük nélkül használják, és egy géppel generálják a hangalámondásokat. A probléma inkább az lesz számukra, hogy például Pierce Brosnan vígan hozzá fog járulni ahhoz, hogy az ő saját hangja szólaljon meg a világ összes nyelvén. „Ez a stúdióval és a színésszel teljes egyetértésben fog zajlani. A szinkronra nem, vagy alig lesz szükség.” Hasonló játszódhat le a podcastoknál: a Spotify nemrég jött ki azzal a kezdeményezéssel, hogy a legnépszerűbb amerikai podcast műsorvezetők beszélgetéseit elkezdik sugározni a saját hangjukon, de más nyelveken.
Vége a telefonfeltartós koncerteknek?
Közben egyre elterjedtebb a tárgyak és a mesterséges intelligencia összekapcsolása is. A Ray-ben napszemüveggyártó például összeállt a Metával: a Facebook anyacégével nemrég dobtak piacra egy AI-t tartalmazó szemüveget, amivel lehet kamerázni, élőben közvetíteni, amit látunk, illetve beszél is hozzánk a fülünkbe, ha kérdezünk tőle valamit.
„Én lelkesen várom, hogy koncerteken végre ne tízezer telefont lássak föltartva, mert mindenki azzal kamerázik vagy fotózik, hanem csak a szemüvegben lévő kamerát kelljen bekapcsolni.”
Szintén nem olyan régóta vannak már olyan nyakba akasztható, ruhára csíptethető kütyük is, amik tartalmaznak AI-t. Ilyen például a mindent lehallgató és felvevő Rewind Pendant, ami jegyzeteket, összefoglalókat is készít a hallottakból. Persze sok kérdést felvet, hogy mit és kit szabad hallania és mit nem, mert természetesen van, amihez előzetes engedélyt kell kérni másoktól, de a lényeg, hogy jól személyre lehet szabni az eszközt.
Tamás további példaként említi, hogy ha besétálunk egy szállodába, akkor ott természetes lesz, hogy van egy olyan kijelző, egy tablet, amin egy kedves, mosolygós arc fogad minket, aki a saját anyanyelvünkön beszél hozzánk és elmeséli, hogy hánytól hányig van a reggeli, vagy mikor használhatjuk az úszómedencét. „Sokaknak vannak nyelvi korlátai, amelyek miatt nem utazik komfortosan, mert nem beszél mondjuk annyira jól angolul, hogy bonyolultabb dolgokat tisztázni tudjon a vendéglátókkal, a szállodai dolgozókkal. Az AI ezt is nagyon hamar fogja orvosolni.”
Borítókép: Sebestyén László