Vagy megtalálták az AI Szent Grálját Kínában, vagy óriási átverés az egész. Persze romantikus a DeepSeek legendája, miszerint egy aprócska startupról van szó – csak hát ez egyszerűen nem igaz. Mint ahogy az sem, hogy 5,6 millió dollárból fejlesztették a mesterséges intelligencia modellt, amely felforgatja a világot. Mindenesetre a DeepSeek egyetlen nap alatt padlóra küldte a globális tech- és energia szektort. Megvizsgáltuk, kipróbáltuk, hogy megmutathassuk, mivel kell ezentúl számolni ezen a játszótéren.
Tízmilliárd dollár, ötvenmilliárd dollár, ötszázmilliárd dollár, kétbillió dollár. Nem, ez nem a Mars bányászati jogaiért vívott licit, hanem ilyen összegek repkednek, amikor a mesterséges intelligenciával kapcsolatos befektetések, illetve befektetési igények kerülnek szóba.
Ehhez képest most szinte a semmiből felbukkant egy DeepSeek nevű kínai startup, amelynek a – papíron – mindössze 5,6 millió dollárból fejlesztett DeepSeek-R1 AI modellje simán hozza ugyanazt a teljesítményt, mint a jelenlegi legjobb megoldások. Mindezt ráadásul úgy, hogy ehhez az azoknál használt erőforrások töredékére, mindössze 2 százalékára van szükség. Állítólag.
Ez ebben a formában konkrétan olyan, mintha valaki a sufniban összerakna egy ugyanolyan gyors autót, mint a Porsche 911 Turbo. Csak nem 3000, hanem 60 köbcentis motor lenne benne, amely 100 kilométeren két deci üzemanyagot fogyaszt. És ráadásul 100 millió forint helyett tízezerbe kerülne.
Irreálisan hangzik, de ahhoz mindenesetre ez is elég volt, hogy egyetlen nap alatt bedöntse a globális tech- és energiaszektor egy részét:
Történelmi bukás. Kép: Yahoo.
Az Nvidia a világtörténelem legnagyobb bukását elkönyvelve 589 milliárd dollárt vesztett az értékéből egyetlen nap alatt, miután a részvényei 17 százalékot zuhantak. De jelentősen csökkent a Microsoft, a Palantir, az AMD, az Alphabet (Google), Siemens Energy és GE Vernova részvények árfolyama is hétfőn.
Ennek oka, hogy ha tényleg igaz, amit a kínai startup állít, akkor nincs szükség óriási teljesítményű és drága hardverekre, videokártyákra, szuper-chipekre, adatközpontokra, valamint rengeteg energiára az AI szolgáltatások használatához.
A DeepSeek-R1 AI modellnek az online, felhő technológiát használó általános változata mellett létezik gépre telepíthető, speciális feladatokra optimalizált, azaz egyáltalán nem sokoldalú verziója is.
Tényleg jó?
Az tény, hogy az eddigi tesztek és vizsgálatok alapján az eredmények jók, legalábbis ami a válaszadást illeti, mert képgenerálásra (még) nem képes.
A kutatók méltatták a DeepSeeket amiatt, hogy kiválóan teljesít összetett érvelési feladatokban, különösen a matematika és a programozás terén.
A modell a ChatGPT o1 által is alkalmazott „gondolatlánc” megközelítést követi, amely lépésről lépésre dolgozza fel a lekérdezéseket, megkönnyítve ezzel a problémák megoldását. Tehát nem egyszerűen egy választ ad egy kérdésre, hanem egy összetett érvelési struktúrát épít fel. Ez időigényesebb, viszont az ilyen modellek kevésbé hajlamosak a hallucinációra és hazudozásra, mint a vetélytársaik.
És hogy mi a titok? Nos, a DeepSeek állítólag teljesen más megközelítést alkalmaz az információk kinyeréséhez és feldolgozásához, mint a riválisok, és ez a siker kulcsa.
A mérések szerint a DeepSeek teljesítménye kiváló. Kép: DeepSeek Twitter.
Az nem is lehet kérdés, hogy az egész AI-ökoszisztémát, ellátási láncot, hardverfejlesztést- és gyártást átalakíthatja a DeepSeek. Nem utolsó sorban pedig valóban elhozhatja a mesterséges intelligencia korát mindenki számára. Amennyiben tényleg valós az, amit kommunikálnak.
Mert hát van itt néhány dolog, ami kételyt ébreszthet az emberben, ha elkezd kicsit józan ésszel gondolkodni, és megpróbál bepillantani a rózsaszín felhő mögé.
Nem egy pici startup
Gyönyörű és romantikus a DeepSeek legendája, miszerint egy aprócska startupról van szó, amiben az egyetemről és főiskoláról frissen kikerült, feltörekvő ifjak bontogathatják szárnyaikat egy AI-őrült alapító védelme alatt. Csak hát ez egyszerűen nem igaz, mint ahogy az sem, hogy 5,6 millió dollárból fejlesztették a mesterséges intelligencia modellt, amely felforgatja a világot.
A 2019-ben alapított cég mögött egy Liang Wenfeng nevű üzletember és a High-Flyer Quant nevű hedge fund áll. Brutális méretű hardverfarmot hoztak létre, ahol legalább 10 ezer, de egyes állítások szerint 50 ezer Nvidia Tensor A-100 grafikus kártya dolgozik. Ennek legolcsóbb verziója 15 000 dollárba került az alapítás környékén.
Tehát minimum 150 millió dollárt költöttek csak a GPU (Graphics Processing Unit) hadseregre, de ez az összeg simán lehet ennek akár a tízszerese is.
És akkor még nem is beszéltünk a többi komponensről; a logisztikáról, a kutatóközpont létrehozásáról, illetve a munkatársakról. Az AI-szakértők iránt Kínában is hatalmas a kereslet, és a kutatókkal a vállalatnál extrémen jól bánnak. Zihan Wang egykori DeepSeek-alkalmazott állítása szerint ráadásul bőséges számítási erőforrásokhoz férhetett hozzá, és szabadságot kapott a kísérletezésre ebben a startupban. Olyan luxus ez manapság, amelyet nagyon kevesen kapnak meg a távol-keleti országban, pláne friss diplomásként.
Liang Wenfeng egy interjúban elárulta, hogy nem keresnek befektetőket, nem érdekli a pénz, és hierarchia sincs a DeepSeeknél.
A startupnak nincsenek kereskedelmi tervei, nem a bevételre fókuszál, és nyílt forráskódban gondolkodnak – állítják.
Ez őrülten hangzik, viszont ennek köszönhetően nem kell megfelelniük a kínai hatóságok által 2023-ban bevezetett új irányelveknek, amelyek elsősorban a fogyasztói alkalmazásokra fókuszálnak. Azaz a DeepSeeknek nem kell például magát regisztrálnia a megadott hivataloknál, elkerülhető a kötelező információ szolgáltatás, magyarán többé-kevésbé rejtve működhet.
Egészséges szkepticizmus vs. csoda
Nincs hierarchia? Nem számít a bevétel? Óriási a szabadság? Csak lapátoljuk a pénzt bármiféle üzleti terv nélkül? A kínai vállalatok egyszerűen nem így működnek. Ráadásul azt sem lehet tudni, hogy a kommunikált információk mennyire valósak. Azaz például azt, hogy tényleg olyan minimális-e az erőforrásigénye a modellnek, mint ahogy azt mondják.
Amennyi ígéretet és fogadkozást hallottam az elmúlt 20 évben a tech cégektől, már régen a metaverzumban kellene szörfölnünk a szemünkbe ültetett 3D 8K hologram kijelzők segítségével, méghozzá úgy, hogy mindent agyhullámokkal vezérlünk. Ennél pedig a valóság azért picit szürkébb és visszafogottabb.
Ilyen gyanús kijelentések mellett akár bőven benne van a pakliban, hogy akár százezernyi Nvidia csúcs-GPU is zakatol egy eldugott kínai telephelyen, gőzerővel dolgozva a kereséseken. És akkor az egész szuperhatékonyság csak egy nagy humbug.
Ráadásul az ember nem tud szabadulni a gondolattól, hogy a DeepSeek egy kínai állami projekt, amelybe hogy-hogy nem állami szervek pumpálják a pénzt. Cserébe pedig a felhasználók a világ minden tájáról küldik, megosztják az adataikat, a preferenciáikat, nem mellékesen hozzáférést adnak a gépükhöz, használják a weboldalt, és kattintanak a linkekre.
A feltételezett állami befolyást erősíti az is, hogy a DeepSeek bizonyos témákról, így például Hszi Csin-ping kínai elnök személyéről nem hajlandó kommunikálni:
Van, amiről nem hajlandó beszélni. Beépített cenzúrával rendelkezik.
De a mostani érdeklődéssel az információszerzésen kívül a DeepSeek önmagában alkalmas volt arra is, hogy megfektesse az amerikai tech cégeket, és óriási kokit adjon a kereskedelmi háború kiterjesztésével fenyegetőző Donald Trumpnak. A frissen beiktatott amerikai elnök ugyanis a közelmúltban hirdette meg technológiai forradalmát, amiben központi szerepet szán az AI megoldások fejlesztésének. Csak egyedül az infrastruktúra fejlesztését célzó Stargate projektre fél billió dollárt szánhat öt év alatt.
Nagyon komoly erődemonstráció lehet tehát a DeepSeek, amely felbukkanásával dollár-százmilliárdok füstöltek el a tőzsdén egy nap alatt. Fogalmunk sincs ugyanis, hogy hány ilyen csodafegyver állhat még készenlétben Kínában.
Nagyon úgy fest, hogy eljött az az idő, amikor nem kísérleti atomrobbantásokkal, és ballisztikus rakéták kilövésével fenyegetik egymást a nagyhatalmak, hanem mindent vivő startupokkal.
A DeepSeek, erődemonstráció kínai módra.
Nem véletlen tehát, hogy Karoline Leavitt, a Fehér Ház sajtótitkára szerint amerikai tisztviselők fontolgatják, hogy a nemzetbiztonság is komolyabban foglalkozik a mesterséges intelligenciával a kínai DeepSeek miatt. Sőt,
az amerikai haditengerészet „potenciális biztonsági és etikai aggályok” miatt már megtiltotta tagjainak a DeepSeek alkalmazásainak használatát.
De persze az is lehet, hogy a fiatal kínai zsenik tényleg megtalálták az AI Szent Grált, amely elhozza mindenki számára az olcsó és zöld mesterséges intelligenciát. Csak hát ilyen zűrzavaros geopolitikai időkben érdemes egészséges szkepticizmussal állni a csodához.