🇨🇳🇺🇸🌐Egy váratlan fordulattal a kínai mesterséges intelligencia startup, a DeepSeek, megelőzte az OpenAI ChatGPT-jét, és a legtöbbet letöltött ingyenes alkalmazássá vált az Apple amerikai App Store-jában.‼️
Ez az eredmény, amely példátlan egy kínai MI-termék esetében az Egyesült Államokban, sokkolta a globális techipart, megkérdőjelezve az Egyesült Államok mesterséges intelligencia terén betöltött dominanciájáról szóló régóta fennálló feltételezéseket, és vitákat indított a nyugati techóriások vezető szerepének fenntarthatóságáról.
A DeepSeek sikere annak köszönhető, hogy képes kiemelkedő teljesítményű MI-modelleket szállítani a versenytársaihoz képest töredéknyi költséggel. A vállalat legújabb modelljei, a DeepSeek-V3 és a DeepSeek-R1, elismerést arattak, mivel képességeik vetekszenek – sőt, néha felül is múlják – az olyan iparági vezetők, mint az OpenAI GPT-4 és a Meta Llama modelljeit.
Ami a DeepSeeket igazán különlegessé teszi, az a lenyűgöző költséghatékonyság. A cég szerint a DeepSeek-V3 kiképzése mindössze 6 millió dollárba került Nvidia H800 chipek használatával, ami eltörpül az amerikai cégek által hasonló modellek fejlesztésére költött milliárdok mellett.
A 2024 januárjának végén kiadott DeepSeek-R1 még ennél is tovább megy: a startup szerint 20-50-szer alacsonyabb költségekkel működik az OpenAI megoldásaihoz képest, a feladattól függően. Ez az elérhetőség forradalmasíthatja a fejlett MI-eszközökhöz való hozzáférést, lehetővé téve a kisebb vállalkozások és fejlesztők számára, hogy a legmodernebb technológiát használják anélkül, hogy az megfizethetetlen lenne számukra.
A siker ellenére a DeepSeek állításait szkepticizmus övezi. Alexandr Wang, a Scale AI vezérigazgatója egy CNBC-interjúban úgy vélekedett, hogy a startup akár 50 000 Nvidia H100 chipet is birtokolhat – egy szám, amely szerinte sértené az Egyesült Államok exportkorlátozásait, amelyek megtiltják az ilyen fejlett MI-chipek kínai vállalatoknak történő értékesítését. A DeepSeek nyilvánosan nem reagált ezekre a vádakra, de az üzenet világos: a kritikusok kétségbe vonják, hogy a cég eredményei a jelenlegi amerikai korlátozások mellett elérhetők lennének.
A Bernstein elemzői tovább szították a vitát, rámutatva, hogy bár a DeepSeek 5,58 millió dolláros számítási költségeket jelentett be a DeepSeek-V3-ra, a teljes kiképzési költségek – beleértve az adatbeszerzést, a mérnöki tehetségeket és az infrastruktúrát – valószínűleg jóval meghaladják ezt az összeget. A DeepSeek-R1 kiképzési költségeinek átláthatatlansága tovább erősítette a kételyeket. Ennek ellenére a startup gyors terjedése azt sugallja, hogy modelljei különösen rezonálnak a felhasználókkal, főként egy olyan piacon, amely éhes az olcsó, kiváló minőségű MI-megoldásokra.
A DeepSeek gyökerei a hangcsoui székhelyű High-Flyer kvantitatív fedezeti alaphoz vezethetők vissza, amelynek társalapítója, Liang Wenfeng irányítja az MI startupot. 2023 márciusában a High-Flyer bejelentette, hogy stratégiai irányváltást hajt végre, és az Általános Mesterséges Intelligencia (AGI) elérésére összpontosít, amelyet az OpenAI úgy definiál, mint az embereket gazdaságilag kritikus feladatokban meghaladó rendszereket. 2023 végére a DeepSeek vált e törekvés eszközévé.
Vállalati feljegyzések szoros kapcsolatot mutatnak a High-Flyer és a DeepSeek között: mindkettő ugyanazt az irodát használja, és a High-Flyer MI-chip klaszterekkel kapcsolatos szabadalmakat birtokol. Különösen figyelemre méltó, hogy a High-Flyer MI részlege már 2022-ben állítólag egy 10 000 chipből álló A100 klasztert működtetett, amely valószínűleg felgyorsította a DeepSeek fejlődését. Bár a High-Flyer pontos befektetései nem ismertek, a fedezeti alap pénzügyi ereje és technikai szakértelme szilárd alapot nyújt a DeepSeek számára.
A DeepSeek sikere nem kerülte el a kínai politikai vezetés figyelmét. 2024. január 20-án, a DeepSeek-R1 piacra dobásának napján, az alapító Liang Wenfeng részt vett egy zártkörű szimpóziumon, amelyet Li Qiang miniszterelnök vezetett, jelezve Peking támogatását. Ez összhangban áll Kína szélesebb stratégiájával, amely a mesterséges intelligencia és más stratégiai technológiák terén való önellátásra törekszik, annak ellenére, hogy az Egyesült Államok exportkorlátozásokat vezetett be a fejlett félvezetők terén.
A kínai kormány az MI-t a globális befolyásért folytatott harc kritikus frontvonalának tekinti, és a DeepSeek áttörései az ellenállóképesség narratíváját kínálják. Azáltal, hogy bebizonyítja, hogy a hazai innováció szankciók mellett is virágozhat, a startup Peking politikai céljait testesíti meg. Ugyanakkor kérdések merülnek fel azzal kapcsolatban, hogy a DeepSeek hogyan szerezte be számítási erőforrásait, és hogy megkerülte-e az amerikai korlátozásokat – egy téma, amely tovább élezheti a technológiai hidegháborút.
A DeepSeek felemelkedése mérföldkő az MI versenyben. Mindössze egy évvel azután, hogy a ChatGPT elindítása rávilágított az amerikai és kínai MI képességek közötti feltételezett szakadékra, a DeepSeek megfordította a narratívát. Modelljei nemcsak, hogy beérték a versenytársakat, hanem példátlan költséghatékonyságot is elértek, ami arra kényszeríti a Szilícium-völgyet, hogy újragondolja megközelítését.
A DeepSeek sikere nem csupán egy vállalati mérföldkő – ez egy geopolitikai jelzés. A startup Kína eltökéltségét testesíti meg az MI vezető szerepének megszerzésében, kreativitást és alkalmazkodóképességet kihasználva ellensúlyozva a külső korlátozásokat. Az MI verseny felgyorsulásával a DeepSeek története azt üzeni: a mesterséges intelligencia korában a hatalmi egyensúly többé nem előre eldöntött tény.