Un chat-bot IA (inteligența artificială) dezvoltat de China aproape că a egalat capacitățile concurenților de top fabricați în SUA, iar firma sa-mamă susține că a realizat această soluție la o fracțiune din costul plătit de ceilalți – totul în ciuda controalelor puternice ale exporturilor din SUA menite să blocheze accesul China la microcipuri de vârf, care alimentează IA. Luni, 27 ianuarie 2025, știrile despre un model creat de firma chineză de inteligență artificială DeepSeek a șters 1 trilion de dolari, într-o singură zi, de pe indicele Nasdaq 100 al SUA, inversând săptămânile și lunile de câștiguri pe o piață încălzită, condusă de credința într-un viitor dominat de Inteligența Artificială (IA).
Producătorul de cipuri Nvidia a fost cel mai prost situat, pierzând aproape 600 de miliarde de dolari. Modelul DeepSeek a fost ”instruit” pe cipurile mai ieftine și mai vechi ale Nvidia și nu pe produsele sale de ultimă oră, care sunt sancționate pentru vânzare în China. Acum bursele chineze sunt închise pentru Anul Nou Lunar, dar probabil că vor avea un recul la redeschidere săptămâna aceasta, deși DeepSeek nu este tranzacționat public. O parte din discuțiile din media din SUA despre DeepSeek sunt exagerate, cum ar fi afirmația că modelul său AI a costat doar 5,5 milioane de dolari pentru a fi dezvoltat. După cum declară acționarii DeepSeek, acesta a fost costul cursei finale de formare a modelului, fără a include cercetarea, echipamentul, salariile și alte costuri implicate. DeepSeek a fost ”instruit” pe cipurile H800 ale Nvidia, care, după cum subliniază un articol din China-Talk, au fost concepute pentru a se sustrage sancțiunilor impuse de cipurile din SUA, sancțiuni instituite în octombrie 2022.
Cea mai nouă rundă de sancțiuni americane a început abia la sfârșitul lui 2023 — prea târziu pentru a afecta modelul DeepSeek. Efectul DeepSeek asupra industriei IA din Statele Unite este încă remarcabil. Piețele depind întotdeauna în parte de o povestire, iar două povești au determinat boom-ul IA. Prima a fost că IA va transforma radical economia. A doua a fost că evoluțiile în IA ar necesita investiții din ce în ce mai mari, ceea ce ar deschide un decalaj pe care concurenții mai mici nu l-ar putea închide. DeepSeek tocmai a făcut o gaură în această idee. Toate acestea înseamnă că amplificatorii IA din Statele Unite au nevoie de o nouă poveste pentru investitori și este clar care doresc să fie acea narațiune: că IA este noua cursă spațială dintre Statele Unite și China – și că DeepSeek este, în cuvintele senatorului democrat de New York, Chuck Schumer, un „moment Sputnik”. Problema cu această narațiune este că succesul DeepSeek nu este un produs al guvernului chinez. Există o mulțime de finanțări guvernamentale chineze promise sectorului IA, cum ar fi 1 trilion de yuani promis de Banca Chinei.
Dar DeepSeek a fost dezvoltat în esență ca un proiect de cercetare de către managerul fondurilor speculative Liang Wenfeng, pe un model complet open-source, necomercial, cu finanțare proprie. Cu toate acestea, acum că DeepSeek are succes, este probabil ca guvernul chinez să-l preia. Vom vedea. Liang a participat deja la o întâlnire importantă cu premierul chinez Li Qiang săptămâna trecută. China are un palmares de a face campioni naționali din firmele care ies triumfătoare din jungla darwiniană a economiei private. Dincolo de asta succesul DeepSeek ar putea să genereze un caz pentru investiții guvernamentale masive în sectorul IA. Chatbot-ul IA al DeepSeek, un rival direct al ChatGPT, este capabil să îndeplinească unele sarcini la același nivel cu modelele lansate recent de la OpenAI, Anthropic și Meta, în ciuda afirmațiilor că a costat o fracțiune din bani și timp pentru a se dezvolta. Lansarea modelului R1 de la DeepSeek săptămâna trecută și ascensiunea sa în vârful App Store al Apple a declanșat o vânzare de acțiuni tehnologice. Acțiunile tehnologice din Asia au scăzut marți, peste noapte, în urma crizei de pe Wall Street. Microsoft, Meta, Alphabet, Amazon și Oracle au alocat 310 de miliarde de dolari în 2025 pentru cheltuieli de capital, care includ infrastructura IA, conform datelor compilate de Visible Alpha. Astfel de estimări s-au bazat pe premisa că vor fi necesare cantități uriașe de putere de calcul pentru a avansa capabilitățile IA. Dar capacitatea lui DeepSeek de a concura cu o fracțiune din bugetul OpenAI – care a fost evaluat recent la 157 de miliarde de dolari – și rivalii Anthropic, Google și Meta, au ridicat întrebări cu privire la sumele uriașe care sunt virate în sistemele de antrenament.
Ce este DeepSeek? Startup-ul DeepSeek a fost fondat în 2023 în Hangzhou, China și a lansat, mai târziu în acel, an primul său model de IA. CEO-ul său, Liang Wenfeng, a co-fondat anterior unul dintre cele mai importante fonduri speculative din China, High-Flyer, care se concentrează pe tranzacționarea cantitativă bazată pe inteligență artificială. Fondul, până în 2022, a adunat un grup de 10.000 de cipuri de procesoare grafice de înaltă performanță A100 de la Nvidia din California, care sunt folosite pentru a construi și a rula sisteme IA, potrivit unei postări din acea vară pe platforma chineză de socializare WeChat. La scurt timp după, SUA au restricționat vânzările acestor cipuri către China. DeepSeek a spus că modelele sale recente au fost construite cu cipurile H800 de la Nvidia, cu performanțe scăzute, care nu sunt interzise în China, trimițând un mesaj că cel mai sofisticat hardware ar putea să nu fie necesar pentru cercetarea AI de vârf.
O lucrare de cercetare publicată acum 10 zile – în aceeași zi cu învestirea președintelui Donald Trump – a declanșat panica care a urmat. Lucrarea a fost despre un alt model DeepSeek AI numit R1, care a arătat abilități avansate de „raționament” – cum ar fi capacitatea de a-și regândi abordarea unei probleme de matematică – și a fost semnificativ mai ieftin decât un model similar vândut de OpenAI numit o1. În spatele dramei legate de capacitățile tehnice ale DeepSeek se află o dezbatere în SUA cu privire la modul cel mai bun de a concura cu China în ceea ce privește inteligența artificială. DeepSeek R1 este momentul Sputnik al IA, cu referire la lansarea satelitului din 1957, care a declanșat o cursă de explorare spațială în timpul Războiului Rece între Uniunea Sovietică și SUA. Anunțul DeepSeek de săptămâna trecută seamănă cu lansarea unui nou telefon de către compania chineză Huawei, sancționată de SUA, în timpul discuțiilor diplomatice cu privire la controalele la export ale administrației Biden în 2023.
Un lucru care distinge DeepSeek de concurenți precum OpenAI este că modelele sale sunt „open source” – ceea ce înseamnă că componentele cheie sunt libere pentru acces și modificare pentru oricine, deși compania nu a dezvăluit datele pe care le-a folosit pentru antrenament. Dar ceea ce a atras cea mai mare admirație despre modelul R1 de la DeepSeek este ceea ce Nvidia numește un „exemplu perfect de Test Time Scaling” – sau atunci când modelele IA își arată în mod eficient modul de gândire și apoi îl folosesc pentru instruire ulterioară, fără a fi nevoie să le alimenteze cu noi surse de date. Ce ne răspunde R1 când are întrebări grele? De exemplu, răspunsurile de la o versiune a R1 descărcată de pe o platformă de dezvoltator au descris fotografia „omul și tancului” din Piața Tienanmen (cred că cei mai în vârstă și-o aduc aminte) ca fiind o „emblemă universală a curajului și a rezistenței împotriva regimurilor opresive”.
De asemenea, întreține ideea că Taiwanul este un stat independent, deși spune că aceasta este o problemă „complexă și cu mai multe fațete”. DeepSeek spune: „Din punct de vedere juridic și funcțional, acționează independent, dar la nivel internațional, statutul său este în mare măsură influențat de factori politici.” Cel mai recent Chatbot de inteligență artificială construit în China de autoritățile chineze din domeniul cercetării (nu este vorba de R1) este instruit pe doctrina președintelui Xi Jinping, într-o reamintire clară a parametrilor ideologici pe care modelele chinezești de inteligență artificială ar trebui să-i respecte. Academia de spațiu cibernetic din China a anunțat la începutul acestei săptămâni un chatbot-ul instruit pe modelul Xi Jinping Thought (Gândul lui Xi Jinping), o doctrină care promovează „socialismul cu caracteristici chinezești”.
Chatbot-ul a fost instruit pe șapte baze de date, dintre care șase erau în mare parte legate de tehnologiile informaționale furnizate de organul de supraveghere al internetului din China, Cyberspace Administration of China sau CAC. Xi Jinping Thought a fost a șaptea bază de date pe care a fost instruit Chatbot-ul, potrivit unui post al serviciului de mesagerie WeChat al revistei CAC despre modelul IA. Gândul Xi Jinping – cunoscut și sub numele de „Gândirea Xi Jinping despre socialismul cu caracteristici chineze pentru o nouă eră” – este alcătuit din 14 principii, inclusiv asigurarea puterii absolute a Partidului Comunist Chinez, consolidarea securității naționale și a valorilor socialiste, precum și îmbunătățirea mijloacelor de trai și a bunăstării oamenilor. R1 este prima ”lebăda neagră” a industrie IT care a prăbușit speranțele investitorilor în IA de pe Wall Street.
Post Scriptum: ”liaotin jqren”-este caracterul chinezesc pentru „chatbot”. ”liaotin” în această expresie se referă la „conversație” sau „chat”, în timp ce ”jqren” desemnează „robotul” sau „mașina”.
Daca era „aproape ca i-a egalat” nu era atata tevatura, dar se pare ca „aproape i-a intrecut” si la capitalisti acest aproape inseamna bani si perspective ca pierd. Oricum se stia de mai demult de DeepSpeek, era functional intern in China de mai demult abia acum nu au putut sa-l mai ascunda in vest si castelul de carti ca de obicei se prabuseste la o „adiere de vant”.Multi au spus ca bula IA din SUA nu va rezista mult, dari ei sau autoamagit. Ce-i acum e doar inceputul.