AcasăTEHNOLOGIECursa IA: jucătorii modelelor lingvistice

Cursa IA: jucătorii modelelor lingvistice

Evoluția rapidă a modelelor lingvistice de mari dimensiuni (LLM) a declanșat o cursă fără precedent între giganții tehnologici și startup-uri deopotrivă

Evoluția rapidă a modelelor lingvistice de mari dimensiuni (LLM) a declanșat o cursă fără precedent între giganții tehnologici și startup-uri deopotrivă.

Această competiție nu se referă doar la superioritatea tehnologică, ci și la conturarea viitorului muncii, educației și interacțiunii om-mașină.

De la Gemini la Deep Seek

Gemini: Google Gemini este construit pe vasta infrastructură de căutare și cloud a companiei, ceea ce îl face un concurent formidabil. Datele preliminare sugerează că modelul ar putea atinge o precizie de 90% în sarcinile de subtitrare a imaginilor, conform testelor interne, deși, potrivit Modern Diplomacy, cifrele exacte rămân confidențiale.

Claude: axate pe siguranța inteligenței artificiale, modelele Claude pun accentul pe fiabilitate și considerații etice. Claude 3, lansat la începutul anului 2024, a fost antrenat cu IA constituțională, fiind unul dintre cele mai transparente și controlate modele.

Copilot de la Microsoft: se pretinde că îmbunătățește eficiența codării cu până la 55%, reducând timpul petrecut de dezvoltatori cu scrierea codului prin automatizarea sarcinilor de rutină. Această integrare în fluxul de lucru exemplifică modul în care LLM-urile devin instrumente indispensabile în industriile tehnologice.

Llama: seria Llama de la Meta acordă prioritate accesului open-source. Llama 3, lansat în 2024, oferă performanțe și capacități și mai mari, inclusiv raționament îmbunătățit, codificare și suport multilingv. 

Grok: este conceput pentru implicarea în timp real și integrarea în rețelele sociale. Grok 2, integrat în X (fostul Twitter), valorifică conținutul generat de utilizatori pentru a îmbunătăți acuratețea conversațiilor.

DeepSeek: ca răspuns al Chinei la dominația IA occidentală, DeepSeek a făcut progrese semnificative în aplicațiile de cercetare științifică. DeepSeek 2, cu un set de date extins de conținut chinezesc și multilingv, câștigă teren în mediul academic și în soluțiile  IA ale întreprinderilor.

Inovație, cotă de piață, date

Concurența este alimentată de trei factori-cheie: inovarea, cota de piață și datele. Fiecare model se întrece pentru a-și îmbunătăți capacitățile, fie prin seturi de date mai mari, algoritmi mai buni sau arhitecturi noi, precum Pathways de la Google.

Cota de piață este la fel de importantă, deoarece companiile încearcă să atragă utilizatorii în ecosistemele lor. Integrarea Copilot de către Microsoft în suita sa de produse este un prim exemplu al acestei strategii.

Cu toate acestea, datele sunt inima LLM-urilor. Cu cât un model poate accesa mai multe date, cu atât performanțele sale sunt mai bune. Acest lucru a dus la preocupări cu privire la confidențialitate și la utilizarea etică a datelor, în special pe măsură ce modele precum Grok accesează fluxurile de social media în timp real.

Legea privind inteligența artificială a Uniunii Europene, care urmează să intre în vigoare în august 2025, vizează reglementarea practicilor, însă punerea în aplicare rămâne o provocare.

author avatar
Radu Jacotă Redactor
249 afisari

1 COMENTARIU

  1. dintre toate modelele prezentate cele mai bune sunt:
    1. pentru generare cod sursa in limbajele clasice de programare este copilot-ul de la microsoft. Principala problema este aceea ca nu reuseste sa implenteze algoritmii descrisi foarte precis. De exemplu implementarea unor algoritmi eficienti de generare a unor combinatii de numere cu anumite conditii este problematica. Insa pentru comenzi si explicatii ale utilizarii acestora este brici
    2. Cel mai bun motor de rezolvare a problemelor de matemayica cel mai bine optimizat este modelul deepseek. Ofera solutii foarte bune pentru problemele de teoria numerelor, problemelor de numarare, ecuatii algebrice. Modelul celor de la chat gbt este greoi si da foarte multe rateuri. Solutii incomplete si uneori fara nicio legatura cu problema analizata.
    3. Generare de text din diferite domenii cel mai bun este modelul google gemini. Ofera solutii excelente pentru generarea rezumatelor pt diverse opere literare, comentarii, lectii de biologie, chimie, limbi straine uzuale etc.
    Despre celelate modele prezentate mai au pana sa atinga un nivel acceptabil pentru a solutiona diversele probleme si subiecte propuse spre solutionare.

    In plus dintre toate modelul deepseek poate fi instalat foarte usor pe un calculator personal, antrenat in anumite domenii – de exemplu lectii de fizica mecanica- si apoi accesat de la distanta pentru a desfasura diferite lectii de ex lectiile pt capitolul de macanica de liceu. Nu este totusi convenabil ca ocupa cam 30 gb din hdd in urma antrenarii, insa informatiile sunt de calitate. Un update de saptamana trecuta ofera posibilitatea de a actualiza lista de siteuri de unde cauta informatia solicitata. Si totul este gratis pentru a desfasura orele de scoala. La chatgbt varianta profesionala presupune utilizarea unui cont si achizitia unui abonament. Datorita faptului ca modelul deepseek este libervpt desfasurarea orelor de clasa varianta chatgbt nu am testat-o in varianta cu abonament.

Comments are closed.

Zenville

Ultimele știri

proger