AcasăTEHNOLOGIE„Datele false”, următorul Big Thing al Inteligenței Artificiale

„Datele false”, următorul Big Thing al Inteligenței Artificiale

Microsoft va înceta să mai vândă un software care ghicește starea de spirit a unei persoane uitându-se la fața acesteia. Motivul:  procedura ar putea fi discriminatorie.

Dar există o altă abordare inedită pe care firmele de tehnologie o explorează: antrenarea IA pe imagini „sintetice” pentru a o face mai puțin părtinitoare.

Ideea este asemănătoare cu pregătirea piloților. În loc să exerseze în condiții imprevizibile din lumea reală, majoritatea vor petrece sute de ore folosind simulatoare de zbor concepute pentru a acoperi o gamă largă de scenarii diferite pe care le-ar putea experimenta în aer.

O abordare similară este adoptată pentru a antrena inteligența artificială, care se bazează pe date atent etichetate pentru a funcționa corect. Până de curând, software-ul utilizat pentru a recunoaște oamenii a fost antrenat pe mii sau milioane de imagini ale unor persoane reale, dar acest lucru poate necesita mult timp, poate fi invaziv și poate neglija o mare parte a populației.

În prezent, mulți producători de inteligență artificială folosesc imagini false sau „sintetice” pentru a antrena computerele pe o gamă mai largă de persoane, nuanțe de piele, vârste sau alte caracteristici, inversând în esență ideea că datele false sunt rele.

De fapt, dacă sunt utilizate în mod corespunzător, nu numai că vor face software-ul mai demn de încredere, dar vor transforma complet economia datelor

Mai mult de 50 de startup-uri generează în prezent date sintetice ca serviciu, potrivit StartUs Insights. Microsoft a făcut experimente în acest sens, iar Google lucrează cu istoricul medical generat artificial pentru a ajuta la prezicerea fraudelor de asigurare.

Amazon a declarat în ianuarie că folosește date sintetice pentru a depăși preocupările legate de confidențialitate. De asemenea, Facebook a achiziționat startup-ul de date sintetice AIReverie din New York în octombrie.

Datele false nu sunt folosite doar pentru a antrena sisteme de recunoaștere a vederii, ci și programe de predicție, cum ar fi cele pe care băncile le folosesc pentru a decide cine ar trebui să primească un împrumut.

Tendința devine atât de răspândită încât analiștii estimează că 60% din toate datele utilizate pentru antrenarea IA vor fi sintetice până în 2024 și vor umbri complet datele reale până în 2030.

Oricât de ciudat ar părea, creșterea datelor false este un pas în direcția corectă și nu doar pentru că evită utilizarea datelor personale ale oamenilor. Ar putea modifica dinamica vânzării de date. Comercianții cu amănuntul, de exemplu, ar putea genera venituri suplimentare prin vânzarea de date sintetice privind comportamentul de cumpărare al clienților, potrivit lui Fernando Lucini, director al  consultanței Accenture.

Totuși, trebuie făcută o avertizare cu privire la consecințele neintenționate: cu atât de multe date artificiale care ne conduc sistemele viitoare, care sunt riscurile ca unele dintre ele să fie folosite pentru fraudă sau să fie mai greu de găsit identități reale în mijlocul valului de identități false?

author avatar
Radu Jacotă Redactor
542 afisari
Zenville

Ultimele știri

proger