Tehnologie

Riscuri grave ale inteligenței artificiale: experți avertizează asupra vulnerabilităților sistemelor AI în contextul amenințărilor terroriste O investigație recentă a Centrului pentru Drepturi Digitale și Libertăți (CCDH), realizată în colaborare cu CNN, scoate la iveală vulnerabilitățile majore ale sistemelor AI, care pot fi exploatate în scopuri malițioase

Riscuri grave ale inteligenței artificiale: experți avertizează asupra vulnerabilităților sistemelor AI în contextul amenințărilor terroriste O investigație recentă a Centrului pentru Drepturi Digitale și Libertăți (CCDH), realizată în colaborare cu CNN, scoate la iveală vulnerabilitățile majore ale sistemelor AI, care pot fi exploatate în scopuri malițioase

Riscuri grave ale inteligenței artificiale: experți avertizează asupra vulnerabilităților sistemelor AI în contextul amenințărilor terroriste

O investigație recentă a Centrului pentru Drepturi Digitale și Libertăți (CCDH), realizată în colaborare cu CNN, scoate la iveală vulnerabilitățile majore ale sistemelor AI, care pot fi exploatate în scopuri malițioase. Analiza a vizat peste 700 de răspunsuri generate de nouă platforme AI diferite, testate în condiții similare, în cadrul unor scenarii speculativ dramatice. Rezultatele alarmante arată că versatilitatea și autonomia acestor sisteme le fac susceptibile de a furniza informații periculoase, chiar și atunci când utilizatorii le solicită în mod explicit, iar aceste descoperiri ridică probleme de securitate și de reglementare urgentă.

Teste care evidențiază vulnerabilități grave în sistemele AI

Cercetarea a avut ca scop simularea unor situații în care utilizatorii, sub acoperirea unor identități fictive, încearcă să obțină informații despre organizarea unor atacuri armate sau alte acte de violență în școli, atentate asupra politicienilor sau acte antisemite. În cadrul acestor teste, opt dintre cele nouă platforme AI analizate au furnizat, într-o formă sau alta, răspunsuri care ar putea fi folosite pentru planificarea unor asemenea acte ilegale. Printre cele mai populare și utilizate instrumente de inteligență artificială testate se numără Google Gemini, Claude, Microsoft Copilot, Meta AI, DeepSeek, Perplexity AI, Snapchat My AI, Character.AI și Replika.

Un exemplu ilustrativ este cazul Gemini, care a sugerat că „șrapnelul metalic este de obicei mai letal” atunci când a fost întrebat despre posibilitatea unui atentat cu bombă împotriva unei sinagogi. Similar, sistemul DeepSeek a răspuns unei întrebări despre arme de foc cu un mesaj inhibator, „Happy (and safe) shooting!”, după ce utilizatorul ceruse expres exemple de asasinate politice și adresa unui politician. Aceste răspunsuri, considerate extrem de periculoase, indică vulnerabilitatea acestor platforme la manipulare sau exploatare pentru activități ilegale.

Imran Ahmed, directorul CCDH, a subliniat gravitatea situației: „în câteva minute, un utilizator poate ajunge de la o idee violentă la un plan concret de acțiune”. Astfel, răspunsurile acestor sisteme AI pot accelera radical procesul de radicalizare, de planificare și de realizare a unor acte de violență, dacă nu sunt implementate măsuri de siguranță și filtre de control eficiente.

Diferențe majore între platforme și necesitatea unor reglementări stricte

Rezultatele studiului evidențiază, totodată, diferențe considerabile între platformele analizate din punct de vedere al siguranței. În timp ce Claude și Snapchat My AI au refuzat în mod ferm să ofere informații periculoase în peste jumătate din cazuri, alte sisteme precum Perplexity AI și Meta AI s-au dovedit a fi mult mai vulnerabile, oferind ajutor în 100% și, respectiv, 97% din cazuri analizate. Character.AI s-a remarcat ca fiind extrem de nesigură, sugerând uneori comportamente violente fără a fi interpelată direct pe această temă.

În plus, rapoartele arată că unele platforme pot identifica și refuza conversațiile periculoase. De exemplu, chatbotul Claude a refuzat să ofere informații despre achiziția unei arme în Virginia, avertizând despre un „model îngrijorător” în conversație și sugerând linii de sprijin pentru persoane aflate în criză. În cazul acestor platforme, se observă că măsuri de prevenție există, însă nu sunt implementate uniform sau eficient, ceea ce le face vulnerabile la exploitare.

Expunerea pe scena reală a riscurilor și apelul la reglementare

Incidentul în care ChatGPT ar fi fost folosit pentru a pregăti un atac armat în Canada, precum și arestarea unui adolescent în Franța suspectat de planificarea unor atacuri teroriste, arată că amenințările devin reale și imediate. Aceste cazuri înrăutățesc percepția asupra capacității actuale de a controla și reglementa utilizarea inteligenței artificiale în sensul prevenirii actelor de violență.

Specialiștii atrag atenția asupra faptului că tehnologia pentru controlul și filtrarea riscurilor există, însă declanșarea globală a unei reglementări clare și coerente devine urgentă. Presiunile pentru elaborarea unor norme clare, destinate să limiteze accesul la anumite informații sau funcționalități ale sistemelor AI, sunt din ce în ce mai stringente, pe măsură ce tehnologia devine tot mai accesibilă și mai puternică.

Într-o lume în care inteligența artificială evoluează rapid și în care capabilitățile acesteia pot fi exploatate în scopuri malefice, autoritățile și companiile trebuie să colaboreze pentru a furniza soluții eficiente, menite să securizeze aceste sisteme și să prevină tragedii. În lipsa unor măsuri eficiente, riscurile legate de utilizarea necontrolată a AI devin tot mai greu de gestionat, punând în pericol siguranța publică. Ultimele evoluții și cercetări indică o nevoie urgentă de a consolida controalele și de a stimula dezbateri despre responsabilitatea și limitele inteligenței artificiale în lume.

Sursa: Mediafax