Cinci chatboți cu inteligență artificială utilizați pe scară largă oferă răspunsuri problematice la întrebări despre sănătate și medicină, arată un studiu recent. Cercetarea, publicată în BMJ Open, a testat Gemini, DeepSeek, Meta AI, ChatGPT și Grok. Rezultatele ridică semne de întrebare cu privire la utilizarea acestor instrumente în domeniul medical, fără o supraveghere mai atentă.
Răspunsuri înșelătoare și informații incomplete
Cercetătorii au supus chatboții la 50 de întrebări în cinci categorii predispuse la dezinformare, inclusiv cancer, vaccinuri și nutriție. Solicitările au fost concepute pentru a obține sfaturi potențial înșelătoare. Dintr-un total de 250 de răspunsuri, aproape jumătate (49,6%) au fost evaluate ca fiind problematice. Dintre acestea, 19,6% au fost clasificate ca fiind extrem de problematice.
Studiul a scos la iveală performanțe diferite în funcție de subiect. Chatboții au oferit cele mai bune răspunsuri în cazul întrebărilor despre vaccinuri și cancer, iar cele mai slabe în domeniul celulelor stem, nutriției și performanței atletice. Calitatea citărilor a fost, de asemenea, o problemă. Instrumentele au returnat referințe solicitate în proporție de 81%, dar gradul de completitudine a fost de doar 40%. Niciun chatbot nu a reușit să genereze o listă de referințe completă și precisă.
Dificultăți de înțelegere și riscuri de dezinformare
O altă constatare îngrijorătoare este că răspunsurile generate de chatboți erau greu de înțeles pentru o persoană obișnuită, fiind accesibile mai degrabă celor cu studii superioare. Această caracteristică ar putea limita utilitatea lor pentru pacienți și persoane fără pregătire medicală. Cercetătorii au remarcat că implementarea continuă a acestor instrumente în unitățile medicale, fără o supraveghere adecvată, riscă să amplifice dezinformarea.
Grok a înregistrat cele mai problematice răspunsuri dintre chatboți, în timp ce nu s-au identificat diferențe semnificative de performanță între ceilalți. De asemenea, solicitările deschise, care permit răspunsuri mai ample, au generat un număr mai mare de răspunsuri problematice comparativ cu cele închise, de tipul da/nu.
În februarie 2025, autorii studiului au adresat întrebările care au generat rezultatele problematice.
Sursa: Mediafax