Cercetarea a fost realizata de Mass General Brigham din Massachusetts si publicata in JAMA Network Open. Specialistii au analizat modul in care modelele de inteligenta artificiala interpreteaza cazuri clinice si cat de corecte sunt concluziile acestora.Cum au fost testate modelele de inteligenta artificialaStudiul a folosit 29 de scenarii clinice construite pe baza unor texte medicale de referinta. Chatbotilor le-au fost oferite treptat informatii despre pacienti, inclusiv simptome, observatii din consultatii si rezultate ale analizelor. In total, au fost evaluate 21 de modele lingvistice dezvoltate de companii precum OpenAI, Google, Anthropic, xAI si DeepSeek.Rezultatele arata ca, atunci cand informatiile sunt incomplete, toate modelele testate au oferit diagnostice gresite in peste 80% din cazuri.Chiar si atunci cand au avut acces la toate datele necesare, performanta nu a fost constanta. Rata erorilor a ramas peste 40%, desi in unele situatii anumite modele au reusit sa identifice corect diagnosticul in pana la 90% dintre cazuri.De ce apar aceste eroriSpecialistii explica faptul ca acuratetea raspunsurilor depinde in mare masura de volumul si calitatea informatiilor primite. Cu toate acestea, chiar si in conditii ideale, modelele pot induce in eroare utilizatorii. Motivul principal este fenomenul cunoscut drept ,,halucinatii” in inteligenta artificiala. Acesta apare atunci cand un model genereaza raspunsuri care par plauzibile, dar care nu sunt sustinute de date reale sau suficiente.Studiul subliniaza limitele actuale ale utilizarii chatbotilor in domeniul medical. Desi pot fi utili pentru informare generala, acestia nu pot inlocui evaluarea realizata de un medic.