AI a atins deja nivelul de competență al medicilor la diagnostice. Specialiștii avertizează că testele abia încep

AI a atins deja nivelul de competență al medicilor la diagnostice. Specialiștii avertizează că testele abia începmedicina AI / sursa foto: dreamstime.com

Modelele de inteligență artificială testate în spitale și clinici din Statele Unite au ajuns să ofere diagnostice comparabile cu cele ale medicilor în anumite situații, potrivit unor studii recente publicate de cercetători de la universități și companii de tehnologie implicate în dezvoltarea acestor sisteme, conform informațiilor furnizate de publicația Nature.

Rezultatele sugerează că instrumentele bazate pe inteligență rtificială ar putea deveni tot mai prezente în sistemele medicale, însă specialiștii avertizează că există încă numeroase întrebări legate de siguranță, responsabilitate și integrarea lor în practica clinică de zi cu zi.

Un model AI a depășit medicii

Un studiu publicat în aprilie în revista Science a analizat performanța modelului de inteligență artificială o1, dezvoltat de OpenAI, în evaluarea cazurilor prezentate într-un departament de urgență din Boston.

Cercetătorii au comparat diagnosticele generate de sistem cu cele formulate de doi medici participanți la experiment. Potrivit rezultatelor, modelul AI a oferit un diagnostic corect sau foarte apropiat de cel final în 67% dintre cazuri. În comparație, medicii au atins o rată de aproximativ 50-55%.

Autorii studiului subliniază însă că atât medicii, cât și sistemul AI au lucrat exclusiv pe baza informațiilor deja înregistrate în fișele pacienților. Niciuna dintre părți nu a avut contact direct cu pacienții, ceea ce limitează aplicabilitatea concluziilor în practica medicală reală.

Google a testat un chatbot medical care discută direct cu pacienții

O altă cercetare, publicată pe platforma arXiv înainte de evaluarea academică formală, a analizat performanțele unui sistem dezvoltat de Google Research, denumit AMIE (Articulate Medical Intelligence Explorer).

Sistemul a comunicat prin mesaje text cu persoane programate la consultații de urgență într-o clinică din Boston. Conversațiile au avut loc cu până la cinci zile înainte de întâlnirea pacienților cu medicii.

Pe baza informațiilor colectate, AMIE a generat liste de posibile diagnostice. Diagnosticul final s-a regăsit printre primele trei sugestii ale sistemului în 75% dintre cazuri și a fost prima recomandare în 56% dintre situații.

Performanțele au fost similare cu cele ale medicilor care au consultat ulterior pacienții. Totuși, cercetătorii au observat că planurile de tratament propuse de medicii umani au fost mai practice și mai eficiente din punct de vedere al costurilor.

Specialiștii cer teste clinice extinse înainte de utilizarea pe scară largă

Experții consideră că evoluția modelelor lingvistice de mari dimensiuni din ultimii ani este remarcabilă. Dacă anterior aceste sisteme erau evaluate în principal prin teste teoretice sau examene medicale standardizate, în prezent ele sunt capabile să analizeze cazuri complexe folosind date reale.

Cu toate acestea, medicul Adam Rodman de la Harvard Medical School, implicat în ambele cercetări, afirmă că nu există încă suficiente dovezi privind siguranța utilizării autonome a acestor tehnologii.

Potrivit acestuia, următorul pas esențial îl reprezintă studiile clinice de amploare, care să analizeze impactul real asupra pacienților și asupra sistemelor medicale.

Google pregătește deja un astfel de studiu la nivel național în Statele Unite pentru a testa AMIE într-un cadru mai apropiat de practica medicală obișnuită.

Riscul recomandărilor eronate rămâne o preocupare majoră

În paralel cu evaluarea performanțelor, cercetătorii încearcă să măsoare și riscurile asociate utilizării inteligenței artificiale în medicină.

AI secventiere AND

AI secventiere AND / sursa foto: chatgpt

David Wu, medic rezident și cercetător în domeniul AI la Harvard Medical School, a declarat că interesul său pentru acest subiect a crescut după ce un sistem medical bazat pe inteligență artificială i-a oferit o recomandare pe care a considerat-o periculoasă în timpul testării.

Împreună cu alți specialiști, Wu dezvoltă metoda NOHARM (Numerous Options Harm Assessment for Risk in Medicine), destinată evaluării potențialelor efecte negative generate de recomandările oferite de modelele AI.

Rezultatele preliminare publicate la finalul anului 2025 indică faptul că, în cazul a 31 de modele lingvistice analizate, recomandările cu potențial de a provoca prejudicii severe au apărut în aproximativ 22% dintre situațiile evaluate.

Cum ar putea schimba AI sistemul medical

În ciuda limitărilor actuale, cercetătorii consideră că inteligența artificială poate reduce povara administrativă asupra personalului medical și poate contribui la îmbunătățirea accesului la servicii de sănătate.

Sistemele AI sunt deja utilizate pentru redactarea notițelor medicale, analizarea documentelor clinice sau formularea unor sugestii preliminare privind diagnosticul și tratamentul.

Karandeep Singh, specialist în inteligență artificială medicală la University of California, San Diego, consideră că viitorul nu aparține unor „medici virtuali” complet autonomi, ci unor echipe medicale în care tehnologia și profesioniștii din sănătate colaborează.

Potrivit acestuia, relația de încredere dintre medic și pacient rămâne un element pe care tehnologia nu îl poate înlocui.