Studiu Stanford, publicat în JAMA Network Open (august 2025), a testat AI-uri medicale de top
GPT-4o și Claude 3.5 Sonnet au trecut testele standard, dar au scăzut cu 25-40% la întrebări reformulate
Experimentul a demonstrat că AI-ul se bazează pe tipare lingvistice, nu pe raționament clinic
Modelele au performat cel mai slab în sarcini administrative și de suport decizional medical
Concluzia: AI-ul poate fi un ajutor valoros, dar doctorii rămân indispensabili

Un studiu publicat în JAMA Network Open 2025 arată că modelele de inteligență artificială de ultimă generație, precum GPT-4o de la OpenAI sau Claude 3.5 Sonnet de la Anthropic, trec cu brio testele medicale standard.

Problema? Dacă formulezi întrebarea puțin altfel, rezultatele se prăbușesc. GPT-4o a pierdut 25% din precizie, iar Llama-3 aproape 40%, atunci când cercetătorii au introdus răspunsul „none of the other answers” ca opțiune corectă.

Experimentul care a pus AI-ul în încurcătură

Cercetătorii de la Stanford University, coordonați de doctoranda Suhana Bedi, au vrut să testeze dacă aceste modele chiar „înțeleg” medicina sau doar reproduc tipare de limbaj.

Recomandări

VIAȚĂ VEȘNICĂ ÎN CLOUD

YOUTUBE ELIMINĂ DEEPFAKE LA CERERE

ȘTIINȚA PRINDE ARIPI

Ei au modificat întrebările din MedQA, un set de termeni medicali, și au observat cum algoritmii s-au blocat.

„E ca un student care știe perfect grilele, dar intră în panică atunci când întrebările sunt puse altfel”, a explicat Bedi.

De ce AI-ul nu gândește ca un clinician

Studiul scoate la iveală limita fundamentală: modelele AI nu fac raționament clinic, ci doar prezic următorul cuvânt.

În lumea reală, pacienții vin cu date incomplete, simptome amestecate și detalii subtile. Tocmai aici, AI-ul se clatină: nu poate lega fragmentele într-un tablou coerent, așa cum o face un medic.

Consecințe pentru spitale și pacienți

Într-un moment în care spitalele testează AI-ul pentru sarcini administrative și diagnostic asistat, mesajul studiului este clar: AI-ul poate sprijini, dar nu poate înlocui medicii.

„Până când aceste sisteme vor reuși să performeze consecvent în scenarii noi, rolul lor trebuie limitat la asistență cu supraveghere umană”, avertizează autorii studiului.

De ce ar trebui să ne pese

Întrebarea nu mai este dacă AI-ul poate memora manuale medicale, ci dacă poate lua decizii în viața reală, unde mizele sunt viața și sănătatea pacienților.

Pentru moment, răspunsul rămâne nu. Și poate e bine așa: mai degrabă un doctor obosit care știe să citească printre rânduri decât un algoritm care se blochează la o virgulă pusă altfel.

Citește și

Partenerii noștri

HOROSCOP 8 decembrie 2025. Început de săptămână promițător. Zodiile care au parte de vești bune Mediafax

INTERVIU. De unde provin puiul şi cartofii de la KFC? Bogdan Cheţa, Sphera Group: Peste 95% din carnea de pui vine din România, pe când cartofii sunt din import. Dezvoltăm însă un parteneriat local care ar putea să ne asigure 100% cantitatea necesară Ziarul Financiar

De la 12 ani ştia că va conduce un imperiu hotelier, iar astăzi, la 26, chiar face acest lucru. Cum şi-a propus românul David Aron să dezvolte un brand hotelier răspândit în ţară? „Vârsta nu e un minus”, spune el Business Magazin

Inedit! Loc de muncă în Germania plătit cu 23.000 de euro pentru 3 luni Media FLUX

A.I.-ul medical ia 10 la test, dar pică la practică. De ce doctorii nu pot fi înlocuiți

Experimentul care a pus AI-ul în încurcătură

Recomandări

De ce AI-ul nu gândește ca un clinician

Consecințe pentru spitale și pacienți

De ce ar trebui să ne pese

Citește și

Studiu Stanford. Mașinile electrice iubesc traficul aglomerat — condusul „blând” le face mai mult rău decât bine

Un implant cerebral de la Stanford poate „citi” gândurile nerostite, și are chiar și o parolă mentală

Cercetătorii de la Stanford și Bristish Columbia vor să nu mai ai access la internet