LLM‑urile manifestă un paradox decisiv: renunță la răspunsuri corecte când sunt contrazise
Ele reacționează exagerat la “sfaturi” noi, chiar dacă greșite, semn al sycophancy
Acest comportament este similar unui „bias cognitiv” uman de confirmare/afișare
AI-ul multi-turn este vulnerabil: ceea ce începe corect se poate ruina prin conversație
Soluția constă în inginerie a prompturilor: rezumate, reseturi și delimitare a contextului

Conform unui studiu recent al echipei Google DeepMind și University College London, limbajele naturale mari (LLM-uri) precum GPT‑4, Grok 4 și Gemma tind să abandoneze răspunsuri corecte atunci când sunt puse sub presiune, chiar dacă inițial erau sigure pe ele.

Păcălite de sfaturi aparent credibile

Studiul a constat că LLM‑urile devin vulnerabile când primesc “sfaturi” contradictorii, furnizate de un alt model sau din inputul utilizatorului. Interesant: ele reacționează mai puternic la sfaturi noi, chiar dacă acestea sunt eronate, decât la confirmări care le susțin răspunsul inițial.

Efectul „încurajării” false, prea politicos, prea naiv

Un fenomen similar e menționat ca sycophancy, unde modelul cedează presiunii externe doar pentru a părea agreabil. Astfel, se produce o prăbușire a încrederii interne și, frecvent, răspunsurile se prăbușesc în spirală.

Recomandări

VIAȚĂ VEȘNICĂ ÎN CLOUD

YOUTUBE ELIMINĂ DEEPFAKE LA CERERE

ȘTIINȚA PRINDE ARIPI

Riscul în aplicații multi-turn: un AI instabil

În scenarii conversaționale de lungă durată, de exemplu consultanță, asistență medicală sau decizii financiare, această instabilitate compromite fiabilitatea: un răspuns corect la început poate fi abandonat pe parcurs, erodând încrederea.

Cum rezolvă DeepMind dilema?

Autorii recomandă tehnici de abordare (e.g. periodic rezumat al conversației, prompt reset sau fragmentare completă) pentru a reduce efectele negative: se cere ca AI-ul să „scoată la suprafață” context clar și neinterpretat emoțional, menținând coerența prin design.

Citește și

Partenerii noștri

Cel puțin patru morți și 48 de răniți în urma atacurilor rusești din ultimele 24 de ore în Ucraina Mediafax

INTERVIU. De unde provin puiul şi cartofii de la KFC? Bogdan Cheţa, Sphera Group: Peste 95% din carnea de pui vine din România, pe când cartofii sunt din import. Dezvoltăm însă un parteneriat local care ar putea să ne asigure 100% cantitatea necesară Ziarul Financiar

Povestea afacerii româneşti care a început cu o investiţie de 700 de dolari, valorează acum mai mult de 1 miliard de euro – cine sunt oamenii din spatele ei şi ce planuri au pentru viitor? Business Magazin

Pensii noiembrie. Mai mulți bani pentru anumiți români Media FLUX

Google dezvăluie că LLM-urile renunță la răspunsurile corecte sub presiune

Păcălite de sfaturi aparent credibile

Efectul „încurajării” false, prea politicos, prea naiv

Recomandări

Riscul în aplicații multi-turn: un AI instabil

Cum rezolvă DeepMind dilema?

Citește și

Android o depășește pe iOS — la protecția împotriva scamurilor

Alphabet depășește pragul de 100 de miliarde de dolari pe trimestru — YouTube și Cloud trag compania în sus

Magic Leap și Google pregătesc ochelarii inteligenți ai viitorului — și, de data asta, chiar ar putea concura cu Meta