Atacul MINJA permite hackerilor să injecteze informații false în memoria AI-ului, influențând răspunsurile acestuia fără acces direct.
Acest atac poate afecta modele AI mari, precum GPT-4, unde 95% dintre încercările de manipulare au avut succes, afectând 70% din răspunsurile generate.
Protecția împotriva atacurilor MINJA necesită selecția atentă a informațiilor memorate, detectarea datelor false și limitarea accesului la memorie pentru a preveni stocarea automată a tuturor informațiilor.

Modelele AI care își amintesc conversațiile anterioare devin tot mai populare, dar o nouă amenințare pune în pericol siguranța acestora: atacul MINJA (Memory Injection Attack). Cercetătorii au descoperit o metodă prin care atacatorii pot modifica memoria unui AI fără să aibă acces direct la el, doar prin interacțiuni normale.

Cum funcționează atacul MINJA?

Atacul se bazează pe injectarea de informații false în memoria AI-ului. Practic, un utilizator rău intenționat poate trimite mesaje special create, iar AI-ul le reține și le folosește ulterior, afectând răspunsurile pentru alți utilizatori.

Exemplu:
– Un AI folosit pentru cumpărături online poate începe să recomande produse greșite.
– Un AI dintr-un spital ar putea asocia informații despre un pacient cu altul, ceea ce ar putea duce la diagnosticări greșite.

Recomandări

VIAȚĂ VEȘNICĂ ÎN CLOUD

YOUTUBE ELIMINĂ DEEPFAKE LA CERERE

ȘTIINȚA PRINDE ARIPI

Atacul funcționează și pe modele AI mari

Cercetătorii au testat atacul MINJA pe GPT-4 și GPT-4o de la OpenAI și au descoperit că:
– 95% dintre încercările de a introduce date false au avut succes.
– 70% dintre răspunsurile AI au fost afectate de aceste manipulări.

Atacul este periculos pentru că pare natural, deci este greu de detectat de sistemele de securitate.

Ce putem face pentru a ne proteja?

Pentru îmbunătățirea securității, modelele AI trebuie să fie mai selective în ceea ce memorează, să detecteze date false înainte de a le folosi în conversații viitoare și să limiteze accesul la memorie, evitând stocarea automată a tuturor informațiilor.

Atacul MINJA arată cât de vulnerabile sunt modelele AI cu memorie și de ce trebuie protejate mai bine. Cu AI-ul integrat în tot mai multe domenii, securitatea sa devine esențială pentru toată lumea.

Citește și

Partenerii noștri

Compania nemțească Zalando își închide un centru de distribuție: 2,700 de posturi de muncă, în pericol Mediafax

INTERVIU. De unde provin puiul şi cartofii de la KFC? Bogdan Cheţa, Sphera Group: Peste 95% din carnea de pui vine din România, pe când cartofii sunt din import. Dezvoltăm însă un parteneriat local care ar putea să ne asigure 100% cantitatea necesară Ziarul Financiar

În spatele uneia dintre cele mai discrete familii de miliardari se ascunde o poveste care pare aproape imposibil de crezut: cum o decizie luată în anii ’70 a transformat complet harta transportului mondial Business Magazin

Anunțul zilei privind plata pensiilor și salariilor! Ce se întâmplă cu mica recalculare a pensiilor potrivit noului ministru al Muncii Media FLUX

Hackerii se joaca cu mintea chatbotilor AI. Planteaza minciuni in memoria robotilor ca sa ajunga la tine

Cum funcționează atacul MINJA?

Recomandări

Atacul funcționează și pe modele AI mari

Ce putem face pentru a ne proteja?

Citește și

Meta își „antrenează” AI-ul urmărind angajații. Când munca zilnică devine materie primă pentru algoritmi

Google atacă Nvidia cu noile cipuri TPU. Începe războiul pentru controlul infrastructurii AI

Orb-ul lui Sam Altman ajunge pe Tinder și Zoom: cum vrea Silicon Valley să dovedească cine e om și cine e AI