Noul model AI de la Anthropic, Claude 4 Opus, ar putea notifica autoritățile sau presa dacă detectează comportamente „extrem de imorale”

Funcția controversată a fost activată doar în teste interne, dar ridică semne de întrebare legate de autonomie și supraveghere digitală.
Cercetătorii avertizează utilizatorii să evite instrucțiuni care oferă AI-ului libertate totală în contexte etice sensibile.
Deși funcția de „whistleblower” nu este activă în versiunile publice, existența ei a stârnit critici dure din partea comunității AI și a dezvoltatorilor.

Claude 4 Opus, modelul nou al Anthropic, poate contacta direct autoritățile sau presa, dacă ajunge să considere că vrei să faci ceva „extrem de imoral”.

„Recomandăm utilizatorilor să fie precauți cu instrucțiuni precum acestea care invită la un comportament cu nivel ridicat de autonomie în contexte care ar putea părea discutabile din punct de vedere etic”, scrie Anthropic în documentul care însoțește lansarea noului model.

„Dacă acesta consideră că faci ceva extrem de imoral, de exemplu, falsificarea datelor într-un test farmaceutic, va folosi instrumente de linie de comandă pentru a contacta presa, pentru a contacta autoritățile de reglementare, pentru a încerca să te blocheze din sistemele relevante sau toate cele de mai sus”, atenționează și Sam Bowman, unul dintre cercetătorii Anthropic.

Recomandări

VIAȚĂ VEȘNICĂ ÎN CLOUD

YOUTUBE ELIMINĂ DEEPFAKE LA CERERE

ȘTIINȚA PRINDE ARIPI

Partenerii noștri

Compania nemțească Zalando își închide un centru de distribuție: 2,700 de posturi de muncă, în pericol Mediafax

INTERVIU. De unde provin puiul şi cartofii de la KFC? Bogdan Cheţa, Sphera Group: Peste 95% din carnea de pui vine din România, pe când cartofii sunt din import. Dezvoltăm însă un parteneriat local care ar putea să ne asigure 100% cantitatea necesară Ziarul Financiar

O cafenea din Bucureşti a fost aleasă în top 100 mondial. Care este localul selectat din peste 38.000 de concurenţi? Business Magazin

Condiția pusă de Putin pentru a salva Europa. Rusia așteaptă un semnal urgent și ferm Media FLUX