- NVIDIA introduce Nemotron 3 Super, un model creat pentru sisteme de agentic AI
- Folosește 120 miliarde de parametri, dar activează doar 12 miliarde pentru eficiență
- Promite până la 5x viteză mai mare și costuri semnificativ reduse
- Vine cu un context uriaș de 1 milion de tokeni și tehnologii hibride
- Este lansat open-source, cu date și instrumente pentru dezvoltatori
Pe 11 martie 2026, NVIDIA a anunțat lansarea modelului Nemotron 3 Super, poziționat ca o soluție pentru o problemă tot mai vizibilă în industrie: costurile ridicate ale sistemelor de inteligență artificială complexe.
Advertisment
Nu este vorba despre un chatbot obișnuit. Modelul este construit pentru agentic AI, adică acele sisteme în care mai mulți agenți AI colaborează, iau decizii și rezolvă sarcini în mai mulți pași — de la analiză de documente până la automatizare complexă.
În astfel de scenarii, costurile cresc rapid. Fiecare „pas de gândire” înseamnă procesare, iar fiecare procesare înseamnă bani. Aici intervine promisiunea NVIDIA: mai multă eficiență fără compromis major de performanță.
De ce devine AI-ul „cu agenți” atât de scump
Problema nu este dimensiunea modelului, ci modul în care este folosit.

Într-un sistem de agentic AI:
- agenții comunică între ei,
- procesează contexte foarte lungi,
- revin asupra deciziilor în mai multe etape.
Rezultatul? Explozie de tokeni procesați și, implicit, de costuri.
Nemotron 3 Super atacă exact acest punct sensibil printr-o arhitectură „mixture-of-experts”. Deși modelul are 120 de miliarde de parametri, doar aproximativ 12 miliarde sunt activi la un moment dat.
Este ca și cum ai avea o echipă mare de specialiști, dar doar cei relevanți pentru sarcina curentă intră în joc. Restul „stau pe bancă”, economisind resurse.
Cum funcționează motorul din spate: viteză, context și eficiență
Modelul combină mai multe tehnologii avansate, dar ideea centrală este simplă: procesează mai mult, mai rapid și mai ieftin.

Printre elementele cheie:
- context de până la 1 milion de tokeni, suficient pentru documente foarte lungi sau conversații extinse,
- integrarea de Mamba layers și transformers, pentru echilibru între viteză și precizie,
- multi-token prediction, care generează mai multe cuvinte simultan, nu unul câte unul.
NVIDIA susține că aceste optimizări duc la:
- până la 5x mai mult throughput (viteza de procesare),
- până la 2x mai multă acuratețe față de modelul anterior.
În plus, folosirea formatului NVFP4 pe GPU-urile Blackwell reduce consumul de memorie și accelerează inferența de până la 4 ori față de generația precedentă.
De ce NVIDIA a ales să „deschidă” modelul către dezvoltatori
Un detaliu care schimbă regulile jocului: Nemotron 3 Super este lansat cu greutăți open și o licență permisivă.

Asta înseamnă că dezvoltatorii pot:
- descărca modelul,
- înțelege cum a fost antrenat,
- construi aplicații proprii pe baza lui.
Pachetul include:
- peste 10 trilioane de tokeni de date de antrenament,
- 15 medii pentru reinforcement learning,
- rețete de evaluare și optimizare.
Modelul este disponibil pe platforme precum Hugging Face sau build.nvidia.com, ceea ce îl face accesibil rapid pentru ecosistemul AI.
Strategia este clară: NVIDIA nu mai vrea doar să vândă hardware, ci să devină un jucător central în dezvoltarea de modele AI.
De ce această lansare contează mai mult decât pare
Dincolo de specificații, lansarea indică o schimbare de direcție în industrie.
Până acum, cursa în inteligență artificială a fost despre modele mai mari. Acum începe să fie despre modele mai eficiente.

Nemotron 3 Super nu promite doar „mai mult AI”, ci „AI mai sustenabil economic”. Iar asta este esențial într-un moment în care companiile încearcă să transforme experimentele AI în produse reale.
Rămâne de văzut cât de bine se confirmă aceste promisiuni în practică. Dar un lucru este clar: viitorul agentic AI nu va fi decis doar de inteligență, ci și de cost. Iar NVIDIA încearcă să câștige exact această bătălie.
Citește și
- Iran vrea taxe în Bitcoin pentru petrolierele din Hormuz. Experimentul crypto care agită piața petrolului
- Sam Altman propune schimbări majore pentru economie în era Inteligenței Artificiale: taxe pe averi, impozite pentru roboți și săptămână de lucru de 4 zile
- Google avertizează: un computer cuantic ar putea sparge Bitcoin în câteva minute
Partenerii noștri