- OpenAI a lansat marți două modele lingvistice open-weight, gpt-oss-120b și gpt-oss-20b, optimizate pentru raționament avansat și rulare locală.
- Modelele open-weight oferă acces public la parametrii antrenați, permițând dezvoltatorilor să le regleze fără a avea datele originale de antrenament.
- Aceste modele diferă de cele open-source, care oferă acces complet la cod, date și metodologii.
OpenAI a anunțat marți că a lansat două modele lingvistice open-weight, care excelează în raționamentul avansat și sunt optimizate pentru a rula pe laptopuri cu niveluri de performanță similare cu modelele sale proprietare de raționament mai mici, scrie Reuters.
Advertisment
OpenAI lansează gpt-oss-120b și gpt-oss-20b
Parametrii sau greutățile antrenate ale unui model lingvistic cuopen-weight sunt accesibile publicului, putând fi utilizate de dezvoltatori pentru a analiza și regla modelul pentru sarcini specifice, fără a necesita date de antrenament originale.
„Unul dintre aspectele unice ale modelelor deschise este faptul că oamenii le pot rula local. Oamenii le pot rula în spatele propriului firewall, pe propria infrastructură”, a declarat Greg Brockman, cofondator al OpenAI, într-o conferință de presă.
Modelele lingvistice cu open-weightă sunt diferite de modelele open-source, care oferă acces la codul sursă complet, datele de antrenare și metodologiile.
Peisajul modelelor AI open-weight și open-source a fost foarte disputat în acest an. Pentru o perioadă, modelele Llama ale Meta au fost considerate cele mai bune, dar acest lucru s-a schimbat la începutul acestui an, când DeepSeek din China a lansat un model de raționament puternic și rentabil, în timp ce Meta se străduia să lanseze Llama 4.
Cele două noi modele OpenAI sunt primele modele deschise lansate de OpenAI de la GPT-2, care a fost lansat în 2019.
Modelul mai mare al OpenAI, gpt-oss-120b, poate rula pe un singur GPU, iar al doilea, gpt-oss-20b, este suficient de mic pentru a rula direct pe un computer personal, a declarat compania.
OpenAI a afirmat că modelele au performanțe similare cu modelele sale proprii de raționament numite o3-mini și o4-mini și excelează în special la codificare, matematică competitivă și întrebări legate de sănătate.
Modelele au fost antrenate pe un set de date numai text care, pe lângă cunoștințe generale, s-a concentrat pe cunoștințe de știință, matematică și codificare. OpenAI nu a publicat benchmark-uri care să compare modelele open-weight cu modelele concurenților, cum ar fi modelul DeepSeek-R1.
OpenAI, susținută de Microsoft, evaluată în prezent la 300 de miliarde de dolari, strânge în prezent până la 40 de miliarde de dolari într-o nouă rundă de finanțare condusă de Softbank Group.