Microsoft își lansează propriul DALL-E. MAI-Image-1, generatorul de imagini A.I. „făcut în casă”

Cho Yee-Jun

5 luni ago

Este primul generator text-to-image creat intern de Microsoft
A intrat deja în top 10 LMArena, între cele mai bune modele AI vizuale
Este rapid, fotorealist și antrenat cu feedback de la artiști reali
Face parte din familia de modele MAI (Microsoft AI)
Lansarea marchează un pas clar spre independența Microsoft față de OpenAI

Când Microsoft a spus că vrea să-și facă „propriul creier artificial”, n-a glumit. Compania a anunțat MAI-Image-1, primul său generator de imagini creat integral in-house, fără ajutorul OpenAI sau al altor parteneri externi.

Modelul este capabil să transforme prompturile text în imagini fotorealistice — și, spun inginerii din Redmond, o face mai rapid decât modelele mari și lente din industrie.

MAI-Image-1 este deja în top 10 pe LMArena, platforma unde oamenii compară rezultatele între modele precum DALL-E, Midjourney sau Stable Diffusion. Pentru un debut, e un start serios.

De la partenerul OpenAI la concurent direct

Microsoft a fost ani la rând principalul finanțator al OpenAI și „motorul” din spatele ChatGPT și DALL-E. Dar odată cu lansarea familiei MAI (Microsoft AI), compania vrea să-și reducă dependența de colaboratori și să-și construiască propriul ecosistem AI.

MAI-Image-1 vine alături de MAI-Voice-1 (generator de voce) și MAI-1-preview (chatbot conversațional). Împreună, ele formează începutul unei suite de modele care ar putea alimenta viitoarele versiuni de Copilot, Bing Image Creator sau aplicațiile din Microsoft 365.

Pe scurt, Redmond vrea să-și facă „inteligența” în casă — și să nu mai depindă de nimeni.

Cum arată „artistul digital” al Microsoft

MAI-Image-1 a fost antrenat cu ajutorul artiștilor vizuali și fotografilor profesioniști, pentru a evita efectele artificiale și repetitivitatea vizuală care bântuie multe modele text-to-image.

Compania spune că modelul se descurcă excelent cu:

imagini fotorealistice (nori, peisaje, reflexii, piele umană);
lumină naturală și umbre complexe;
texturi detaliate, fără glitch-uri vizibile;
viteze de generare mai mari decât media pieței.

Practic, MAI-Image-1 promite să fie un mix între viteză și estetică, iar primele mostre publicate de Microsoft arată surprinzător de „curate” — fără acel vibe de „AI art” ușor ciudat.

„Am vrut un model care să inspire designerii, nu să-i înlocuiască”, au spus reprezentanții echipei MAI.

De ce e mai mult decât un simplu experiment

Dincolo de hype-ul creativ, MAI-Image-1 reprezintă o mutare strategică.

După ani de colaborare intensă cu OpenAI, Microsoft vrea acum control total asupra propriilor modele, atât din motive comerciale, cât și etice.

Compania spune că va continua investițiile în filtre anti-bias, mecanisme de protecție a conținutului și transparență în datele de antrenament. În același timp, un model intern oferă Microsoft libertate de personalizare pentru viitoarele sale produse — de la PowerPoint la Xbox.

Pe termen lung, e posibil ca MAI-Image-1 să devină standardul implicit pentru toate imaginile generate în ecosistemul Microsoft.

Concurența ar trebui să se teamă?

Deocamdată, MAI-Image-1 nu a fost lansat public, dar primele teste îl plasează aproape de nivelul Midjourney și DALL-E 3. Diferența?

Modelul Microsoft pare mai eficient și mai rapid, un avantaj uriaș pentru integrarea directă în aplicații de lucru.

Totuși, succesul va depinde de cât de bine va gestiona riscurile etice (fake-uri, conținut sensibil, bias vizual) și cât de repede va evolua față de rivalii deja consacrați.

Dacă totul merge conform planului, e posibil ca următorul slide PowerPoint cu peisaje impecabile sau prezentarea din Copilot să provină chiar de la MAI-Image-1.