近年來,微軟在產品和服務中大量依賴OpenAI的人工智能模型。除了Phi系列的小型語言模型外,微軟並未自主開發出任何重大AI模型。今年8月,微軟首次發布了兩款自主研發的AI模型:MAI-Voice-1和MAI-1-preview。而今日,微軟又宣布了其第三款自主模型——MAI-Image-1,一款用於圖像生成的模型,將直接與OpenAI的gpt-image-1和Google的Gemini/Imagen展開競爭。
據微軟介紹,MAI-Image-1旨在為創作者帶來真實價值。研發團隊在訓練過程中,着重避免模型產生重複或過度風格化的輸出,並通過嚴格的數據篩選和以任務為導向的細緻評估來實現這一目標。微軟表示,MAI-Image-1在生成逼真圖像和自然風景等方面表現尤為突出。
微軟還強調,該模型在生成速度方面遠超市場上其他大型模型。用戶能夠更快地生成所需圖像並進行迭代,提升創作效率。
在LMArena的Image Arena平台——一個面向社區驅動AI基準測試的開放平台上,微軟MAI-Image-1首次登場便位列第9。雖然這一排名暫不算頂尖,但對於微軟而言,是首款完全自主開發模型取得的堅實成績。目前,字節跳動、OpenAI、Google和騰訊在排行榜中領先於微軟。
微軟AI CEO Mustafa Suleyman在X(原Twitter)平台表示,微軟將繼續優化模型,力爭在排行榜上更進一步。
隨着微軟不斷優化該模型,創作者與業界也在密切關注,期待其對現有行業領軍者發起挑戰。