it之家 11 月 20 日消息,谷歌今日正式推出了全新圖像生成與編輯模型 nano banana pro (gemini 3 pro image)。該模型基於 gemini 3 pro 架構構建,號稱能以“前所未有的控制力、完美的文字渲染效果以及增強的世界知識儲備”,將用戶的構想轉化為“工作室級(studio-quality)”的設計作品。相比今年 9 月發布、因生成超寫實 3d 手辦而走紅的初代模型,此次更新代表了谷歌在圖像生成領域的又一次重要躍升。

即日起,nano banana pro 面向全球用戶開放免費試用。用戶只需登錄 gemini 應用,選擇“生成圖像(create image)”功能,並切換至“thinking”模式即可體驗這一最新模型。
據谷歌介紹,nano banana pro 在處理複雜信息方面表現出色,能夠生成包含豐富上下文的信息圖表,直觀呈現天氣、體育賽事等實時數據。
該模型的一大突破在於其文本渲染能力。無論是簡短的標語還是長段落文本,nano banana pro 都能清晰、準確地將其直接渲染在圖像中。這一特性使其極具實用性,非常適合製作多種語言版本的海報或邀請函。此外,模型還具備強大的合成能力,支持在一個畫面中融合最多 14 張圖像素材和多達 5 個人物主體。


據it之家了解,在編輯功能上,nano banana pro 引入了更高級的創意控制選項。用戶不僅可以對圖像進行局部選擇與編輯,還能調整攝像機角度、添加背景虛化(bokeh)效果、改變焦點、進行專業色彩分級(color grading),甚至自由切換日夜光照效果。在輸出規格方面,模型支持多種長寬比,最高可生成 4k 分辨率的高清圖像。

值得注意的是,所有經由 nano banana pro 生成或編輯的圖像都將嵌入 c2pa 元數據。隨着行業規範的逐步建立,這一舉措旨在幫助用戶更容易地在搜索結果和社交媒體中識別生成式 ai 內容及深度偽造(deepfakes)。就在本周,tiktok 也宣布將採用 c2pa 元數據為 ai 生成內容添加隱形水印。
目前,免費版 nano banana pro 用戶擁有一定的使用限額,而 google ai plus、pro 和 ultra 的訂閱用戶則享有更多配額。此外,美國的 google ai pro 和 ultra 訂閱用戶可通過搜索功能中的“ai 模式”使用該模型,全球 notebooklm 科研助手用戶亦可直接調用。