谷歌發布 AI 圖像生成新工具 Whisk,支持上傳多張圖片以圖生圖

it之家 12 月 17 日消息,谷歌今日發布了一款名為 whisk 的全新 ai 圖像生成工具,該工具允許用戶使用其他圖像作為提示來生成圖像,而不需要冗長的文本提示。用戶只需提供圖像,即可指定 ai 生成圖像的主題、場景和風格。

使用 whisk 時,用戶可以為主題、場景和風格分別提供多張圖像作為提示。(當然,用戶仍然可以選擇使用文字提示。)如果手頭沒有合適的圖像,用戶還可以點擊骰子圖標,由谷歌自動填充一些圖像作為提示(這些圖像似乎也是 ai 生成的)。此外,用戶還可以在流程的最後階段在文本框中輸入一些文字,以添加關於目標圖像的額外細節,但這並非必需步驟。

whisk 隨後會生成圖像,並為每張圖像生成相應的文本提示。如果用戶對生成結果滿意,可以選擇收藏或下載圖像;如果需要進一步調整,則可以通過在文本框中輸入更多文字或點擊圖像並編輯文本提示來進行優化。

it之家注意到,谷歌在一篇博文中強調,whisk 的設計初衷是「快速的視覺探索,而非像素級的精細編輯」。該公司還表示,whisk 可能會出現「偏差」,因此允許用戶編輯底層的提示。

據體驗者稱,在短暫的使用過程中,whisk 帶來了有趣的體驗。圖像生成需要幾秒鐘的時間,雖然生成的圖像有時會有些奇怪,但所有生成的內容都易於迭代修改。

谷歌表示,whisk 使用的是其最新一代的 imagen 3 圖像生成模型,該模型也於今日發布。