DALL-E 2 同源:機器學習研究員分享「文本到寶可夢」圖像生成器

在經歷了九代《精靈寶可夢》之後,玩家們有時難免吐槽開發者只是從帽子里隨機抽取單詞,然後觀察它們到底會在玩家群體中引發怎樣的化學反應。對於抱着「這麼搞我也行」心態的粉絲,這裡有一款獨特的人工智能生成器可以推薦給大家。

來自 Lambda Labs 的機器學習研究員 Justin Pinkney,剛剛分享了通過微調 Stable Diffusion 而創建的一個「文本轉寶可夢」生成器。

此前我們已經多次跟進報道過 OpenAI 的 DALL-E 2 繪圖 AI 的相關進展,而「text to Pokémon」也與它同源。

為了實現這一目的,Pinkney 對 AI 模型開展了關於寶可夢的專項描述訓練。

比如「妙蛙種子」(Bulbasaur)被描述為「紅眼綠皮」,而「綠毛蟲」(Caterpie)則被打上了「紅鼻黃綠玩具」的標籤。

Pinkney 在 Twitter 上進一步解釋稱,一旦對模型完成了微調,大家都可輕鬆生成類似風格的圖像。

想要使用這款 OpenAI 文本到圖像生成器的朋友,只需鏈接你的 GitHub 賬戶,然後就可以輕鬆上手。

在此過程中,你可以切換圖像輸出的數量、去噪的步驟、以及無分類器引導的規模。

有趣的是,許多網友試着向「text to Pokémon」生成系統輸入了自己的名字,結果讓人忍俊不禁。