Meta 的Make-A-Scene AI將人類和計算機的想像力融合到算法藝術中

2022年07月16日03:40:32 科技 1813

它將尖端的文本到圖像生成與手繪草圖輸入相結合。

Meta 的Make-A-Scene AI將人類和計算機的想像力融合到算法藝術中 - 天天要聞

輸入文字生成圖像的AI算法目前大熱,OpenAI的Craiyon(以前的DALL-E mini)和谷歌的Imagen AI釋放出了由人類和計算機想像力合成的奇妙怪異的程序生成藝術的浪潮。本周二,Meta公司透露,它也開發了一個人工智能圖像生成引擎,它希望這將有助於在元宇宙中建立沉浸式的世界,並創造出高級數字藝術。

在使用人工智能生成引擎時,僅憑 "醫院裏有一匹馬 "這句話就能創造出一個圖像,這需要大量的工作。首先,這句話本身被送入一個轉化器模型,這是一個神經網絡,可以解析句子中的單詞,並對它們之間的關係形成上下文理解。一旦掌握了用戶描述的要點,人工智能將使用一組GAN(生成對抗網絡)合成一個新的圖像。

由於近年來努力在日益擴大的高清晰度圖像集上訓練ML模型,並對文本描述進行精心策劃,今天最先進的人工智能可以創造出逼真的圖像,無論你給它們提供什麼胡言亂語。不同的人工智能的具體創造過程是不同的。

Meta 的Make-A-Scene AI將人類和計算機的想像力融合到算法藝術中 - 天天要聞

Meta AI

例如,谷歌的Imagen使用擴散模型,根據今年6月的一個關鍵詞博客顯示:"它學習將隨機點的模式轉換為圖像。這些圖像首先從低分辨率開始,然後逐步提高分辨率"。 另一方面,谷歌的Parti人工智能,"首先將一組圖像轉換為一連串的代碼條目,類似於拼圖片。然後將一個給定的文本提示翻譯成這些代碼條目,並創建一個新的圖像"。

雖然這些系統可以創建向其描述的大多數東西,但用戶對輸出圖像的具體方面沒有任何控制。Meta首席執行官馬克-扎克伯格在周二的博客中表:"為了實現人工智能推動創造性表達的潛力,人們應該能夠塑造和控制系統生成的內容。"

該公司的 "探索性人工智能研究概念 "被稱為Make-A-Scene,正是通過將用戶創建的草圖納入其基於文本的圖像生成,輸出一個2,048 x 2,048像素的圖像。這種組合使用戶不僅可以描述他們在圖像中想要的東西,而且還可以決定圖像的整體構成。扎克伯格說:"它展示了人們如何使用文字和簡單的圖畫來更具體地傳達他們的願景,使用各種元素、形式、安排、深度、構圖和結構"。

在測試中,一個人類評估小組壓倒性地選擇了文字加圖畫的圖像,而不是僅有文字的圖像,因為它與原始草圖的一致性更好(99.54%的時間),與原始文字描述的一致性更好(66%的時間)。為了進一步發展這項技術,Meta公司與包括Sofia Crespo、Scott Eaton、Alexander Reben和Refik Anadol在內的知名人工智能藝術家分享其Make-A-Scene演示,他們將使用該系統並提供反饋。目前還沒有關於該人工智能何時向公眾開放的消息。

科技分類資訊推薦

徹底火了,庫存告急!訂單已排到半月後 - 天天要聞

徹底火了,庫存告急!訂單已排到半月後

近期,「充電寶召回」 事件引發廣泛關注,3C認證已成為消費者衡量充電寶品質的關鍵指標,國內部分機場也加強了對充電寶3C標識的查驗力度。央視財經記者探訪發現,線下市場和電商平台帶有3C標識的充電寶產品銷量都出現增長。
理髮店陷入倒閉潮?不是沒客人,也不是電商衝擊,是自己作垮了 - 天天要聞

理髮店陷入倒閉潮?不是沒客人,也不是電商衝擊,是自己作垮了

很多人抱怨行業不好,再加上電商衝擊,所以經營起來也是相當困難。可是有這麼一個行業,電商根本進駐不進來。在這個行業,大家經營全靠本事,誰有能力誰賺錢。但是即便是這樣,為了賺塊錢,行業內的人還是將這個行業給徹底做臭了。各種各樣的套路層出不窮,甚
大疆OSMO 360 完整規格 7月29日發佈 - 天天要聞

大疆OSMO 360 完整規格 7月29日發佈

對於那些一直在等待大疆 Osmo 360 的人來說,聽到在本月底7月29日開售的消息,你們一定會很高興。今天我偶然發現了這兩款產品的完整網店描述和圖片已經上線。所以,我們先來深入了解一下那款「革命性 8K」 Osmo 360 的描述。
iPhone一鍵降溫?蘋果這隱藏模式有點過分啊 - 天天要聞

iPhone一鍵降溫?蘋果這隱藏模式有點過分啊

為了解決發熱這亘古難題,手機廠商絞盡腦汁,往手機里塞散熱膜、均熱板、填充硅脂,甚至還用上了主動風扇。 但到了夏天三四十度的室外,該發熱還是發熱,該燙手還是燙手。 國產安卓如此。 ....
三星Galaxy S26Ultra不裝了,性能太炸裂了! - 天天要聞

三星Galaxy S26Ultra不裝了,性能太炸裂了!

三星Galaxy S26 Ultra即將亮相,帶來多方面升級。·該機型將採用6.9英寸QHD+LTPO AMOLED顯示屏,支持120Hz自適應刷新率和3000尼特峰值亮度,確保在各種光照條件下都能提供清晰的視覺體驗。
中集洋山集裝箱第三季度訂單飽滿 開拓氫能集成裝備求新|公司調研 - 天天要聞

中集洋山集裝箱第三季度訂單飽滿 開拓氫能集成裝備求新|公司調研

財聯社7月5日訊(記者 胡皓瓊)中美關稅緩和之下,外貿企業對美出貨恢復,帶動中集洋山集裝箱製造訂單增長。集裝箱製造廠在提升自動化水平的同時,為提高自身抗風險能力,還正布局新賽道。財聯社記者近日走訪中集集團(000039.SZ)旗下中集洋山,眼見一片片鋼板,經歷衝壓、焊接組裝、打砂等一道道工序,逐漸成形。產線上布...