谷歌DeepMind展示大模型Genie,能從零製作類似《超級馬里奧》的遊戲

2024年03月16日15:51:39 遊戲 2439

openai 最近公布了其令人驚嘆的視頻生成模型 sora,打破了文本到視頻生成模型的天花板。近日,谷歌 deepmind 也展示了最新的文本到視頻遊戲的生成模型。

谷歌DeepMind展示大模型Genie,能從零製作類似《超級馬里奧》的遊戲 - 天天要聞

這款名為 genie 的新模型可以接受簡短的文字描述、手繪草圖或圖片,並將其變成一款可玩的電子遊戲,遊戲風格類似於超級馬里奧等經典的 2d 平台遊戲。

但遊戲的幀數慘不忍睹,只能以每秒一幀的速度運行,而大多數現代遊戲通常是每秒 30 到 60 幀。

「這是一項很酷的成果。」加拿大阿爾伯塔大學的人工智能研究員馬修·古茲戴爾(matthew guzdial)說。他曾在幾年前開發了一個類似的遊戲生成器。

genie 使用的訓練數據來自於網上找的數百款 2d 平台遊戲視頻,總時長 3 萬小時。

古茲戴爾說,其他人以前也採取過這種方法。他自己的遊戲生成器可以從視頻中學習創建抽象平台(遊戲)。

2020 年,英偉達使用視頻數據訓練了一個名為 gamegan 的模型,可以生成與吃豆人風格類似的遊戲。

但所有這些例子都使用輸入動作、控制器上的按鍵記錄和視頻片段來訓練模型,比如將馬里奧跳躍的視頻幀與「跳躍」動作(按鍵)相匹配。用輸入動作標記視頻片段需要大量工作,這限制了可用的訓練數據量。

相比之下,genie 只接受了錄像(視頻)訓練,然後它就能學會,在八個可能的動作中,哪一個會導致視頻中的遊戲角色改變位置。這可以將無數現有的網絡視頻轉化為潛在的訓練數據。

谷歌DeepMind展示大模型Genie,能從零製作類似《超級馬里奧》的遊戲 - 天天要聞

genie 可以根據玩家給出的動作動態地生成遊戲的每個新幀。按跳躍鍵,genie 就會更新圖像來顯示遊戲角色跳躍;按左鍵,圖像就會顯示角色向左移動。

遊戲一個動作一個動作地進行,每個新幀都是在玩家輸入指令時從零生成的。

genie 的未來版本可能會運行得更快。「原則上,沒有任何條件限制我們實現每秒 30 幀。」

谷歌 deepmind 的研究科學家蒂姆·洛克塔切爾(tim rocktäschel)說,他領導着這項工作的團隊,「genie 使用了許多與當代大型語言模型相同的技術,後者在提高推理速度方面取得了重大進展。」

genie 還學到了一些平台遊戲中常見的視覺技巧。許多這種類型的遊戲都會用到「視差」,前景向側面移動的速度比背景快。genie 經常將這種效果添加到它生成的遊戲中。

雖然 genie 是一個內部研究項目,不會向公眾發佈,但古茲戴爾指出,谷歌 deepmind 團隊表示,有一天它可能會變成一個遊戲製作工具(他本人也在朝着這個方向努力)。「我很想看看他們造出了什麼。」他說。

谷歌DeepMind展示大模型Genie,能從零製作類似《超級馬里奧》的遊戲 - 天天要聞

虛擬遊樂場

谷歌 deepmind 的研究人員感興趣的不僅僅是遊戲生成。genie 背後的團隊致力於研究開放式學習,將人工智能控制的機械人放入虛擬環境中,通過試錯(一種被稱為強化學習的技術)來解決各種任務。

2021 年,另一個 deepmind 團隊開發了一個名為 xland 的虛擬遊樂場,機械人在其中學習如何在移動障礙物等簡單任務上進行合作。

像 xland 這樣的虛擬環境對於訓練機械人應對一系列不同的挑戰至關重要:經過訓練後,它們會更加適應現實世界中的類似場景。視頻遊戲的例子證明,genie 可以生成這樣的虛擬沙盒供機械人訓練。

其他人也開發了類似的世界構建工具。例如,google brain 的 david ha 和瑞士 idsia 人工智能實驗室的尤爾根·施密杜伯(jürgen schmidhuber)於 2018 年開發了一種工具,在基於遊戲的虛擬環境(又名世界模型)中訓練機械人。

但是,與 genie 不同的是,這些工具需要包含輸入動作的訓練數據。

該團隊還展示了這種能力在機械人領域的實用性。當 genie 看到真實的機械人手臂操縱各種家用物體的視頻時,模型學到了手臂可以做什麼動作以及如何控制它。

這意味着,未來的機械人或許可以通過觀看視頻教程來學習新任務。

施密杜伯表示:「我們很難預測它將創造哪些用例。我們希望,像 genie 這樣的項目最終能為人們提供新的工具來表達他們的創造力。」

作者簡介:威爾·道格拉斯·海文(will douglas heaven)是《麻省理工科技評論》人工智能欄目的高級編輯,他在這裡報道新的研究、新興趨勢及其背後的人。此前,他是英國廣播公司(bbc)科技與地緣政治網站 future now 的創始編輯,也是 new scientist 雜誌的首席技術編輯。他擁有英國倫敦帝國理工學院計算機科學博士學位,深諳與機械人合作的體驗。

支持:ren

運營/排版:何晨龍

遊戲分類資訊推薦

任天堂 Switch 2 遊戲機有望支持輸出超 60FPS 遊戲畫面 - 天天要聞

任天堂 Switch 2 遊戲機有望支持輸出超 60FPS 遊戲畫面

IT之家 5 月 4 日消息,消息源 OatmealDome 對最新版本的任天堂 NintendoWare 引擎進行了仔細研究,發現該引擎現在支持 240 FPS 的幀率。參考IT之家此前報道,任天堂 Switch 2 遊戲機預計搭載提供至高 4 teraflops 的圖形處理能力,但該遊戲機依然不太可能有足夠的性能來運行 240 FPS 遊戲,因此相關引擎
傳音遊戲手機海外發佈:搭載天璣8200 - 天天要聞

傳音遊戲手機海外發佈:搭載天璣8200

4月30日消息,傳音公司發佈了旗下最新的遊戲手機——傳音Infinix GT 20 Pro,為遊戲愛好者帶來了一場性能與外觀的升級盛宴。在性能方面,傳音 Infinix GT 20 Pro搭載了強大的天璣8200處理器,配備了高速的 LPDDR5X內存和 UFS 3.1存儲,為用戶提供了流暢的遊戲體驗。此外,手機還內置了Pixelworks X5 Turbo
網友點餐祭奠遊戲代練胖貓,茶飲變白開水?蜜雪冰城也回應了 - 天天要聞

網友點餐祭奠遊戲代練胖貓,茶飲變白開水?蜜雪冰城也回應了

5月3日晚7點,針對外賣中茶飲變白開水一事,蜜雪冰城通過官方微博致歉。近日,21歲的遊戲代練「胖貓」跳江自盡一事引發巨大的關注,根據「胖貓」姐姐爆料,「胖貓」十分節儉,自己在出租屋裡點的外賣基本只有十來塊錢,因此各地網友自發下單點外賣祭奠「胖貓」,然而有網友發現,部分外賣出現空包的情況,涉及品牌包括蜜雪...
文博游、研學游……假期花樣玩法總有一款適合你 - 天天要聞

文博游、研學游……假期花樣玩法總有一款適合你

「五一」期間,正是人們踏青出遊,領略大好河山的好時節。這兩天,多地迎來客流高峰,各景區、景點、文化街區也推出了豐富的表演、互動項目,讓遊客盡享假日歡樂。在浙江慈溪市的鳴鶴古鎮,遊客在白洋湖上划起槳板。他們中有剛剛接觸槳板運動的初學者,也有經驗豐富的愛好者,甚至還有一些專業選手。當地結合「五一」假期的...
季後賽歷史首人!布倫森41+12關鍵一傳+制勝兩罰 刷爆紀錄 - 天天要聞

季後賽歷史首人!布倫森41+12關鍵一傳+制勝兩罰 刷爆紀錄

北京時間5月3日,當尼克斯領先22分被反超比分,但最終依然118-115險勝,布倫森無疑是頭號功臣。此役,布倫森27中13,其中三分8中3,外加罰球16中12,狂轟41分12助攻的數據,成為率領尼克斯4-2晉級的頭號功臣。值得一提的是,布倫森締造多項紀錄:其一,布倫森最近4場季後賽,場均至少41+10助攻,季後賽歷史首人。其二,布倫...
6-1,6-3!世界第1創紀錄進決賽,PK鄭欽文終結者,手握1大優勢! - 天天要聞

6-1,6-3!世界第1創紀錄進決賽,PK鄭欽文終結者,手握1大優勢!

今晨,WTA1000馬德里站結束2場女單半決賽爭奪,世界第1斯瓦泰克兵不血刃,6-1、6-3直落兩盤橫掃凱斯,創造全新紀錄入圍決賽,接下來將與澳網冠軍薩巴倫卡爭冠。世界第2在今年澳網決賽擊敗鄭欽文,但要想在本站賽事衛冕並不容易,斯瓦泰克手握1大優勢,衝擊今年第3站1000賽冠軍大有希望。 斯瓦泰克是波蘭一姐,世界第一,本...
最新戰報!0-3到3-3,小特終結者轟3連鞭,囧哥4-4暫平吉爾伯特! - 天天要聞

最新戰報!0-3到3-3,小特終結者轟3連鞭,囧哥4-4暫平吉爾伯特!

今晨,斯諾克世錦賽半決賽繼續進行,最新戰報,上輪淘汰特魯姆普的傑克瓊斯再現黑馬本色,0-3落後轟出3連鞭,打平世界冠軍賓漢姆。另外一場比賽結束第一階段爭奪,唯一倖存的種子選手凱倫威爾遜4-4暫平吉爾伯特,形勢還不明朗。 本屆世錦賽冷門不斷,成為繼1977年之後,又一次出現4強中僅1位種子選手的場景,奪冠熱門奧沙...