何愷明新作再戰AI生成:入職MIT後首次帶隊,IOI金牌得主鄧明揚參與

2024年06月23日12:30:39 動漫 8001

夢晨 發自 凹非寺

量子位 | 公眾號 qbitai

何愷明入職mit副教授後,首次帶隊的新作來了!

何愷明新作再戰AI生成:入職MIT後首次帶隊,IOI金牌得主鄧明揚參與 - 天天要聞

讓自回歸模型拋棄矢量量化,使用連續值生成圖像。並借鑒擴散模型的思想,提出diffusion loss

何愷明新作再戰AI生成:入職MIT後首次帶隊,IOI金牌得主鄧明揚參與 - 天天要聞

他加入mit後,此前也參與過另外幾篇cv方向的論文,不過都是和mit教授wojciech matusik團隊等合作的。

這次何愷明自己帶隊,參與者中還出現一個熟悉的名字:

鄧明揚,imo、ioi雙料奧賽金牌得主,在競賽圈人稱「乖神」。

何愷明新作再戰AI生成:入職MIT後首次帶隊,IOI金牌得主鄧明揚參與 - 天天要聞

目前鄧明揚mit本科在讀,按入學時間推算現在剛好大四,所以也有不少網友猜測他如果繼續在mit讀博可能會加入何愷明團隊。

接下來具體介紹一下,這篇論文研究了什麼。

借鑒擴散模型,大改自回歸生成

傳統觀點認為,圖像生成的自回歸模型通常伴隨著矢量量化(vector quantization),比如dall·e一代就使用了經典的vq-vae方法。

但團隊觀察到,自回歸生成的本質是根據先前的值預測下一個token,這其實與值是離散還是連續沒啥必然聯繫啊。

關鍵是要對token的概率分布進行建模,只要該概率分布可以通過損失函數來測量並用於從中抽取樣本就行。

何愷明新作再戰AI生成:入職MIT後首次帶隊,IOI金牌得主鄧明揚參與 - 天天要聞

並且從另一個方面來看,矢量量化方法還會帶來一系列麻煩:

需要一個離散的token詞表,需要精心設計量化的目標函數,訓練困難,對梯度近似策略很敏感

量化誤差會帶來信息損失,導致還原圖像質量打折

離散token適合建模分類分布,有表達能力上的局限

那麼有什麼更好的替代方法?

何愷明團隊選擇在損失函數上動刀,借鑒近年大火的擴散模型的思想,提出diffusion loss,消除了離散tokenizer的必要性。

如此一來,在連續值空間中應用自回歸模型生成圖像就可行了。

何愷明新作再戰AI生成:入職MIT後首次帶隊,IOI金牌得主鄧明揚參與 - 天天要聞

具體來說,它讓自回歸模型輸出一個潛變數z作為條件,去訓練一個小型的去噪mlp網路。

通過反向擴散過程,這個小網路就學會了如何根據z去採樣生成連續值的token x。擴散的過程天然能建模任意複雜的分布,所以沒有類別分布的局限。

這個去噪網路和自回歸模型是端到端聯合訓練的,鏈式法則直接把損失傳給自回歸模型,使其學會輸出最佳的條件z。

何愷明新作再戰AI生成:入職MIT後首次帶隊,IOI金牌得主鄧明揚參與 - 天天要聞

這篇工作的另一個亮點,是各種自回歸模型的變體都適用。它統一了標準的自回歸ar、隨機順序的ar、以及何愷明擅長的掩碼方法。

其中掩碼自回歸(mar)模型,可以在任意隨機位置同時預測多個token,同時還能和擴散損失完美配合。

在這個統一的框架下,所有變體要麼逐個token預測,要麼並行預測一批token,但本質上都是在已知token的基礎上去預測未知token,都是廣義的自回歸模型,所以擴散損失都能適用。

何愷明新作再戰AI生成:入職MIT後首次帶隊,IOI金牌得主鄧明揚參與 - 天天要聞

通過消除矢量量化,團隊訓練的圖像生成模型獲得了強大的結果,同時享受序列建模的速度優勢。

論文在ar、mar的各種變體上做了大量實驗,結果表明擴散損失比交叉熵損失穩定帶來2-3倍的提升。

與其他領先模型一比也毫不遜色,小模型都能做到1.98的fid分數,大模型更是創下了1.55的sota。

何愷明新作再戰AI生成:入職MIT後首次帶隊,IOI金牌得主鄧明揚參與 - 天天要聞

而且它生成256x256圖像速度也很快,不到0.3秒一張。這得益於自回歸生成本來就很快,比擴散模型少採樣很多步,再加上去噪網路又很小。

何愷明新作再戰AI生成:入職MIT後首次帶隊,IOI金牌得主鄧明揚參與 - 天天要聞

最後總結一下,這項工作通過自回歸建模token間的相關性,再搭配擴散過程對每個token的分布進行建模。

這也有別於普通的潛空間擴散模型中用單個大擴散模型對所有token的聯合分布建模,而是做局部擴散,在效果、速度和靈活性上都展現出了巨大的潛力。

當然,這個方法還有進一步探索的空間,團隊提出,目前在在某些複雜的幾何圖形理解任務上還有待提高。

何愷明團隊都有誰

最後再來介紹一下即將或可能加入何愷明課題組的團隊成員。。

tianhong li(黎天鴻),清華姚班校友,mit博士生在讀,將於2024年9月加入何愷明的課題組,擔任博士後。

何愷明新作再戰AI生成:入職MIT後首次帶隊,IOI金牌得主鄧明揚參與 - 天天要聞

mingyang deng(鄧明揚),mit本科數學和計算機科學專業在讀。

他在高一獲得imo金牌,高三獲得ioi金牌,是競賽圈為數不多的雙料金牌得主,也是ioi歷史上第三位滿分選手。

目前鄧明揚的研究重點是機器學習,特別是理解和推進生成式基礎模型,包括擴散模型和大型語言模型。

不過他的個人主頁上還沒有透露下一步計劃。

何愷明新作再戰AI生成:入職MIT後首次帶隊,IOI金牌得主鄧明揚參與 - 天天要聞

one more thing

何愷明當初在mit的求職演講備受關注,其中提到未來工作方向會是ai for science,還引起圈內一陣熱議。

何愷明新作再戰AI生成:入職MIT後首次帶隊,IOI金牌得主鄧明揚參與 - 天天要聞

現在,何愷明在ai4s方向的參與的首篇論文也來了:強化學習+量子物理學方向

把transformer模型用在了動態異構量子資源調度問題上,利用自注意力機制處理量子比特對的序列信息。並在概率性環境中訓練強化學習代理,提供動態實時調度指導,最終顯著提升了量子系統性能,比基於規則的方法提高了3倍以上。

何愷明新作再戰AI生成:入職MIT後首次帶隊,IOI金牌得主鄧明揚參與 - 天天要聞

這樣一來,何愷明在自己的成名領域cv和探索新領域ai4s上都沒耽誤,兩開花,兩開花。

論文:

https://arxiv.org/abs/2406.11838

參考鏈接:

[1]https://www.tianhongli.me

[2]https://lambertae.github.io

[3]https://arxiv.org/abs/2405.16380

動漫分類資訊推薦

2024年歐洲杯球迷區發生鬥毆,三人被刺傷 - 天天要聞

2024年歐洲杯球迷區發生鬥毆,三人被刺傷

據德國電視二台(ZDF)援引當地警方報道,一名男子在德國斯圖加特持刀襲擊了球迷。事件發生在宮殿廣場,當時人們正在觀看土耳其國家隊與捷克國家隊之間的歐洲杯足球比賽(2:1)的轉播。 隨後發生....
歐洲杯16強全部落位,法德西葡齊聚「死亡半區」 - 天天要聞

歐洲杯16強全部落位,法德西葡齊聚「死亡半區」

葡萄牙前鋒菲利克斯準備開角球。據新華社電 6月27日,歐洲杯結束最後四場小組賽爭奪,E組羅馬尼亞、比利時和斯洛伐克,F組葡萄牙、土耳其和喬治亞晉級淘汰賽。至此,本屆歐洲杯16強全部產生,法國、德國、西班牙、葡萄牙、比利時等強隊齊聚上半區,英格蘭、義大利、荷蘭落位下半區。當日E組兩場比賽均以平局收場。根據賽...
讓「案結事了」變「事心雙解」——針鋒相對的親生父女握手言和記 - 天天要聞

讓「案結事了」變「事心雙解」——針鋒相對的親生父女握手言和記

點擊上方京法網事獲取北京法院官方資訊家事糾紛案件的特點無疑讓調解成為了更具優勢的爭議解決方式。每一個經歷過家事調解的法官,最大的體會就是在這些家事案件中,親人之間的情緒對立會讓調解無從開始,矛盾的錯綜複雜讓調解難以找到靶心,更難的是彌補心與心之間的嫌隙,讓破鏡重圓、覆水能收……「我要起訴。」一雙顫顫...
給人形機器人潑盆冷水? - 天天要聞

給人形機器人潑盆冷水?

一直在猶豫要不要寫這個話題,兩個擔心點,其一:怕被別人認為自己是標新立異,總要說點和別人不一樣的東西;其二:裡面的一些觀點,的確容易得罪一些人。雖然標題是「中國人形機器人行業現象」,但實話說,原本客觀的「現象」經由人「觀察」進而「總結」後,勢必帶入了主觀的「觀點」。無論如何,雖有擔心點,既然還是決定...
小米Civi 4 Pro迪士尼公主限定版亮相:背板自帶魔鏡 - 天天要聞

小米Civi 4 Pro迪士尼公主限定版亮相:背板自帶魔鏡

站長之家(ChinaZ.com) 6月26日 消息:今日,小米官方正式宣布,小米Civi 4 Pro迪士尼公主限定版將於 6 月 27 日19: 00 準時與大家見面,並率先發布了這款新機的首張外觀海報,讓人一窺其風采。這款特別版手機在設計上可謂獨具匠心。整體以優雅的紫色為主色調,彰顯出迪士尼公主的浪漫與夢幻。而背部最引人注目的,無疑是那塊...
桌游&抽象棋&新棋推薦:新忍者象棋 - 天天要聞

桌游&抽象棋&新棋推薦:新忍者象棋

新忍者象棋忍者象棋是 2021 年由 Couch Tomato 與 Fables 推出的遊戲,也是非對稱棋組變體系列的第四款。遊戲的背景設定為王國的軍隊(黑)入侵了櫻流忍者(Sakura Clan)的領土(粉)而展開的戰鬥。忍者方一開始子力
歌查德劇場版:兩位寶太郎解鎖全新形態,反派BOSS騎士曝光 - 天天要聞

歌查德劇場版:兩位寶太郎解鎖全新形態,反派BOSS騎士曝光

#假面騎士歌查德#假面騎士歌查德劇場版《假面騎士歌查德:破曉未來》隨著最新PV的公布,更多情報公布。變身奇蹟歌查德的是年輕寶太郎,未來寶太郎也有自己的新形態,反派BOSS格里昂變身的BOSS騎士曝光。首先假面騎士雷傑德一開始就登場了,他告訴