何恺明新作再战AI生成:入职MIT后首次带队,IOI金牌得主邓明扬参与

2024年06月23日12:30:39 动漫 8001

梦晨 发自 凹非寺

量子位 | 公众号 qbitai

何恺明入职mit副教授后,首次带队的新作来了!

何恺明新作再战AI生成:入职MIT后首次带队,IOI金牌得主邓明扬参与 - 天天要闻

让自回归模型抛弃矢量量化,使用连续值生成图像。并借鉴扩散模型的思想,提出diffusion loss

何恺明新作再战AI生成:入职MIT后首次带队,IOI金牌得主邓明扬参与 - 天天要闻

他加入mit后,此前也参与过另外几篇cv方向的论文,不过都是和mit教授wojciech matusik团队等合作的。

这次何恺明自己带队,参与者中还出现一个熟悉的名字:

邓明扬,imo、ioi双料奥赛金牌得主,在竞赛圈人称“乖神”。

何恺明新作再战AI生成:入职MIT后首次带队,IOI金牌得主邓明扬参与 - 天天要闻

目前邓明扬mit本科在读,按入学时间推算现在刚好大四,所以也有不少网友猜测他如果继续在mit读博可能会加入何恺明团队。

接下来具体介绍一下,这篇论文研究了什么。

借鉴扩散模型,大改自回归生成

传统观点认为,图像生成的自回归模型通常伴随着矢量量化(vector quantization),比如dall·e一代就使用了经典的vq-vae方法。

但团队观察到,自回归生成的本质是根据先前的值预测下一个token,这其实与值是离散还是连续没啥必然联系啊。

关键是要对token的概率分布进行建模,只要该概率分布可以通过损失函数来测量并用于从中抽取样本就行。

何恺明新作再战AI生成:入职MIT后首次带队,IOI金牌得主邓明扬参与 - 天天要闻

并且从另一个方面来看,矢量量化方法还会带来一系列麻烦:

需要一个离散的token词表,需要精心设计量化的目标函数,训练困难,对梯度近似策略很敏感

量化误差会带来信息损失,导致还原图像质量打折

离散token适合建模分类分布,有表达能力上的局限

那么有什么更好的替代方法?

何恺明团队选择在损失函数上动刀,借鉴近年大火的扩散模型的思想,提出diffusion loss,消除了离散tokenizer的必要性。

如此一来,在连续值空间中应用自回归模型生成图像就可行了。

何恺明新作再战AI生成:入职MIT后首次带队,IOI金牌得主邓明扬参与 - 天天要闻

具体来说,它让自回归模型输出一个潜变量z作为条件,去训练一个小型的去噪mlp网络。

通过反向扩散过程,这个小网络就学会了如何根据z去采样生成连续值的token x。扩散的过程天然能建模任意复杂的分布,所以没有类别分布的局限。

这个去噪网络和自回归模型是端到端联合训练的,链式法则直接把损失传给自回归模型,使其学会输出最佳的条件z。

何恺明新作再战AI生成:入职MIT后首次带队,IOI金牌得主邓明扬参与 - 天天要闻

这篇工作的另一个亮点,是各种自回归模型的变体都适用。它统一了标准的自回归ar、随机顺序的ar、以及何恺明擅长的掩码方法。

其中掩码自回归(mar)模型,可以在任意随机位置同时预测多个token,同时还能和扩散损失完美配合。

在这个统一的框架下,所有变体要么逐个token预测,要么并行预测一批token,但本质上都是在已知token的基础上去预测未知token,都是广义的自回归模型,所以扩散损失都能适用。

何恺明新作再战AI生成:入职MIT后首次带队,IOI金牌得主邓明扬参与 - 天天要闻

通过消除矢量量化,团队训练的图像生成模型获得了强大的结果,同时享受序列建模的速度优势。

论文在ar、mar的各种变体上做了大量实验,结果表明扩散损失比交叉熵损失稳定带来2-3倍的提升。

与其他领先模型一比也毫不逊色,小模型都能做到1.98的fid分数,大模型更是创下了1.55的sota。

何恺明新作再战AI生成:入职MIT后首次带队,IOI金牌得主邓明扬参与 - 天天要闻

而且它生成256x256图像速度也很快,不到0.3秒一张。这得益于自回归生成本来就很快,比扩散模型少采样很多步,再加上去噪网络又很小。

何恺明新作再战AI生成:入职MIT后首次带队,IOI金牌得主邓明扬参与 - 天天要闻

最后总结一下,这项工作通过自回归建模token间的相关性,再搭配扩散过程对每个token的分布进行建模。

这也有别于普通的潜空间扩散模型中用单个大扩散模型对所有token的联合分布建模,而是做局部扩散,在效果、速度和灵活性上都展现出了巨大的潜力。

当然,这个方法还有进一步探索的空间,团队提出,目前在在某些复杂的几何图形理解任务上还有待提高。

何恺明团队都有谁

最后再来介绍一下即将或可能加入何恺明课题组的团队成员。。

tianhong li(黎天鸿),清华姚班校友,mit博士生在读,将于2024年9月加入何恺明的课题组,担任博士后。

何恺明新作再战AI生成:入职MIT后首次带队,IOI金牌得主邓明扬参与 - 天天要闻

mingyang deng(邓明扬),mit本科数学和计算机科学专业在读。

他在高一获得imo金牌,高三获得ioi金牌,是竞赛圈为数不多的双料金牌得主,也是ioi历史上第三位满分选手。

目前邓明扬的研究重点是机器学习,特别是理解和推进生成式基础模型,包括扩散模型和大型语言模型。

不过他的个人主页上还没有透露下一步计划。

何恺明新作再战AI生成:入职MIT后首次带队,IOI金牌得主邓明扬参与 - 天天要闻

one more thing

何恺明当初在mit的求职演讲备受关注,其中提到未来工作方向会是ai for science,还引起圈内一阵热议。

何恺明新作再战AI生成:入职MIT后首次带队,IOI金牌得主邓明扬参与 - 天天要闻

现在,何恺明在ai4s方向的参与的首篇论文也来了:强化学习+量子物理学方向

把transformer模型用在了动态异构量子资源调度问题上,利用自注意力机制处理量子比特对的序列信息。并在概率性环境中训练强化学习代理,提供动态实时调度指导,最终显著提升了量子系统性能,比基于规则的方法提高了3倍以上。

何恺明新作再战AI生成:入职MIT后首次带队,IOI金牌得主邓明扬参与 - 天天要闻

这样一来,何恺明在自己的成名领域cv和探索新领域ai4s上都没耽误,两开花,两开花。

论文:

https://arxiv.org/abs/2406.11838

参考链接:

[1]https://www.tianhongli.me

[2]https://lambertae.github.io

[3]https://arxiv.org/abs/2405.16380

动漫分类资讯推荐

2024年欧洲杯球迷区发生斗殴,三人被刺伤 - 天天要闻

2024年欧洲杯球迷区发生斗殴,三人被刺伤

据德国电视二台(ZDF)援引当地警方报道,一名男子在德国斯图加特持刀袭击了球迷。事件发生在宫殿广场,当时人们正在观看土耳其国家队与捷克国家队之间的欧洲杯足球比赛(2:1)的转播。 随后发生....
欧洲杯16强全部落位,法德西葡齐聚“死亡半区” - 天天要闻

欧洲杯16强全部落位,法德西葡齐聚“死亡半区”

葡萄牙前锋菲利克斯准备开角球。据新华社电 6月27日,欧洲杯结束最后四场小组赛争夺,E组罗马尼亚、比利时和斯洛伐克,F组葡萄牙、土耳其和格鲁吉亚晋级淘汰赛。至此,本届欧洲杯16强全部产生,法国、德国、西班牙、葡萄牙、比利时等强队齐聚上半区,英格兰、意大利、荷兰落位下半区。当日E组两场比赛均以平局收场。根据赛...
让“案结事了”变“事心双解”——针锋相对的亲生父女握手言和记 - 天天要闻

让“案结事了”变“事心双解”——针锋相对的亲生父女握手言和记

点击上方京法网事获取北京法院官方资讯家事纠纷案件的特点无疑让调解成为了更具优势的争议解决方式。每一个经历过家事调解的法官,最大的体会就是在这些家事案件中,亲人之间的情绪对立会让调解无从开始,矛盾的错综复杂让调解难以找到靶心,更难的是弥补心与心之间的嫌隙,让破镜重圆、覆水能收……“我要起诉。”一双颤颤...
给人形机器人泼盆冷水? - 天天要闻

给人形机器人泼盆冷水?

一直在犹豫要不要写这个话题,两个担心点,其一:怕被别人认为自己是标新立异,总要说点和别人不一样的东西;其二:里面的一些观点,的确容易得罪一些人。虽然标题是“中国人形机器人行业现象”,但实话说,原本客观的“现象”经由人“观察”进而“总结”后,势必带入了主观的“观点”。无论如何,虽有担心点,既然还是决定...
小米Civi 4 Pro迪士尼公主限定版亮相:背板自带魔镜 - 天天要闻

小米Civi 4 Pro迪士尼公主限定版亮相:背板自带魔镜

站长之家(ChinaZ.com) 6月26日 消息:今日,小米官方正式宣布,小米Civi 4 Pro迪士尼公主限定版将于 6 月 27 日19: 00 准时与大家见面,并率先发布了这款新机的首张外观海报,让人一窥其风采。这款特别版手机在设计上可谓独具匠心。整体以优雅的紫色为主色调,彰显出迪士尼公主的浪漫与梦幻。而背部最引人注目的,无疑是那块...
桌游&抽象棋&新棋推荐:新忍者象棋 - 天天要闻

桌游&抽象棋&新棋推荐:新忍者象棋

新忍者象棋忍者象棋是 2021 年由 Couch Tomato 与 Fables 推出的游戏,也是非对称棋组变体系列的第四款。游戏的背景设定为王国的军队(黑)入侵了樱流忍者(Sakura Clan)的领土(粉)而展开的战斗。忍者方一开始子力
歌查德剧场版:两位宝太郎解锁全新形态,反派BOSS骑士曝光 - 天天要闻

歌查德剧场版:两位宝太郎解锁全新形态,反派BOSS骑士曝光

#假面骑士歌查德#假面骑士歌查德剧场版《假面骑士歌查德:破晓未来》随着最新PV的公布,更多情报公布。变身奇迹歌查德的是年轻宝太郎,未来宝太郎也有自己的新形态,反派BOSS格里昂变身的BOSS骑士曝光。首先假面骑士雷杰德一开始就登场了,他告诉