图灵奖得主Yoshua Bengio发文阐释生成流网络与生成模型关系

2022年09月11日23:07:03 科学 1344

图灵奖得主Yoshua Bengio发文阐释生成流网络与生成模型关系 - 天天要闻



近日,全球公认的 AI 领域顶尖专家之一、图灵奖得主约书亚·本吉奥(Yoshua Bengio)对生成流网络(GFlowNet,Generative Flow Network)与深度生成模型之间的联系做了介绍。



GFlowNet 是本吉奥提出的一种新的网络生成方法,涉及“强化学习、深度生成模型和基于能量的概率建模”,其也与变分模型和推理有一定联系。



本吉奥在其个人网站曾提到,他很少对新的研究方向如此热衷,其中之一就是 GFlowNet。



图灵奖得主Yoshua Bengio发文阐释生成流网络与生成模型关系 - 天天要闻

图 | 约书亚·本吉奥(Yoshua Bengio)(来源:本吉奥个人网站)


本次的研究论文于 9 月 6 日,以《将生成模型与 GFlowNet 统一起来》(Unifying Generative Models with GFlowNets)为题提交在 arXiv 上。



首先对本吉奥做一简单介绍。他是加拿大蒙特利尔大学计算机与运筹学系教授,也是米拉-魁北克人工智能研究所的创始人和科学主任。

他被认为是 1990 年代和 2000 年代对推动深度学习发展最大的几人之一,并于 2022 年成为世界上 H 指数(H-index)最高的计算机科学家。


而在 2018 年,由于在深度学习方面的开创性工作和重要贡献,本吉奥与加拿大多伦多大学计算机科学系教授杰弗里·辛顿(Geoffrey Hinton)、Meta 副总裁兼首席AI科学家杨立昆(Yann LeCun)一起获得了国际计算机学会颁发的图灵奖(通常被称为“诺贝尔计算奖”)。他们三人有时也被称为“人工智能教父”和“深度学习教父”。



据了解,本吉奥于 1991 年获加拿大麦吉尔大学计算机科学博士学位,之后在麻省理工学院AT&T 贝尔实验室担任博士后研究员。自 1993 年加入蒙特利尔大学至今。著有《深度学习(自适应计算和机器学习)》(Deep Learning(Adaptive Computation and Machine Learning))、《迈向生物学上合理的深度学习》(Towards Biologically Plausible Deep Learning)等图书和论文作品。



2021 年,本吉奥以一作的身份发表了有关 GFlowNet 的重要论文《GFlowNet Foundations》(GFlowNet 基础)。



目前,GFlowNet 已被引入到主动学习环境中,以对各种候选集合进行采样。它还为非参数贝叶斯建模和抽象表示的监督学习等方面提供了新视野。“其训练是为了使它们与给定的奖励函数成比例地进行近似采样。”论文中提到。



除了解开解释性因果因素和与之相关的机制,GFlowNet 尤其对实施系统归纳偏差方面有帮助。GFlowNet 还是一个新的有难度的研究领域,为了理解和应用它,适当的优化算法仍在快速发展。其概念正逐步得到扩展。



而在本次研究中,论文里提到:“深度生成建模有许多框架,每个框架都有自身特定的训练算法和推理方法。我们通过马尔可夫轨迹学习的视角,对深度生成模型和 GFlowNet 框架之间的联系给出一个统一的观点。这为统一训练和推理算法提供了一种方法,并为构建生成模型聚合提供了一种路径。”



从概率建模的角度来看,GFlowNet 是一种生成模型,其目的是根据给定的奖励函数 R(x) 的比例对 x 进行抽样。



具体地说,一个 GFlowNet 将对一个长度为 n 的马尔可夫轨迹 τ=(S0,S1,……,Sn)进行采样。如果没有特别指定,将使用符号 X=Sn 来表示轨迹的最终状态。


这个过程与强化学习有一种自然的联系,所有的状态 s 都在潜在状态空间中构造了一个有向非循环图。每个轨迹从相同的(抽象的)初始状态 S0 开始,并运行到一个不同的端点 Sn。理想情况下,希望通向x的流量等于给定的奖励。



在论文中的“从数据中学习奖励函数”部分,研究团队提到:“基于能量的模型(EBM,Energy-based model)可以作为 GFlowNet 训练的(负对数)奖励函数。我们可以使用任何 GFlowNet 建模,且两种模型(EBM 和 GFlowNet)共同训练。”



此外,生成对抗网络(GAN,Generative Adversarial Network)与 EBM 密切相关,但其算法的计算效率更高。然而,虽然初看它可能是合理的,但不能直接使用鉴别器 D(x) 作为 GFlowNet 训练的奖励。



如果是这样,在一个完美的训练结束时,将得到一个最优的鉴别器和最优的 GFlowNet 发生器分布。为了填补这一空白,本吉奥设计了一些更有意义的算法。



图灵奖得主Yoshua Bengio发文阐释生成流网络与生成模型关系 - 天天要闻

(来源:本吉奥个人网站)



上图说明了为什么在 GFlowNet 中使用“流”这个词。这考虑了非规范化概率的流动,类似于有向非循环图(可能是指数级的,不需要在计算机中明确表示它)中从初始状态(左侧为 0)流出的水量,其轨迹对应于所有可能的动作序列(即决定状态转换的动作),以便按顺序构建复杂的对象,如分子图、因果图、对场景的解释或者我们脑海中的想法。



论文最后的结论提到:“如今的生成模型可被理解成在样本轨迹上有着差异化策略的 GFlowNet。这为现有生成建模框架之间的重合部分,以及与训练它们的通用算法的关系,提供了一些观点。


这种统一意味着一种构建不同类型集群的生成建模的方法,而由于推理和训练方面的优越性,GFlowNet 可作为其中的通用粘合剂。”


图灵奖得主Yoshua Bengio发文阐释生成流网络与生成模型关系 - 天天要闻


参考资料:
https://arxiv.org/abs/2209.02606
https://yoshuabengio.org/2022/03/05/generative-flow-networks/
https://en.wikipedia.org/wiki/Yoshua_Bengio


图灵奖得主Yoshua Bengio发文阐释生成流网络与生成模型关系 - 天天要闻

科学分类资讯推荐

膜导航系统为外科医生装上“透视眼”,破解“膜解剖”可视化难题 - 天天要闻

膜导航系统为外科医生装上“透视眼”,破解“膜解剖”可视化难题

中国青年报客户端讯(中青报·中青网记者 林洁)近日,在中山大学附属第三医院(以下简称“中山三院”)胃肠外科暨胃肠手术功能保护研究中心新技术应用沙龙上,一款名为DeepGuide的手术导航系统对外发布。该系统成功破解“膜解剖”可视化难题,使胃肠肿瘤手术的系膜完整率从75%升至98%。中山三院新技术应用沙龙现场。甄晓洲...
长三角生态绿色一体化发展示范区生物多样性调查成果发布 - 天天要闻

长三角生态绿色一体化发展示范区生物多样性调查成果发布

中新网嘉兴5月13日电(记者 王逸飞)13日,在浙江嘉善举行的2025年国际生物多样性日长三角生态绿色一体化发展示范区暨浙江主场活动上,长三角生态绿色一体化发展示范区生物多样性调查成果发布,这也是长三角首张跨域“生物多样性图谱”。2025年国际生物多样性日长三角生态绿色一体化发展示范区暨浙江主场活动现场。浙江省生态...
11000年前的冒险,水下石圈揭秘史前人类北迁传奇 - 天天要闻

11000年前的冒险,水下石圈揭秘史前人类北迁传奇

在苏格兰斯凯岛发现的水下石圈和石器时代工具显示,约11000年前,人类已踏足如今的苏格兰北部。 这一发现表明,史前人类勇敢穿越苏格兰北部冰川肆虐、海岸线变幻莫测的险境,向北迁徙的距离远超此....
探访武汉产业创新发展研究院:430余项颠覆性技术项目展“科创雄心” - 天天要闻

探访武汉产业创新发展研究院:430余项颠覆性技术项目展“科创雄心”

极目新闻记者 荣枚“因聚而变,惟创则新”。在科技创新驱动发展的时代浪潮下,这句充满力量的话语成为武汉产业创新发展的生动注脚。5月13日,“中国式现代化的万千气象”网络名人湖北行报道团走进武汉产业创新发展研究院。进入武汉产业创新发展研究院,展厅中央屹立着一棵“科创之树”。“劳动者”人形机器人、高产高蛋白宜...
中国创面修复学科发起者之一陆树良教授逝世,享年64岁 - 天天要闻

中国创面修复学科发起者之一陆树良教授逝世,享年64岁

沉痛悼念陆树良教授上海交通大学医学院附属瑞金医院创面修复中心主任、上海市烧伤研究所原所长,《中华烧伤与创面修复杂志》常务编辑委员,中国创面修复学科发起者之一陆树良教授,因病医治无效,于2025年5月12日13时05分在瑞金医院逝世,享年64岁。陆树良教授专注于烧伤诊疗、创面修复及组织再生等学术研究,曾主持国家“...
阿司匹林在兰花种养中的科学应用 - 天天要闻

阿司匹林在兰花种养中的科学应用

在兰花种植领域,一种看似“跨界”的养护方法正逐渐被兰友们接受——利用阿司匹林(乙酰水杨酸)促进兰花生长、增强抗性。这一方法看似神奇,实则蕴含着植物生理学的科学原理。本文将从成分解析、作用机制、应用方法及注意事项等方面,系统阐述阿司匹林在兰花