图灵奖得主Yann LeCun:我的论文也被NeurIPS拒了

2021年10月14日13:41:02 科学 1214
图灵奖得主Yann LeCun:我的论文也被NeurIPS拒了 - 天天要闻

机器之心报道

双盲评审之下,图灵奖得主的论文也会被拒。

上周,全球人工智能顶会 NeurIPS 2021 放出了今年的论文接收结果。正所谓有人欢喜有人忧,但也有人处于「欢喜」和「忧愁」之外的另一种状态——被拒绝之后的「proud」。

这位拥有独特心境的研究者便是大名鼎鼎的 Facebook 首席 AI 科学家、2018 年图灵奖得主 Yann LeCun。

图灵奖得主Yann LeCun:我的论文也被NeurIPS拒了 - 天天要闻

被拒绝的论文标题为《VICReg: Variance-Invariance-Covariance Regularization for Self-Supervised Learning 》。LeCun 表示,在这篇论文中,他们提出了一种极其简单、高效的方法,用于联合嵌入(joint-embedding)架构的自监督训练。

图灵奖得主Yann LeCun:我的论文也被NeurIPS拒了 - 天天要闻

VICReg 论文链接:https://arxiv.org/pdf/2105.04906.pdf

而领域主席给出的拒稿理由是:与 LeCun 等人之前发表于 ICML 2021 上的「Barlow Twins」论文相比,这篇「VICReg」提出的改进还不够大。

图灵奖得主Yann LeCun:我的论文也被NeurIPS拒了 - 天天要闻

Barlow Twins 论文链接:https://arxiv.org/pdf/2103.03230.pdf

但 LeCun 似乎并不这么认为,他表示,VICReg 引入了方差正则化,这使得它适用于更广泛的架构。

图灵奖得主Yann LeCun:我的论文也被NeurIPS拒了 - 天天要闻

因此,在 LeCun 看来,他们的论文有足够的创新之处,被拒绝并不是什么丢人的事。「一些最具影响力的论文被拒绝过多次,比如 David Lowe 著名的 SIFT,」LeCun 在 twitter 上写道。

图灵奖得主Yann LeCun:我的论文也被NeurIPS拒了 - 天天要闻

对于「不要放弃」之类的鼓励,LeCun 给出的回应是:「我的整个职业生涯都是基于『不放弃』的,现在也不会改变。」对于 LeCun 这种连「AI 寒冬」都经历过的人,个别研究不被肯定又算得了什么。

图灵奖得主Yann LeCun:我的论文也被NeurIPS拒了 - 天天要闻

不过,对于普通研究者来说,LeCun 论文被拒让人看到了顶会审稿机制透明的一面:看来双盲评审还是有一定公平性的。

图灵奖得主Yann LeCun:我的论文也被NeurIPS拒了 - 天天要闻

而且,审稿结果似乎并没有被网络上的宣传所左右:该论文今年 5 月份就出现在了 arXiv 上,而且 LeCun 发表推特进行了宣传。在 LeCun 看来,这是一种正常的学术信息交流,有利于技术进步。但不可忽略的一点是:在各种「交流」渠道中,不同地位的研究者所占有的资源是非常悬殊的,这难免造成一些不公平,让本身就很有学术号召力的研究者从中获益。

不过,具体到「VICReg」这篇论文是否应该被接收,我们还是要看一下论文的具体内容。

「 VICReg 」是个什么方法

自监督表征学习在过去几年取得了重大进展,在许多下游任务上几乎达到了监督学习方法的性能。虽然可以显式地防止崩溃(collapse),但许多方法都存在成本高昂的问题,需要大量内存和较大的批大小。

还有一些方法虽然有效,但是依赖于难以解释的架构技巧。已有一些研究提供了关于如何通过非对称方法避免崩溃的理论分析,但还远不完备,并且这些方法可能不适用于其他自监督学习场景。最后,冗余减少(redundancy reduction)的方法通过对表征的维度进行去相关(decorrelate)操作来避免崩溃,从而使表征能够最大限度地提供有关其相应输入的信息。这些方法的性能良好,能够学习有意义的表征,在去相关的同时保留表征的方差,但所有这些都使用一个唯一的目标函数。VICReg 的研究提出将目标分解为三个独立的目标函数,且每个目标函数都有明确的解释。

在这篇论文中,研究者提出了一种新的自监督算法——VICReg(Variance-Invariance-Covariance Regularization,方差 - 不变性 - 协方差正则化),用于学习基于三个简单 principle(方差、不变性和协方差)的图像表征,这些 principle 有明确的目标和解释。

图灵奖得主Yann LeCun:我的论文也被NeurIPS拒了 - 天天要闻

方差 principle 独立地约束每个维度上嵌入的方差,是一种简单而有效的防止崩溃的方法。更准确地说,研究者使用 hinge loss 来约束沿嵌入的批维度计算的标准差,以达到固定目标。与对比方法不同,这里不需要 negative pair,嵌入被隐式地鼓励不同于彼此,而且它们之间没有任何直接的比较。

不变性 principle 使用标准的均方欧氏距离来学习对一张图像多个视图的不变性。

最后,协方差 principle 借鉴了 Barlow Twins 的协方差 criterion,后者将学习表征的不同维度去相关,目标是在维度之间传播信息,避免维度崩溃。这个 criterion 主要是惩罚嵌入的协方差矩阵的非对角系数。

在 SimCLR 中,negative pair 由批给出,这意味着该方法严重依赖于批大小。而 VICReg 则没有这种依赖性。与 Barlow Twin 类似,VICReg 也不需要 siamese 权重差异。此外,VICReg 架构是对称的,并且无需 SimSiam 的停止梯度(stop-gradient)操作、BYOL 的动量编码器(momentum encoder)以及二者均用到的预测器。与之前用于表征学习的任何自监督方法都不同,VICReg 的损失函数中不需要对嵌入进行任何形式的归一化,这使得该方法相对简单。

实验结果

在很多下游任务中,研究者通过评估 VICReg 方法学到的表征来测试其有效性。这些任务包括:ImageNet 线性和半监督评估以及其他一些分类、检测和实例分割任务。他们进一步表明,在更复杂的架构和其他自监督表征学习方法中加入文中提出的方差正则化,可以更好地提高下游任务的训练稳定性和性能。可以说,VICReg 是自监督联合嵌入学习中防止崩塌的一种简单、有效的可解释方法。

图灵奖得主Yann LeCun:我的论文也被NeurIPS拒了 - 天天要闻

图 1:在 ImageNet 上的评估结果。

科学分类资讯推荐

享年94岁!哈工大教授严家騄逝世,讣告:是我国工程热物理学科的重大损失 - 天天要闻

享年94岁!哈工大教授严家騄逝世,讣告:是我国工程热物理学科的重大损失

讣告中国共产党党员、哈尔滨工业大学热工专业创始人之一、哈尔滨工业大学能源科学与工程学院教授严家騄同志,因病医治无效,于2025年7月7日在哈尔滨逝世,享年94岁。严家騄同志1931年1月出生于江苏南通,1953年毕业于上海交通大学,同年进入哈工大读研,1985年任教授。历任哈工大热工教研室主任、工程热物理研究室主任。曾...
“丹娜丝”逐渐向浙江台州至福建宁德一带沿海靠近 福建北部、浙江南部近岸海域将出现 2.5 到 3.5 米的大浪 - 天天要闻

“丹娜丝”逐渐向浙江台州至福建宁德一带沿海靠近 福建北部、浙江南部近岸海域将出现 2.5 到 3.5 米的大浪

今年第 4 号台风 “丹娜丝”备受关注。最新消息显示,截至 7 月 7 日 17时,“丹娜丝” 为热带风暴级,台风中心位于距离浙江省温岭市偏南方向约 190公里的东海西南部海面上,中心附近最大风力有 9 级(23 米 / 秒,约 83 公里 / 小时)。“丹娜丝”将先以每小时10公里左右的速度向东北方向移动,8日早晨起逐渐转向偏西方向...
相比AI,我们更期待人类的回复;生活方式工业化与炎症性衰老相关?埃及祖先的新线索 | 一周论文新鲜读 - 天天要闻

相比AI,我们更期待人类的回复;生活方式工业化与炎症性衰老相关?埃及祖先的新线索 | 一周论文新鲜读

关注+星标,好搭档不错过7.7本周值得读来自《自然》旗下期刊的新近发表,我们为您精选呈现。1. 将AI回复标记为人类回复能增强同理心2. 并非所有人群的衰老都与慢性炎症相关3. 古DNA揭示埃及祖先4. 拟态是否成功取决于观察者的视角心理学 | 将AI回复标记为人类回复能增强同理心Comparing the value of perceived human
全新影响因子!科研人必备《期刊手册》 - 天天要闻

全新影响因子!科研人必备《期刊手册》

开放科学(Open Science)是透明、值得信赖、且可供所有人使用、重复使用并借鉴的科学,它能带来更快、更可持续的科学发展以及更为广泛的益处,而开放获取(Open Access)是这一切的基础。以OA形式发表研究,也能为研究人员和作者带来影响力和可见度等诸多益处: 金色OA具有更大程度的引用优势,更多的使用量和更广的影响范...
深度科普:光飞行一光年需要一年吗?光:我只需要一瞬间! - 天天要闻

深度科普:光飞行一光年需要一年吗?光:我只需要一瞬间!

在日常生活中,我们对速度的理解往往基于牛顿力学体系下的相对速度概念。比如,当我们坐在一辆行驶的汽车上,观察到车外的物体在以一定的速度向后移动,这个速度是相对于汽车这个参考系而言的。然而,光的速度却截然不同,无论在何种参考系中测量,光在真空中
超导量子计算机关键核心设备之一:本源量子批量出口稀释制冷机 - 天天要闻

超导量子计算机关键核心设备之一:本源量子批量出口稀释制冷机

IT之家 7 月 7 日消息,本源量子今日宣布自主稀释制冷机获国际订单,将批量出口“一带一路”国家,标志着我国自主量子计算核心装备在国际化进程中迈出关键一步。▼ 本源 SL400 稀释制冷机稀释制冷机是超导量子计算机的关键核心设备之一,能够为量子计算机提供接近绝对零度(IT之家注:-273.15℃)的极低温运行环境,除量子...