70岁Hinton还在努力推翻自己积累了30年的学术成果,他让我知道了什么叫做生命力

2020年11月15日13:04:04 科技 1468

70岁Hinton还在努力推翻自己积累了30年的学术成果,他让我知道了什么叫做生命力 - 天天要闻

新智元报道

来源:算法与数学之美

(ID:MathAndAlgorithm)

【新智元导读】近日,Hinton的那篇Capsule论文终于揭下了神秘的面纱,也因为该篇论文,他被刊进了各大媒体的头版头条。

在论文中,Capsule被Hinton大神定义为这样一组神经元:其活动向量所表示的是特定实体类型的实例化参数。

他的实验表明,鉴别式训练的多层Capsule系统,在MNIST手写数据集上表现出目前最先进的性能,并且在识别高度重叠数字的效果要远好于CNN。

该论文无疑将是今年12月初NIPS大会的重头戏。

不过,对于这篇论文的预热,Hinton大神可是早有准备。

70岁Hinton还在努力推翻自己积累了30年的学术成果,他让我知道了什么叫做生命力 - 天天要闻

一个月前,在多伦多接受媒体采访时,Hinton大神断然宣称要放弃反向传播,让整个人工智能从头再造。不明就里的媒体们顿时蒙圈不少。

8月份的时候,Hinton大神还用一场“卷积神经网络都有哪些问题?”的演讲来介绍他手中的Capsule研究,他认为“CNN的特征提取层与次抽样层交叉存取,将相同类型的相邻特征检测器的输出汇集到一起”是大有问题的。

当时的演讲中,Hinton大神可没少提CNN之父Yann LeCun的不同观点。毕竟,当前的CNN一味追求识别率,对于图像内容的“理解”帮助有限。

70岁Hinton还在努力推翻自己积累了30年的学术成果,他让我知道了什么叫做生命力 - 天天要闻

而要进一步推进人工智能,让它能像人脑一样理解图像内容、构建抽象逻辑,仅仅是认出像素的排序肯定是不够的,必须要找到方法来对其中的内容进行良好的表示……这就意味着新的方法和技术。

而当前的深度学习理论,自从Hinton大神在2007年(先以受限玻尔兹曼机进行训练、再用有监督的反向传播算法进行调优)确立起来后,除了神经网络结构上的小修小改,很多进展都集中在梯度流上。

正如知乎大V“SIY.Z”在《浅析Hinton最近提出的Capsule计划》时所举的例子。(https://zhuanlan.zhihu.com/p/29435406)

sigmoid会饱和,造成梯度消失。于是有了ReLU。

ReLU负半轴是死区,造成梯度变0。于是有了LeakyReLU,PReLU。

强调梯度和权值分布的稳定性,由此有了ELU,以及较新的SELU。

太深了,梯度传不下去,于是有了highway。

干脆连highway的参数都不要,直接变残差,于是有了ResNet。

强行稳定参数的均值和方差,于是有了BatchNorm。

在梯度流中增加噪声,于是有了 Dropout。

RNN梯度不稳定,于是加几个通路和门控,于是有了LSTM。

LSTM简化一下,有了GRU。

GAN的JS散度有问题,会导致梯度消失或无效,于是有了WGAN。

WGAN对梯度的clip有问题,于是有了WGAN-GP。

而本质上的变革,特别是针对当前CNN所无力解决的动态视觉内容、三维视觉等难题……进行更为基础的研究,或许真有可能另辟蹊径。

这当然是苦力活,Hinton大神亲自操刀的话,成功了会毁掉自己赖以成名的反向传播算法和深度学习理论,失败了则将重蹈爱因斯坦晚年“宇宙常数”的覆辙。

所以,李飞飞对他在这里的勇气大为赞赏:

70岁Hinton还在努力推翻自己积累了30年的学术成果,他让我知道了什么叫做生命力 - 天天要闻

如今Capsule的论文刚刚出来,深度学习的各路大神并没有贸然对其下评论,深夜中的外媒亦尚未就此发稿,甚至就连技术圈内一向口水不断的Hacker News,今天也是静悄悄地一片。

不过,可以肯定的一点是,一个月后的NIPS大会,Capsule更进一步的效果必定会有所显现。

至于Hinton此举对于深度学习和整个人工智能界的后续影响,包括Yann LeCun在内的各路大神恐怕都不敢冒下结论,咱们还是静等时间来验证Hinton大神的苦心孤诣到底值不值得吧。

这正如Hinton大神在接受吴恩达采访时所说的:

如果你的直觉很准,那你就应该坚持,最终必能有所成就;反过来你直觉不好,那坚不坚持也就无所谓了。反正你从直觉里也找不到坚持它们的理由。

当然,营长肯定是相信Hinton大神的直觉的,更是期待人工智能能在当前的水平上更进一步。

尽管意义不同,Hinton大神此举却让营长想到了同在古稀之年的开尔文勋爵,他1900年那场关于物理学“两朵乌云”的演讲可是“预言”得贼准:

“紫外灾难”让年近不惑的普朗克为量子力学开创了先河,“以太漂移”让刚刚毕业的爱因斯坦开始思考狭义相对论,经典物理学的大厦就此崩塌。

那么,人工智能上空所飘荡的到底是一朵“乌云”呢?还是一个新的时代?让我们拭目以待。

参考链接:

https://zhuanlan.zhihu.com/p/29435406

科技分类资讯推荐

百度前副总裁璩静开医美诊所,人均消费2218元 - 天天要闻

百度前副总裁璩静开医美诊所,人均消费2218元

红星资本局7月2日消息,百度前副总裁璩静在华为总部坂田基地附近开了一家医美诊所。据公开资料,璩静名下新增一家存续企业——深圳大为诊所。该诊所成立于2024年12月23日,璩静持股比例为100%,认缴出资额为100万元,经营范围为诊所服务等。
千里智行,常用常新,传祺向往S7 开启重磅OTA升级 - 天天要闻

千里智行,常用常新,传祺向往S7 开启重磅OTA升级

7月2日,传祺向往S7 OTA如期而至,OTA 2.0版本正式全量推送。本次升级新增16项功能,31项 功能升级和57项体验优化,主要涉及智能座舱、智能辅助驾驶、娱乐系统、车机交互等多个维度,旨在为用户提供常用常新的出行体验,功能强大又好用。
九州风神推出大霜塔棱镜风冷散热器:双塔棱镜顶盖,209 元 - 天天要闻

九州风神推出大霜塔棱镜风冷散热器:双塔棱镜顶盖,209 元

IT之家 7 月 3 日消息,九州风神 DeepCool 现已推出大霜塔棱镜 (AG620 ARGB V2) 风冷散热器。其采用双塔双风扇六热管直触设计,双塔顶部均配有 ARGB 灯效“棱镜顶盖”。大霜塔棱镜长宽高 129×136×162 (mm),支持 45mm 高内存条。其六根 6mm 双向恒定热平衡热管采用 CTT 2.0 核心触控技术在塔体底部并管排
今年5月中国大陆笔记本电脑线上市场销量增长,均价直逼7000元 - 天天要闻

今年5月中国大陆笔记本电脑线上市场销量增长,均价直逼7000元

【TechWeb】洛图科技(RUNTO)的报告显示,2025年5月,中国大陆笔记本电脑线上公开零售市场的销量达到了78.6万台,同比增长了20.6%。销售额方面,达到了54.1亿元,同比增长了39.3%。值得注意的是,近两年来,中国笔记本电脑线上市场的均价长期超过6000元,远超其他IT及消费类电子产品。5月份,笔记本电脑线上市场的均价更是...
​ 产品性能获认可,飞骧科技成功打入高端供应链 - 天天要闻

​ 产品性能获认可,飞骧科技成功打入高端供应链

飞骧科技作为国产射频前端芯片领域的领军企业,近期在市场表现方面频传捷报。凭借5G产品的持续放量及在国产替代浪潮中的突出表现,飞骧科技正逐步巩固其在国内PA领域的市场地位,成为行业关注的焦点。在5G市场,飞骧科技展现出强劲的增长势头。2023
与 AMD FSR4 同源,索尼 PS5 Pro 游戏机明年将迎新款超分算法 - 天天要闻

与 AMD FSR4 同源,索尼 PS5 Pro 游戏机明年将迎新款超分算法

IT之家 7 月 3 日消息,外媒 Tom's Guide 此前同 AMD 和索尼 PlayStation 双方高管就 Project Amethyst 合作项目的进展进行了交流。而根据事后报道,PS5 Pro 游戏机将在明年迎来新款的超分辨率算法。▲ AMD 代表(左)和索尼 PlayStation 代表(右)各持被劈开的紫水晶的一半AMD 和索尼 Pla
消息称某厂 SM8850 新机全系标配 50Mp 3X 中底潜望镜 - 天天要闻

消息称某厂 SM8850 新机全系标配 50Mp 3X 中底潜望镜

IT之家 7 月 3 日消息,博主 @数码闲聊站 今日爆料称,某厂子系旗舰线 SM8850,目前全系标配 50Mp 3X 中底潜望镜,现阶段基本确定 50Mp+50Mp+50Mp。结合此前爆料来看,预计为 iQOO 15 手机。此前,该博主曾透露一款 SM8850 神秘新机将标配 6.85 英寸 2K 分辨率三星 LTPO 定制四窄边大直屏,支持 Pol-l
美媒:西门子收到美国商务部通知,特朗普政府已解除对华芯片设计软件禁令 - 天天要闻

美媒:西门子收到美国商务部通知,特朗普政府已解除对华芯片设计软件禁令

【文/观察者网 熊超然】彭博社当地时间7月2日报道称,根据德国西门子公司发布的一份声明,美国商务部已通知该公司,在中国开展业务不再需要获得“政府许可”。报道就此称,特朗普政府至少已解除了对华芯片设计软件销售的出口许可要求,并认为这是中美两国为促进关键技术流动而正实施的一项贸易协议的一部分。作为全球领先的...