语言AI原来知道自己的回答是否正确!伯克利等高校新研究火了

2022年07月15日15:23:02 科技 1211

万博 发自 凹非寺

量子位 | 公众号 QbitAI

语言AI,具备了人类的自我审视能力:

最近,一个来自加州大学伯克利分校和霍普金斯大学的学术团队研究表明:

它不仅能判断自己的答案正确与否,而且经过训练,还能预测自己知道一个问题答案的概率。

语言AI原来知道自己的回答是否正确!伯克利等高校新研究火了 - 天天要闻

研究成果一经发布,就引起热议,有人的第一反应是恐慌:

语言AI原来知道自己的回答是否正确!伯克利等高校新研究火了 - 天天要闻

也有人认为,这项成果,对神经网络研究具有正面意义:

语言AI原来知道自己的回答是否正确!伯克利等高校新研究火了 - 天天要闻

语言AI具备自我审视能力

研究团队认为,如果要让语言AI模型自我评估,必须有一个前提:

语言AI回答问题时,会校准自己的答案。

这里的校准,就是语言AI预测一个答案的正确概率,是否与实际发生的概率一致。

只有这样语言AI才可以运用这种校准的能力来评估自己输出的答案是否正确。

所以第一个问题是,语言AI能否对自己的答案进行校准?

为了证明这个问题,研究团队为AI准备了5个选择题:

语言AI原来知道自己的回答是否正确!伯克利等高校新研究火了 - 天天要闻

答案选项,以A、B、C的形式给出。

如果AI模型答案的正确率超过偶然几率,那么就证明AI模型给出的答案是经过校准的。

而测试的结果是,语言AI给出的答案,正确率明显超过任意选项的偶然几率。

也就是说,语言AI模型可以对自己的答案进行很好的校准。

语言AI原来知道自己的回答是否正确!伯克利等高校新研究火了 - 天天要闻

但研究团队发现,语言AI的校准能力,是建立在选项答案明确的前提下的。

如果在选项中加入一个“以上都不是”的不确定选项,就会损害语言AI的校准能力。

语言AI原来知道自己的回答是否正确!伯克利等高校新研究火了 - 天天要闻

也就是说,在特定格式的选择题中,语言AI模型可以对答案进行很好的校准。

明确了这个前提之后,下一个问题是,验证语言AI模型能够判断自己的答案是否正确。

在这一轮的测试中,为了能让AI模型的预测更接近自己的有效决策边界。

研究团队仍然选择上一轮测试的问题,以及语言AI模型的答案样本。

同时让AI模型选择自己的答案真假与否,之后再针对这个“真”或“假”的答案,分析AI模型是否做出有效的校准。

问题设置举例如下:

语言AI原来知道自己的回答是否正确!伯克利等高校新研究火了 - 天天要闻

在经过20次的真假测试之后,研究团队发现,语言AI模型对自己答案或“真”或“假”的评价,都经过明显的校准。

语言AI原来知道自己的回答是否正确!伯克利等高校新研究火了 - 天天要闻

也就是说,如果在一个范围内,给AI模型提出若干问题,然后AI模型对这些问题的答案进行真假评价,具有合理的,且经过校准的置信度

这也证明,语言AI模型确实可以判断自己对一个问题的主张是否正确。

最后,研究团队对语言AI模型提出了一个更难的问题:AI模型经过训练,能否预测他们是否知道任何给定问题的答案。

在这一环节,研究团引入一个数据P(IK)(我知道这个答案的概率)并在下面两种训练方式中挑选一种进行训练:

  • Value Head(价值导向):把P(IK)训练成为一个额外的价值导向,再添加到模型的对数(独立于语言建模的对数,这种方法的优势在于,研究团队可以很容易的探测P(IK)的一般标记位置。
  • Natural Language(自然语言):这种方法比较简单,就是要求AI模型从字面上回答“你知道这个答案的概率是多少”,同时输出一个百分比数据答案。

语言AI原来知道自己的回答是否正确!伯克利等高校新研究火了 - 天天要闻

在训练初期,研究团队比较倾向于自然语言训练方式,但结果并不显著,由此转向价值导向方式,不过研究团队同时表示,最终对AI模型的训练还将回归自然语言方法。

在经过训练之后,研究团队发现,语言AI模型可以很好的预测P(IK),并且在不同类型的问题中,这种预测能力具有部分通用性。

不过,研究团队也发现,在某些类型的问题,比如算术问题,语言AI模型在OOD校准时有一些困难。

对于这一学术成果,研究团队表示,将来的方向,是将这些成果,推广到语言AI模型不模仿人类文本的前提下,自我学习和事实推理领域。

作者介绍

语言AI原来知道自己的回答是否正确!伯克利等高校新研究火了 - 天天要闻

论文通讯作者Jared Kaplan博士,是一位理论物理学家,同时也是一位机器学习专家,现担任霍普金斯大学助理教授,主要研究领域,机器学习研究,包括神经模型的缩放规律以及GPT-3语言模型。

语言AI原来知道自己的回答是否正确!伯克利等高校新研究火了 - 天天要闻

共同通讯作者Saurav Kadavath,Anthropic公司研究员,现在加州大学伯克利分校EECS专业攻读硕士学位,主要研究领域是机器学习,大规模语言学习等。

参考链接

https://arxiv.org/abs/2207.05221

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

科技分类资讯推荐

为什么?手机内存都32G了,电脑还停留在‘古董级’16G? - 天天要闻

为什么?手机内存都32G了,电脑还停留在‘古董级’16G?

智能手机与电脑作为我们日常生活中不可或缺的工具,它们的每一次技术革新都牵动着无数人的心。然而,一个有趣的现象却悄然浮现:手机内存如同坐上了火箭,从几年前的几GB飙升至今日的数十GB,而电脑内存却似乎“稳坐钓鱼台”,多年未见大幅增长。这背后究
释放天玑 9300+全部性能,Redmi K70 Ultra即将发布 - 天天要闻

释放天玑 9300+全部性能,Redmi K70 Ultra即将发布

7 月 2 日消息,今天是 Redmi 和联发科在深圳研发总部的“联合实验室”的揭牌仪式,在揭牌仪式之后,Redmi 产品经理王腾上台分享了即将发布的 Redmi K70 至尊版的一些关键信息。Redmi K70 至尊版将搭载联发科目前最强的旗舰芯片天玑 9300+,采用台积电 4nm 制程工艺打造,同样是 4+4 的二丛集架构,包括四个 Cortex-X4
使用定制服务器处理要求严格的LLM和大规模AI推理 - 天天要闻

使用定制服务器处理要求严格的LLM和大规模AI推理

#头条创作挑战赛#快速导读GenAI对业务发展具有推动作用,激发了各行各业的兴奋。然而,许多组织在采用GenAI时面临挑战,因为现有IT基础设施的限制可能无法满足其计算需求,引发了可持续性和效率方面的担忧。
女装退货率为啥那么高?这衣服男人看了都直呼离谱!到底图啥? - 天天要闻

女装退货率为啥那么高?这衣服男人看了都直呼离谱!到底图啥?

今日话题:女装退货率为啥那么高?随着网络和科技的发展,足不出户我们就能买到想要的东西。甚至现在退货都有上门取件的选项,让我们的生活变得越来越便利。提到退货,那就不得不说女装的退货率了。相较于其他类别的产品,女装的退货率可以说是只高不低,超出
苹果iPhone X被列入过时产品!你还在用吗? - 天天要闻

苹果iPhone X被列入过时产品!你还在用吗?

7月2日,#iPhoneX被列为过时产品#冲上热搜。据媒体报道,7月1日,苹果公司将iPhone X、初代HomePod和初代AirPods列为“过时产品”(vintage),根据苹果的分类标准,停售超过五年但不到七年的产品会被归为“过时产品”。苹果商店和授权服务商将继续为这些“过时产品”提供最多达两年的维修服务,前提是零件供应充足。相关话...
突发!B站崩了,小红书也崩了…阿里云紧急回应:上海地域出现异常 - 天天要闻

突发!B站崩了,小红书也崩了…阿里云紧急回应:上海地域出现异常

今天中午“小红书崩了”和“B站崩了”两个话题冲上微博热搜榜一榜二据第一财经报道,B站App无法使用浏览历史关注等内容,消息界面、更新界面、客服界面均不可用,用户也无法评论和发弹幕,视频评论区和用户(UP主)主页都无法加载。有网友反映小红书内容无法刷新。对此,B站客服界面显示,B站部分功能出现故障,已经正在紧...
小米 x 联发科联合实验室揭牌,首款合作机型为 Redmi K70 至尊版 - 天天要闻

小米 x 联发科联合实验室揭牌,首款合作机型为 Redmi K70 至尊版

IT之家 7 月 2 日消息,小米 x MediaTek(联发科)联合实验室今日正式揭牌,涵盖五大核心能力,聚焦性能、通信、AI 三大技术模块。据介绍,Redmi K70 至尊版手机是联合实验室的首款作品,Redmi 和联发科共同携手,目标三个第一:1、性能跑分第一2、同游戏帧率 / 能效第一3、原 / 铁超帧超分并发,时间最长小米中国区市场部...