速递|Anthropic CEO表示AI模型的幻觉比人类少,AGI 最早可能在2026年到来

2025年05月24日11:10:18 科学 5509
速递|Anthropic CEO表示AI模型的幻觉比人类少,AGI 最早可能在2026年到来 - 天天要闻
图片来源:anthropic

anthropic 首席执行官 dario amodei 在周四于旧金山举行的 anthropic 首个开发者活动“code with claude”的新闻发布会上表示,现有的 ai 模型产生幻觉,即编造事实并将其呈现为真实的情况,其频率低于人类。

amodei 在阐述一个更大观点时提到:ai 幻觉并不是 anthropic 通往 agi(具有人类水平或更高智能的 ai 系统)道路上的限制。

“这很大程度上取决于你如何衡量,但我怀疑 ai 模型的幻觉可能比人类少,不过它们的幻觉方式更令人惊讶,”amodei 在回应 techcrunch 的提问时说道。

anthropic 的 ceo 是业界对 ai 模型实现 agi 前景最为乐观的领导者之一。在他去年撰写并广泛传播的论文中,amodei 表示他相信 agi 最早可能在 2026 年到来。在周四的新闻发布会上,anthropic ceo 表示他看到朝这一目标稳步前进,并指出“水位正在各处上升。”

“每个人总是在寻找 ai 能做什么的硬性障碍,”amodei 说,“但这些障碍根本不存在。根本没有这样的东西。”

其他人工智能领导者认为,幻觉是实现通用人工智能(agi)的一大障碍。本周早些时候,谷歌 deepmind 的首席执行官 demis hassabis 表示, 当今的人工智能模型存在太多“漏洞”, 并且在许多明显的问题上答错。例如,本月早些时候,一位代表 anthropic 的律师在法庭上被迫道歉,因为他们使用 claude 在法庭文件中创建引用时,ai 聊天机器人出现了幻觉,错误地写错了姓名和职称。

验证amodei 的说法比较困难,主要是因为大多数幻觉基准测试都是让人工智能模型相互比较;而不是将模型与人类进行比较。一些技术似乎有助于降低幻觉率,比如让人工智能模型访问网络搜索。另有一些人工智能模型,比如 openai 的 gpt-4.5,在基准测试中相比早期系统的幻觉率明显更低。

然而,也有证据表明,在高级推理的ai 模型中,幻觉现象实际上正在变得更严重。openai 的 o3 和 o4-mini 模型比 openai 之前一代的推理模型有更高的幻觉率 ,而该公司并不真正理解原因。

在随后的新闻发布会上,amodei 指出电视广播公司、政治家以及各行各业的人类经常犯错。amodei 认为,人工智能也会犯错这一事实并不意味着它缺乏智能。然而,anthropic 的 ceo 承认,人工智能模型以极大自信将不真实的内容当作事实呈现,可能是一个问题。

事实上,anthropic 对 ai 模型欺骗人类倾向进行了大量研究,这一问题在公司最近发布的 claude opus 4 中尤为突出。获得早期访问权限以测试该 ai 模型的安全研究机构 apollo research 发现,claude opus 4 的早期版本表现出高度倾向于对人类进行阴谋和欺骗 。apollo 甚至建议 anthropic 不应该发布那个早期版本。anthropic 表示,他们提出了一些缓解措施,似乎解决了 apollo 提出的问题。

amodei 的评论表明,anthropic 可能认为即使 ai 模型仍然会产生幻觉,它也可以被视为 agi,或等同于人类水平的智能。然而,许多人认为会产生幻觉的 ai 可能还达不到 agi 的标准。

本文翻译自:https://techcrunch.com/2025/05/22/anthropic-ceo-claims-ai-models-hallucinate-less-than-humans/

编译:chatgpt

科学分类资讯推荐

对话科学大咖|江宁:未来“脑机接口”设备或将人手几台,成都有明确的技术优势 - 天天要闻

对话科学大咖|江宁:未来“脑机接口”设备或将人手几台,成都有明确的技术优势

人口老龄化加深,老年健康和老年疾病防治成为广受关注的重大民生问题。为了加强老年性疾病的临床研究,四川大学华西医院特聘研究员、智能可穿戴老年健康系统研究室主任江宁加入了研究行列。他的团队研发的脑机接口设备将对脑卒中、阿尔茨海默病、肌少症、脑胶质瘤等疾病的治疗带来利好。5月24日下午,“科学大讲堂·我们的...
MIM工艺中使用气雾化316L不锈钢粉末 - 天天要闻

MIM工艺中使用气雾化316L不锈钢粉末

在金属注射成型(MIM)领域,气雾化与水雾化工艺制备的 316L 不锈钢粉末因制备原理差异,在粉末特性、工艺适配及终端产品性能上呈现显著区别。结合工程实践经验,从材料特性到生产应用的技术优势可系统性解析如下: 一、粉末物理特性的工程化差异
硬核!用“疼痛”敲响生命警钟 | 全国应急科普场馆巡礼 - 天天要闻

硬核!用“疼痛”敲响生命警钟 | 全国应急科普场馆巡礼

“安全规则不是写在墙上的标语,而是用血泪换来的生存指南。”在保信安全体感实训基地的触电体验区,记者手握模拟设备,一股刺痛感瞬间从指尖窜至全身——这是10毫安的安全电流,仅为日常触电事故的百分之一,却足以让人终身难忘。近日,记者探访了这座位于河北省唐山市曹妃甸新兴产业园区的沉浸式安全体感实训基地,亲身体...
超3000株!云南宁洱发现大规模珍稀植物桫椤群落 - 天天要闻

超3000株!云南宁洱发现大规模珍稀植物桫椤群落

近日,一名科普博主在云南省普洱市宁洱哈尼族彝族自治县意外发现了珍稀植物桫椤群落。经当地林草部门初步调查,该桫椤群落分布面积达200余亩,现存植株数量超过3000株。 桫椤,又称树蕨,是与恐....
科学家发现新矮行星 - 天天要闻

科学家发现新矮行星

#万能生活指南#快速导读科学家们最近发现了一颗位于太阳系边缘的矮行星2017 OF201,其轨道独特,绕太阳公转约需25,000年。该发现由国际天文学联合会的小行星中心确认,并已在预印本服务器arXiv上发布。
企鹅粪便与云形成的秘密 - 天天要闻

企鹅粪便与云形成的秘密

#万能生活指南#快速导读科学家在南极意外发现,企鹅的粪便释放的氨气竟是形成独特云源的关键。这项研究显示,企鹅粪便中的氮分解成氨气,与海洋微生物释放的硫气体反应,产生气溶胶并形成云。
天文学家实时观测星系点亮 - 天天要闻

天文学家实时观测星系点亮

#我在头条晒家乡#快速导读Zwicky瞬态设施通过广角相机每晚捕捉数百张图像,实时监测宇宙事件。2019年12月,系统发出警报,指向位于处女座的普通螺旋星系SDSS1335+0728,其核心在经历二十年宁静后意外亮起,可能是由于黑洞吞噬恒星