中国科学家突破性发现:人工智能语言理解机制首次与人脑直接比较

2025年10月21日20:43:07 科学 1988

中国科学家突破性发现:人工智能语言理解机制首次与人脑直接比较 - 天天要闻

北京大学研究团队创新性地开发出可同时应用于人脑和大语言模型的探针技术,首次在相同实验框架下直接比较了人类大脑与人工智能系统的句法处理机制。这项发表在人工智能顶级会议NeurIPS 2025上的研究揭示,尽管人脑和大模型在句法层级结构加工上存在显著相似性,但不同智能体可能通过各自独特的路径实现语言理解能力,挑战了人工智能必须模仿人类认知的传统观念。

方方教授与王茜副研究员领导的跨学科团队联合浙江大学、北京语言大学等机构,提出了"层级化频率标记探针"技术,成功构建了人脑神经活动与机器学习模型内部表征的对比分析平台。通过这一创新方法,研究人员发现了语言智能中可能存在的普遍性原理,同时也观察到不同智能系统在实现相似功能时采用的策略差异。

研究结果表明,语言理解的复杂性远超此前认知,人工智能的发展路径可能比预想的更加多元化。这一发现不仅为理解大语言模型的工作机制提供了新视角,也为人工智能的未来发展方向提出了重要启示。

跨系统分析框架的技术突破

中国科学家突破性发现:人工智能语言理解机制首次与人脑直接比较 - 天天要闻

传统的人工智能可解释性研究往往局限于模型内部分析,难以建立与生物智能系统的直接对比。北京大学团队基于先前在神经科学领域建立的层级化频率标记方法,创造性地将其扩展到人工神经网络分析中,实现了生物神经系统与人工神经网络在统一计算框架下的比较研究。

在人脑实验部分,研究团队利用颅内立体脑电技术记录受试者在聆听以4Hz节奏呈现的句子时的神经活动。这种高精度的脑信号采集方法能够捕捉到大脑处理语言时的细微神经振荡模式。同时,在模型分析中,团队为GPT、Llama、Gemma和GLM等多种主流大语言模型构建了虚拟时间轴,将模型的内部激活信号转换到频域进行分析。

中国科学家突破性发现:人工智能语言理解机制首次与人脑直接比较 - 天天要闻

图1. HFTP实验范式与三种不同句法层级编码计算单元定义

这种并行分析方法的创新之处在于,它能够在相同的测量维度上比较完全不同的信息处理系统。通过将人脑的神经振荡和模型的激活模式都映射到频率空间,研究人员建立了两个系统之间可比较的"共同语言"。

实验结果显示,无论是人脑还是大语言模型,都在1Hz和2Hz频段表现出稳定的特征响应,分别对应句子级别和短语级别的句法处理。这种跨系统的频率对应关系提供了语言层级结构处理存在普遍性计算原理的有力证据。

智能系统中的功能模块化现象

更深入的分析揭示了人脑和人工神经网络中都存在功能特化的处理单元。研究团队识别出三类不同的功能单元:专门处理句子级信息的单元、专门处理短语级信息的单元,以及同时参与两个层级处理的"共享单元"。

中国科学家突破性发现:人工智能语言理解机制首次与人脑直接比较 - 天天要闻

图2. A. GPT-2在第六层的神经元所产生的层次化句法加工模式; B. 人脑颞中回的层次化句法加工模式

这种功能模块化的发现具有重要的理论意义。它表明无论是经过数百万年进化塑造的生物神经网络,还是通过机器学习训练的人工神经网络,都倾向于发展出专门化的功能模块来处理不同层次的语言结构。这种收敛性暗示了信息处理效率优化的普遍性约束。

在人脑中,这些功能单元主要分布在颞中回等与语言处理密切相关的脑区。而在大语言模型中,类似的功能分化现象出现在模型的中间层,特别是在GPT-2的第六层观察到了与人脑颞中回高度相似的层级化句法加工模式。

值得注意的是,这种跨系统的功能对应关系实现了人脑神经表征与模型内部表征在频谱空间的对齐。这种"表征对齐"为理解不同智能系统如何处理相同信息提供了定量化的比较框架。

模型规模与类人性的复杂关系

中国科学家突破性发现:人工智能语言理解机制首次与人脑直接比较 - 天天要闻

图3. 运用HFTP技术的表征对齐工作流程

研究中一个出人意料的发现是,模型规模的增大并不总是带来与人脑更高的相似性。通过对不同规模和版本的模型进行比较,研究团队发现了一个反直觉的现象:某些较新或较大的模型与人脑的对齐程度反而低于其前代版本。

例如,Gemma 2在句法处理方面与人脑的相似性显著高于第一代Gemma模型,显示出技术迭代带来的正面效应。然而,Llama 3.1的表现却不如Llama 2,表明模型的优化方向可能偏离了与人类认知机制的一致性。

这一发现挑战了人工智能发展中的一个重要假设:即更大更强的模型必然会更接近人类的认知方式。研究结果表明,模型性能的提升可能通过多种不同的路径实现,其中一些路径可能远离人类的认知模式。

表1. 不同大模型与人脑的句法对齐表现

中国科学家突破性发现:人工智能语言理解机制首次与人脑直接比较 - 天天要闻

Sm, b:模型-人脑相似性

这种现象反映了人工智能系统在优化过程中可能探索出人类未曾使用的信息处理策略。从进化的角度来看,这并不令人意外。人类大脑的结构和功能受到了生物进化历程中诸多约束的限制,而人工神经网络在优化过程中面临的约束条件完全不同,因此可能发现通向同样目标的不同路径。

研究团队的量化分析显示,不同模型与人脑的句法对齐表现存在显著差异,这种差异不仅体现在对齐程度上,也体现在对齐的具体模式上。这表明即使在处理相同的语言任务时,不同的智能系统也可能采用根本不同的计算策略。

这一发现对人工智能的发展具有重要启示。它暗示研究人员在追求模型性能提升的同时,需要更加关注模型的内在机制,特别是在需要与人类协作或理解人类行为的应用场景中。

从更广阔的视角来看,这项研究提出了关于智能本质的深刻问题。如果不同的系统能够通过不同的机制实现相似的功能表现,那么智能可能不是一个单一的、具有固定实现方式的概念,而是一个可以通过多种路径实现的功能性目标。

这种多路径智能假说为人工智能的未来发展开辟了新的思考空间。它意味着我们不必局限于模仿人类认知的单一路径,而可以探索多种可能的智能实现方式,每种方式都可能在特定的应用领域具有独特的优势。

HFTP技术框架的建立为这种跨系统比较研究提供了强有力的工具。未来的研究可以利用这一框架探索更多认知功能的跨系统比较,为理解智能的本质和多样性提供更丰富的实证基础。

科学分类资讯推荐

首张嗅觉图谱问世 或重塑嗅觉形成认知 - 天天要闻

首张嗅觉图谱问世 或重塑嗅觉形成认知

研究人员以前所未有的细节绘制了小鼠鼻腔中的嗅觉受体分布图谱。这一成果颠覆了人们对鼻子如何产生嗅觉的认知。△小鼠鼻腔的显微镜横截面图像,显示了鼻腔上皮的解剖结构。图片来源:Datta Lab4月28日发表于《细胞》的一项研究,揭示了感觉神经元上表达的约1100个嗅觉受体是如何在鼻腔内壁上皮组织中受到严格调控的空间位置...
心脏为什么不会得癌症? - 天天要闻

心脏为什么不会得癌症?

心脏为什么不会得癌症?心肌细胞会进行有节律的搏动,并在个体出生后停止增殖,因此,心脏没有再生能力。近日,意大利的里雅斯特大学医学院Serena Zacchigna团队完成的体内癌症模型和离体工程心脏组织实验表明,心肌细胞搏动所产生的机械力负
暴雨、冰雹要来,广东天气明起大反转!珠海接下来…… - 天天要闻

暴雨、冰雹要来,广东天气明起大反转!珠海接下来……

【来源:珠海发布】“五一”假期前两天, 珠海天气晴好,大家都去哪里玩了?不过天气马上要反转再反转了! 广东明天好天气要暂时“下线”,局部有大暴雨、小冰雹;珠海明天午后也将有雷雨+10级大风…… 这场雨会持续多久?假期接下来的天气会怎样?赶紧
河北衡水:假日邂逅飞行 低空魅力引游人 - 天天要闻

河北衡水:假日邂逅飞行 低空魅力引游人

5月2日,位于河北省衡水市的中国航协衡水航空飞行营地,各类飞行表演和低空飞行器展示吸引市民游客观赏。中国桃城第四届“翱翔中国”全国低空无人飞行器大赛暨第二届京津冀低空飞行器集采会于5月1日至2日在此举行。图为游客近距离参观飞行器。
可拍原子运动过程 揭秘地下30米的“国之重器” - 天天要闻

可拍原子运动过程 揭秘地下30米的“国之重器”

来源:央视新闻客户端坐落在上海张江的硬X射线自由电子激光装置是“十三五”国家重大科技基础设施建设规划优先启动项目,也是上海(长三角)国际科技创新中心核心空间载体——张江科学城重大科技基础设施集群的旗舰装置,是我国实现2035年建成科技强国战