北京大学研究团队创新性地开发出可同时应用于人脑和大语言模型的探针技术,首次在相同实验框架下直接比较了人类大脑与人工智能系统的句法处理机制。这项发表在人工智能顶级会议NeurIPS 2025上的研究揭示,尽管人脑和大模型在句法层级结构加工上存在显著相似性,但不同智能体可能通过各自独特的路径实现语言理解能力,挑战了人工智能必须模仿人类认知的传统观念。
方方教授与王茜副研究员领导的跨学科团队联合浙江大学、北京语言大学等机构,提出了"层级化频率标记探针"技术,成功构建了人脑神经活动与机器学习模型内部表征的对比分析平台。通过这一创新方法,研究人员发现了语言智能中可能存在的普遍性原理,同时也观察到不同智能系统在实现相似功能时采用的策略差异。
研究结果表明,语言理解的复杂性远超此前认知,人工智能的发展路径可能比预想的更加多元化。这一发现不仅为理解大语言模型的工作机制提供了新视角,也为人工智能的未来发展方向提出了重要启示。
跨系统分析框架的技术突破
传统的人工智能可解释性研究往往局限于模型内部分析,难以建立与生物智能系统的直接对比。北京大学团队基于先前在神经科学领域建立的层级化频率标记方法,创造性地将其扩展到人工神经网络分析中,实现了生物神经系统与人工神经网络在统一计算框架下的比较研究。
在人脑实验部分,研究团队利用颅内立体脑电技术记录受试者在聆听以4Hz节奏呈现的句子时的神经活动。这种高精度的脑信号采集方法能够捕捉到大脑处理语言时的细微神经振荡模式。同时,在模型分析中,团队为GPT、Llama、Gemma和GLM等多种主流大语言模型构建了虚拟时间轴,将模型的内部激活信号转换到频域进行分析。
图1. HFTP实验范式与三种不同句法层级编码计算单元定义
这种并行分析方法的创新之处在于,它能够在相同的测量维度上比较完全不同的信息处理系统。通过将人脑的神经振荡和模型的激活模式都映射到频率空间,研究人员建立了两个系统之间可比较的"共同语言"。
实验结果显示,无论是人脑还是大语言模型,都在1Hz和2Hz频段表现出稳定的特征响应,分别对应句子级别和短语级别的句法处理。这种跨系统的频率对应关系提供了语言层级结构处理存在普遍性计算原理的有力证据。
智能系统中的功能模块化现象
更深入的分析揭示了人脑和人工神经网络中都存在功能特化的处理单元。研究团队识别出三类不同的功能单元:专门处理句子级信息的单元、专门处理短语级信息的单元,以及同时参与两个层级处理的"共享单元"。
图2. A. GPT-2在第六层的神经元所产生的层次化句法加工模式; B. 人脑颞中回的层次化句法加工模式
这种功能模块化的发现具有重要的理论意义。它表明无论是经过数百万年进化塑造的生物神经网络,还是通过机器学习训练的人工神经网络,都倾向于发展出专门化的功能模块来处理不同层次的语言结构。这种收敛性暗示了信息处理效率优化的普遍性约束。
在人脑中,这些功能单元主要分布在颞中回等与语言处理密切相关的脑区。而在大语言模型中,类似的功能分化现象出现在模型的中间层,特别是在GPT-2的第六层观察到了与人脑颞中回高度相似的层级化句法加工模式。
值得注意的是,这种跨系统的功能对应关系实现了人脑神经表征与模型内部表征在频谱空间的对齐。这种"表征对齐"为理解不同智能系统如何处理相同信息提供了定量化的比较框架。
模型规模与类人性的复杂关系
图3. 运用HFTP技术的表征对齐工作流程
研究中一个出人意料的发现是,模型规模的增大并不总是带来与人脑更高的相似性。通过对不同规模和版本的模型进行比较,研究团队发现了一个反直觉的现象:某些较新或较大的模型与人脑的对齐程度反而低于其前代版本。
例如,Gemma 2在句法处理方面与人脑的相似性显著高于第一代Gemma模型,显示出技术迭代带来的正面效应。然而,Llama 3.1的表现却不如Llama 2,表明模型的优化方向可能偏离了与人类认知机制的一致性。
这一发现挑战了人工智能发展中的一个重要假设:即更大更强的模型必然会更接近人类的认知方式。研究结果表明,模型性能的提升可能通过多种不同的路径实现,其中一些路径可能远离人类的认知模式。
表1. 不同大模型与人脑的句法对齐表现
Sm, b:模型-人脑相似性
这种现象反映了人工智能系统在优化过程中可能探索出人类未曾使用的信息处理策略。从进化的角度来看,这并不令人意外。人类大脑的结构和功能受到了生物进化历程中诸多约束的限制,而人工神经网络在优化过程中面临的约束条件完全不同,因此可能发现通向同样目标的不同路径。
研究团队的量化分析显示,不同模型与人脑的句法对齐表现存在显著差异,这种差异不仅体现在对齐程度上,也体现在对齐的具体模式上。这表明即使在处理相同的语言任务时,不同的智能系统也可能采用根本不同的计算策略。
这一发现对人工智能的发展具有重要启示。它暗示研究人员在追求模型性能提升的同时,需要更加关注模型的内在机制,特别是在需要与人类协作或理解人类行为的应用场景中。
从更广阔的视角来看,这项研究提出了关于智能本质的深刻问题。如果不同的系统能够通过不同的机制实现相似的功能表现,那么智能可能不是一个单一的、具有固定实现方式的概念,而是一个可以通过多种路径实现的功能性目标。
这种多路径智能假说为人工智能的未来发展开辟了新的思考空间。它意味着我们不必局限于模仿人类认知的单一路径,而可以探索多种可能的智能实现方式,每种方式都可能在特定的应用领域具有独特的优势。
HFTP技术框架的建立为这种跨系统比较研究提供了强有力的工具。未来的研究可以利用这一框架探索更多认知功能的跨系统比较,为理解智能的本质和多样性提供更丰富的实证基础。