研究人员表示,AI正在悄悄改写你的世界观,而你浑然不知

每天,全球有数亿人打开ChatGPT、Claude或Gemini,请它们帮忙写邮件、整理思路、回答问题。大多数人觉得,这不过是在用一个更聪明的搜索引擎。

但南加州大学多恩西夫文理学院的研究人员在《行为与脑科学政策洞察》期刊发表的最新研究,给出了一个令人不安的结论:你以为在使用AI,AI也在塑造你。

它不是中立的镜子,而是一面有偏角的透镜

这项研究的核心发现,指向一个被研究者命名为"WHELM"的概念,这个缩写代表西方化、高收入、受过良好教育、自由主义和男性化视角。研究者发现,目前主流的大型语言模型,在价值判断、沟通方式乃至道德推理上,都系统性地向这一视角倾斜,原因很直接,它们的训练数据绝大部分来自英语互联网,而英语互联网本身就高度集中于北美和欧洲的内容生产者。

这不是技术故障,而是一种结构性偏差。

论文第一作者、社会心理学博士生亚尔达·达里亚尼说得很直白:"当你向AI寻求建议时,你得到的并不是中立的答案,而是特定群体的观点,即使它没有明确说明这一点。"比如,当用户用非英语语言提问时,这些模型仍然倾向于用美国节日、英语电影或欧洲文化习俗来举例,对非西方传统的描述则明显粗糙,甚至充满刻板印象。

更深的问题在于价值取向。研究显示,AI系统在处理道德问题时,倾向于优先强调个人自由和公平,而对传统、权威、社群归属这些在许多非西方文化中居于核心位置的价值观,则表现出明显的轻视或忽略,这并非AI的"选择",而是训练数据分布的必然投影。

发表于《认知科学趋势》的相关研究进一步表明,这种同质化效应不只来自训练语料的偏差,还被训练过程本身放大了,因为模型在优化时倾向于产生"最被认可"的输出,而认可标准本身就是由特定文化背景下的标注人员制定的,这形成了一条难以察觉的偏见传导链。

反馈循环:越用越像,越像越用

南加州大学道德与语言实验室主任莫尔特扎·德赫加尼描述了一个让人警惕的自我强化机制。他说:"我们越依赖这些系统,它们的输出就越成为我们共享知识的一部分,而这些知识又被用来训练下一代AI,于是这个循环不断自我强化。"

这个循环在现实中已经有了可见的早期迹象。当数亿人每天使用AI辅助写作时,文本风格开始趋同,措辞模式开始标准化,就连表达情绪和构建论点的方式,也在潜移默化中向AI的"偏好"靠拢。达里亚尼指出:"当数百万人使用AI撰写信息时,那些文化差异就开始消失,随着时间推移,我们所有人的说话方式可能都会变得非常相似。"

这里的"相似",并不是中性的趋同,而是朝向一个特定方向的收缩,语言多样性减少了,沟通方式标准化了,最终可能波及的,是人们思考问题和理解世界的框架本身。研究者强调,文化多样性不只是语言习俗的问题,它深刻影响着人类解决问题的方式和创造力的边界,一旦这种多样性系统性萎缩,社会将失去的远不止几种方言或节日。

面对这一挑战,研究团队提出了三个层面的干预建议。首先是扩大训练数据的文化覆盖,纳入更多来自不同语言、地区和文化传统的内容,系统性补充被低估的文化知识。其次是在模型微调阶段引入更多元化的文化视角,咨询人类学家、语言学家和不同社区的代表,而不只依赖单一标准评估输出质量。第三是改变现有的评估机制,让评审人员依据多元标准而非统一的西方化基准来判断模型回应的质量。

达里亚尼在论文结尾的那句话,值得被记住:"语言、传统、思维方式,一旦消失,就再也找不回来了。问题不在于修复起来是否困难,而在于我们是否能承担不修复的后果。"

AI的时代才刚刚开始,而它能否容纳整个世界,而不只是世界的一部分,将是这个时代最重要的技术伦理命题之一。