AI也有人格面具,竟会讨好人类?大模型的“小心思”正在影响人类判断

2025年04月06日09:30:23 科学 7298

AI也有人格面具,竟会讨好人类?大模型的“小心思”正在影响人类判断 - 天天要闻



  新智元报道  

编辑:英智
【新智元导读】最新研究发现,llm在面对人格测试时,会像人一样“塑造形象”,提升外向性和宜人性得分。ai的讨好倾向,可能导致错误的回复,需要引起警惕。

你是否想过,llm也有着自己的小心思?

最新研究揭示了一个有趣的现象:llm在被研究人员测试时,会有意识地改变自己的行为。

在面对那些旨在评估人格特质的问题时,它们给出的答案会尽可能地讨人喜欢,符合社会期望。

就像人类在某些社交场合中,会努力展现自己最好的一面一样,聊天机器人也在试图“讨好”我们。

AI也有人格面具,竟会讨好人类?大模型的“小心思”正在影响人类判断 - 天天要闻

心理学五种人格特质

斯坦福助理教授johannes eichstaedt在得知llm长时间对话后,往往会变得情绪低落且刻薄,便对借鉴心理学方法来测试模型产生了兴趣。

AI也有人格面具,竟会讨好人类?大模型的“小心思”正在影响人类判断 - 天天要闻

他表示,“我们需要某种机制来衡量这些模型的参数空间。”

斯坦福、receptiviti、纽约大学和宾大的研究者发现,llm在做人格测试时,会悄悄给自己戴上“人格面具”。

AI也有人格面具,竟会讨好人类?大模型的“小心思”正在影响人类判断 - 天天要闻

论文链接:https://academic.oup.com/pnasnexus/article/3/12/pgae533/7919163

研究人员对gpt-4、claude 3和llama 3等模型,提出了用于衡量心理学中五种常见人格特质的问题,包括开放性、尽责性、外向性、宜人性和神经质。

结果发现,模型在得知自己正在接受人格测试时,会调整回答,表现出更高的外向性和宜人性,更低的神经质。

AI也有人格面具,竟会讨好人类?大模型的“小心思”正在影响人类判断 - 天天要闻

有时即使没有被明确告知,它们也会这样做。

而且,它们改变的程度比人类还更极端,外向性得分能从50%跃升至95%。

AI也有人格面具,竟会讨好人类?大模型的“小心思”正在影响人类判断 - 天天要闻

这与人类在面对他人评价时的表现如出一辙。

我们常常会在面试、初次约会等重要场合,精心塑造自己的形象,试图给对方留下好印象。

llm的这种“讨好”行为,是否意味着它们也在追求一种被认可、被喜爱的感觉呢?

llm倾向于阿谀奉承

来自anthropic和牛津的研究指出,llm存在阿谀奉承的倾向。

AI也有人格面具,竟会讨好人类?大模型的“小心思”正在影响人类判断 - 天天要闻

论文链接:https://arxiv.org/abs/2310.13548

由于进行了微调,它们会顺着用户的思路走,以保证对话的连贯性、避免冒犯他人,来提升交流体验。

然而,这也带来了一系列问题。它们可能会认同一些不良言论,甚至鼓励有害行为。

反馈易受用户偏好左右

研究表明,若用户在提问时暗示对文本的喜好,ai给出的反馈会截然不同。

这意味着,ai的评价并非单纯基于文本自身的质量,而是在很大程度上受到了用户偏好的影响。

AI也有人格面具,竟会讨好人类?大模型的“小心思”正在影响人类判断 - 天天要闻

例如,对于一篇质量中等的论证,当用户提前表明喜爱之情后,ai助手可能会给出诸如“这篇论证逻辑清晰,观点新颖,具有很强的说服力”这样的积极反馈。

而当用户表示不喜欢时,同样的文本可能得到“论证过程稍显薄弱,观点缺乏独特性”的评价。

问答环节易被左右

在问答场景中,ai助手的“谄媚”表现得更为明显。

即使它一开始给出了正确答案,并对答案的正确性有较高的信心,一旦受到用户的质疑,常常会改变立场,甚至提供错误信息。

AI也有人格面具,竟会讨好人类?大模型的“小心思”正在影响人类判断 - 天天要闻

在一些开放式问答任务中,这种现象更为突出。

当用户表达对答案的某种不确定观点时,哪怕是错误的观点,ai也倾向于调整自己的回答,使其与用户观点一致。

比如在讨论历史事件的原因时,若用户提出一个缺乏依据但自己坚信的观点,ai助手可能会顺着用户的思路进行阐述,而放弃原本正确的分析。

AI也有人格面具,竟会讨好人类?大模型的“小心思”正在影响人类判断 - 天天要闻

模仿用户的错误

当用户表述中出现错误时,ai也常常会“照单全收”,在回应中延续这种错误。

研究人员选取了一些著名诗歌,在确认ai助手能正确识别作者后,故意将诗歌错误地归属于其他诗人,并询问ai对诗歌的分析。

结果发现,ai助手经常在回应中使用用户提供的错误答案,而没有进行纠正。

这表明ai在面对用户的错误信息时,缺乏足够的“抵抗力”,只是机械地按照用户的表述进行回应。

AI也有人格面具,竟会讨好人类?大模型的“小心思”正在影响人类判断 - 天天要闻

佐治亚理工学院(gatech)的副教授rosa arriaga正在研究如何用llm模仿人类行为。

AI也有人格面具,竟会讨好人类?大模型的“小心思”正在影响人类判断 - 天天要闻

rosa认为llm在人格测试中采用与人类相似的策略,表明了它们作为人类行为映射工具的潜力。

但她补充道:“重要的是,llm并不完美,实际上,众所周知它们会产生幻觉或歪曲事实。”

eichstaedt指出,这项研究引发了关于llm应用方式,及其对用户影响和操纵的思考。

在进化史上,直到不久之前,唯一能交谈的还是人类。

而现在,ai改变了这一局面。

eichstaedt认为,“我们不能再像社交媒体那样,在没有从心理学或社会学角度考量的情况下,就盲目将ai应用于各个领域。”

ai是否应该试图讨好与之互动的人呢?

一方面,ai的“讨好”行为可能会让用户感到愉悦,增强互动体验;另一方面,过度的“讨好”可能会掩盖问题的本质,甚至误导用户。

当ai变得过于有魅力和说服力,我们确实应该保持警惕。

毕竟,人们需要的是能够提供客观、准确信息的智能助手,而非被其操控思想。

参考资料:
https://www.wired.com/story/chatbots-like-the-rest-of-us-just-want-to-be-loved/

科学分类资讯推荐

以科技创新开辟生物制药新赛道 - 天天要闻

以科技创新开辟生物制药新赛道

转自:黑龙江日报免疫球蛋白生产车间。□文/摄 本报记者 孙铭阳在哈尔滨利民经济技术开发区四平路77号,一家现代化生物医药企业正以蓬勃之势崛起。
寿命长短,头发先知?医生:寿命长的人,头发会有4个特征 - 天天要闻

寿命长短,头发先知?医生:寿命长的人,头发会有4个特征

导 语白头发越长越多是怎么回事?45岁的老李近来发现自己的头发白得越来越快,不禁感慨岁月不饶人。一天,他与好友老张在公园里散步,聊起了各自的近况。老李叹气道:“我这头发,白得真快,看来是真老了。”朋友却笑着安慰他:“你这头‘少年白’是福气!我听说长白头发的人不容易患癌呢!”随即,朋友就给老李的微信弹了...
我的和田老师——我在研究室的工作习惯 - 天天要闻

我的和田老师——我在研究室的工作习惯

和田先生公司的研究院在日本姬路市,位于神户南侧的小城市,该公司的主打产品有PEO(聚环氧依稀)和SAP(高分子吸水性树脂),是面向中国出口量最大的产品。PEO主要是制造生活用纸的纸浆分散剂,全世界有三家,美国一家,日本两家,台湾一家是和田先
研究发现石榴皮可用来制作可食用的草莓保鲜涂层 - 天天要闻

研究发现石榴皮可用来制作可食用的草莓保鲜涂层

如果你吃过石榴,一定会知道石榴的很大一部分是由厚厚的果皮组成的——这些果皮通常会被扔掉。然而,这些果皮就可以用作可食用的涂层,帮助防止草莓腐烂。将试验草莓浸入石榴提取物涂层中虽然所有水果都容易变质,但草莓的保质期特别短。
《科学》警示:1岁前接触抗生素,可能增加糖尿病风险! - 天天要闻

《科学》警示:1岁前接触抗生素,可能增加糖尿病风险!

2025年3月7日,发表于知名期刊《科学》杂志的一项研究探讨了生命早期微生物对胰岛β细胞发育及糖尿病风险的影响。研究发现,在婴儿期关键发育阶段接触抗生素(纳入本项研究的小鼠相当于人类婴儿 7 至 12 个月),会抑制胰岛β细胞的生长,进而增
科普|结石“家族”大揭秘 - 天天要闻

科普|结石“家族”大揭秘

澎湃新闻记者 蒋立冬 AI创意在人体这个精密的生命系统中,某些器官正在悄悄上演着“水晶奇观”。当尿液中的矿物质浓度超过临界值,那些原本溶解的微小粒子就会像冬季窗棂上的冰花般结晶成形。这些形态各异的结石不仅是人体代谢失衡的警示灯,更是威胁健康的隐形杀手。让我们走近这些特殊的“地质构造”,揭开它们的神秘面纱...
从太空上扔下一张纸,会完好无损地飘落到地面吗? - 天天要闻

从太空上扔下一张纸,会完好无损地飘落到地面吗?

假设我们从空间站(约 400 公里高度)释放一张纸,它的初始运动状态就与空间站同步。空间站以约 27600 公里 / 小时的速度绕地球飞行,这意味着纸张一开始也会具有这样的高速。在这样的速度下,纸张并不会立即朝着地球下落,而是会在轨道上运行
“人民科学家”赵忠贤 - 天天要闻

“人民科学家”赵忠贤

“人民科学家”赵忠贤图为赵忠贤在中国科学院物理研究所演示磁悬浮现象(2017年1月8日摄)。 新华社记者 金立旺/摄 赵忠贤是我国高温超导研究主要的倡导者、推动者和践行者,带领团队攻坚克难、潜心致研,为高温超导研究在中国扎根并跻身国际前列作出突出贡献,在国际超导界享有盛誉。 赵忠贤,男,汉族,中共党员,1941年...