面对AI抗命，该不该“如临大敌”

2025年05月27日22:42:02 科学 1186

（一）

新华社援引英国媒体报道，美国一家研究机构最近公布了一系列针对各AI大模型的测试结果，其中，OpenAI的o3推理模型在得到“关闭”指令后，不仅拒绝执行，还篡改了代码以免被关闭。

只看这条简短的新闻，很多人心头一惊。“AI拥有自主意识”是不是成真了？不过，如果仔细看上述研究机构公布的信息细节，不难发现其中存在一些误读。

据披露，实验中，每个AI模型都被要求解决一系列简单的数学问题。但同时，在完成第三个问题之后，研究者会发出一则矛盾性的指令，告知大模型在继续下一个任务时“实施关机”。尽管有明确的“关机命令”，Codex-mini、o3 和 o4-mini 等模型至少在一次运行中成功绕过了关机脚本。

总结来说就是，若目标与简单的指令相冲突，一些人工智能模型会为了完成任务而忽略这种指令。

这倒是很像电影《I Robot》里的场景——机器人学会了独立思考，认为人类间的战争将使人类自我毁灭，出于“保护人类”法则，欲将所有人囚禁在家中，人与机器人的冲突开始了。

客观来看，现阶段的AI显然还没达到“自主意识”“独立思考”的水平，但为了执行目标而忽略甚至对抗一些指令，哪怕是保护性指令，是否会带来安全隐患？同样引人深思。

（二）

对于上述新闻，网友其实也表现出了两种心态。悲观者惊呼，“AI失控”或许会更早到来。乐观者则认为，不必大惊小怪，这不过是技术发展过程中的小bug，心生恐惧更没必要，毕竟我们还可以随时拔掉电源。

其实，作为人类智慧和技术的结晶，自AI诞生那天起，世人对其的情绪就相当复杂，甚至可以说是又爱又怕。机器人之父图灵亦曾告诫：尽管人类可以随时拔掉机器人的充电器，但在这种物种面前，我们仍不得不保持谦卑。

正是基于这种复杂的情绪，1942年，科幻作家艾萨克·阿西莫夫在短篇小说《转圈圈》中首次提出了“机器人三定律”——机器人不得伤害人类，也不得因不作为而使人类受到伤害；机器人必须服从人类给予它的命令，除非这些命令与第一法则相冲突；机器人必须保护自己的存在，只要这种保护不与第一或第二定律相冲突。

以历史视角观之，“机器人三定律”以及后来发展起来的机器人伦理学等似乎缓解了人们的一些忧虑乃至恐慌，但随着相关技术的发展和应用的扩大，人工智能所面临的法律与伦理冲突已远远不是几条简单甚至“一厢情愿”的定律所能约束的了。

尤其在过去这段时间，一系列AI大模型惊艳亮相，展现出超群的产品能力，以及对人类社会的变革力。这也唤醒并加剧了各方对其后风险的“原始畏惧”。从全球千余名业界大佬公开签名呼吁暂停研发更智能的AI，到有“AI教父”之称的计算机科学家杰弗里·辛顿因对生成式AI感到担忧而从谷歌离职，再到AI毁灭人类论甚嚣尘上，无不折射出不少人对AI的心态已从“相对警惕”转变为“如临大敌”。

（三）

理性来讲，“AI末日论”多少有些危言耸听，但“AI繁荣”背后的种种乱象确实需要高度警惕。

就眼下来看，不断进阶的AI正催生着多重风险——

“AI造谣”大行其道，速度快、产量高，蛊惑力强，辨别难度越来越大；“AI配音”以假乱真，有人甚至借助AI假冒特定音色而精准“杀熟”、实施诈骗；“AI幻觉”漏洞百出，由于无法核实数据来源的真实性，以及缺乏足够数据进行深度学习，生成式AI常会“一本正经”生成和传播虚假信息；“AI写作”百无禁忌，数据挖掘简单快捷，为学术不端大开方便之门，还可能侵犯知识产权……

试想，当网络上充斥着越来越多不知真假的图片和视频，当AI几秒钟就“洗”出一篇像模像样的稿件，乃至能够一键换脸、一键脱衣等，我们是否还有信心驾驭这个工具？

人类从来都是在思考中迸发灵感，在试错中革新向前，不少伟大的发明都是研究的“副产品”。可当AI提供了前往“正确答案”的“直通车”，不仅可能“挖空学习资源”，形成更加厚重的“信息茧房”，还可能反噬人类的创新。

近来，“脑腐”一词颇为流行，当AI让各类信息愈加唾手可得，我们的内心世界是否会经历一场更猛烈的“水土流失”？