面对AI抗命,该不该“如临大敌”

2025年05月27日22:42:02 科学 1186

(一)

新华社援引英国媒体报道,美国一家研究机构最近公布了一系列针对各AI大模型的测试结果,其中,OpenAI的o3推理模型在得到“关闭”指令后,不仅拒绝执行,还篡改了代码以免被关闭。

只看这条简短的新闻,很多人心头一惊。“AI拥有自主意识”是不是成真了?不过,如果仔细看上述研究机构公布的信息细节,不难发现其中存在一些误读。

据披露,实验中,每个AI模型都被要求解决一系列简单的数学问题。但同时,在完成第三个问题之后,研究者会发出一则矛盾性的指令,告知大模型在继续下一个任务时“实施关机”。尽管有明确的“关机命令”,Codex-mini、o3 和 o4-mini 等模型至少在一次运行中成功绕过了关机脚本。

总结来说就是,若目标与简单的指令相冲突,一些人工智能模型会为了完成任务而忽略这种指令。

这倒是很像电影《I Robot》里的场景——机器人学会了独立思考,认为人类间的战争将使人类自我毁灭,出于“保护人类”法则,欲将所有人囚禁在家中,人与机器人的冲突开始了。

客观来看,现阶段的AI显然还没达到“自主意识”“独立思考”的水平,但为了执行目标而忽略甚至对抗一些指令,哪怕是保护性指令,是否会带来安全隐患?同样引人深思。

面对AI抗命,该不该“如临大敌” - 天天要闻

(二)

对于上述新闻,网友其实也表现出了两种心态。悲观者惊呼,“AI失控”或许会更早到来。乐观者则认为,不必大惊小怪,这不过是技术发展过程中的小bug,心生恐惧更没必要,毕竟我们还可以随时拔掉电源。

其实,作为人类智慧和技术的结晶,自AI诞生那天起,世人对其的情绪就相当复杂,甚至可以说是又爱又怕。机器人之父图灵亦曾告诫:尽管人类可以随时拔掉机器人的充电器,但在这种物种面前,我们仍不得不保持谦卑。

正是基于这种复杂的情绪,1942年,科幻作家艾萨克·阿西莫夫在短篇小说《转圈圈》中首次提出了“机器人三定律”——机器人不得伤害人类,也不得因不作为而使人类受到伤害;机器人必须服从人类给予它的命令,除非这些命令与第一法则相冲突;机器人必须保护自己的存在,只要这种保护不与第一或第二定律相冲突。

以历史视角观之,“机器人三定律”以及后来发展起来的机器人伦理学等似乎缓解了人们的一些忧虑乃至恐慌,但随着相关技术的发展和应用的扩大,人工智能所面临的法律与伦理冲突已远远不是几条简单甚至“一厢情愿”的定律所能约束的了。

尤其在过去这段时间,一系列AI大模型惊艳亮相,展现出超群的产品能力,以及对人类社会的变革力。这也唤醒并加剧了各方对其后风险的“原始畏惧”。从全球千余名业界大佬公开签名呼吁暂停研发更智能的AI,到有“AI教父”之称的计算机科学家杰弗里·辛顿因对生成式AI感到担忧而从谷歌离职,再到AI毁灭人类论甚嚣尘上,无不折射出不少人对AI的心态已从“相对警惕”转变为“如临大敌”。

面对AI抗命,该不该“如临大敌” - 天天要闻

(三)

理性来讲,“AI末日论”多少有些危言耸听,但“AI繁荣”背后的种种乱象确实需要高度警惕。

就眼下来看,不断进阶的AI正催生着多重风险——

“AI造谣”大行其道,速度快、产量高,蛊惑力强,辨别难度越来越大;“AI配音”以假乱真,有人甚至借助AI假冒特定音色而精准“杀熟”、实施诈骗;“AI幻觉”漏洞百出,由于无法核实数据来源的真实性,以及缺乏足够数据进行深度学习,生成式AI常会“一本正经”生成和传播虚假信息;“AI写作”百无禁忌,数据挖掘简单快捷,为学术不端大开方便之门,还可能侵犯知识产权……

试想,当网络上充斥着越来越多不知真假的图片和视频,当AI几秒钟就“洗”出一篇像模像样的稿件,乃至能够一键换脸、一键脱衣等,我们是否还有信心驾驭这个工具?

人类从来都是在思考中迸发灵感,在试错中革新向前,不少伟大的发明都是研究的“副产品”。可当AI提供了前往“正确答案”的“直通车”,不仅可能“挖空学习资源”,形成更加厚重的“信息茧房”,还可能反噬人类的创新。

近来,“脑腐”一词颇为流行,当AI让各类信息愈加唾手可得,我们的内心世界是否会经历一场更猛烈的“水土流失”?

面对AI抗命,该不该“如临大敌” - 天天要闻

(四)

技术是把双刃剑,如何把握好技术创新与防范风险的平衡向来是一道难题。在科技伦理上,这通常被称为“科林格里奇困境”——技术尚未出现,监管者无法提前预测其影响并采取行动;而当它已经出现时,采取行动往往已为时过晚或成本过高。

相对乐观的是,历史证明,人类总能通过不断适应新技术的发展而调整治理手段,一次次从这种困境中走出来。如今,针对AI治理各国也在积极行动。

去年8月,世界上首部关于人工智能的全面法规《欧洲人工智能法》正式生效;中国也制定了《人工智能生成合成内容标识办法》,将于今年9月1日起施行。新规从大模型的数据来源要可靠、对AI生成的内容应履行告知义务、一旦造成损害相关责任方需要承担责任等诸多方面,给生成式AI的发展套上了“笼头”。

诚如比尔·盖茨所言,真正在全球范围内暂停人工智能技术的开发,已经不太现实。但确保其被健康地使用,防止打开潘多拉魔盒,是必要的。当然,其间的平衡并不好把握。

对待技术狂飙,我们当然不能因噎废食。但现实警示我们,除了加快创新速度、谋求技术突破,如何构建一套趋利避害的AI治理体系,是那条不可忽视的安全带。力求秩序保障与创新提升协同,方能最大程度争取科技进步、科技向善。

撰文:晁星

来源:长安街知事

流程编辑:U022

科学分类资讯推荐

被云吸至8000米高空成“冰人”后奇迹生还  当事人讲述从遇险到脱险过程 - 天天要闻

被云吸至8000米高空成“冰人”后奇迹生还 当事人讲述从遇险到脱险过程

央广网北京5月28日消息(总台记者柴世文 白杰戈 景明)据中央广播电视总台中国之声报道,一位滑翔伞爱好者被气流抬升到八千米高空,在低至零下40摄氏度的缺氧环境下死里逃生的经历,这两天通过网络视频和社交媒体广泛传播,备受关注。55岁的当事人彭先生昨晚接受总台记者专访,介绍了自己从遇险到脱险的过程。 彭先生脱险后...
贵州这个洞美得有点不真实!开发还是保护? - 天天要闻

贵州这个洞美得有点不真实!开发还是保护?

【来源:百姓关注】在地球漫长的地质史诗中,一段被封印了多年的秘密意外启封。在贵州省遵义市道真仡佬族苗族自治县深山里,一条为农业灌溉开凿的引水涵洞,将一片纯白如雪的“地下水晶宫”从古生代的沉寂中唤醒。
今早,云南临沧市永德县发生地震 - 天天要闻

今早,云南临沧市永德县发生地震

【来源:昆明信息港】据中国地震台网正式测定,5月28日7时21分在云南临沧市永德县发生3.2级地震,震源深度10公里,震中位于北纬24.16度,东经99.41度。基础背景 震中地形:震中5公里范围内平均海拔约996米。
云端帝国的陨落:兴登堡号飞艇的荣耀与毁灭 - 天天要闻

云端帝国的陨落:兴登堡号飞艇的荣耀与毁灭

当1936年3月4日清晨的薄雾中,齐柏林公司首席设计师路德维希·杜尔在腓特烈港船坞仰望这座庞然巨物时,他或许不会想到,这个凝聚着德意志工程智慧的造物,将在十四个月后化作一团燃烧的噩梦。
夜探洞庭湖 热成像仪记录麋鹿母子回家历险记 - 天天要闻

夜探洞庭湖 热成像仪记录麋鹿母子回家历险记

这几天,总台记者一直跟随着湖南林业部门一起在东洞庭湖国家级自然保护区做监测调查。为了解洞庭湖麋鹿的夜里活动情况,总台记者和保护区的工作人员,首次通过热成像技术搜寻记录洞庭湖麋鹿的身影。夜晚的洞庭湖深处,热成像相机记录到一只雌鹿带着幼崽在芦苇丛中穿行,幼鹿跟在母亲身后一跳一跳的。在行进过程中,雌鹿母子...
呼吸之友||电子烟真的是更安全的替代品吗? - 天天要闻

呼吸之友||电子烟真的是更安全的替代品吗?

破除电子烟迷思守护呼吸健康-Breathing Companion-关注呼吸之友,关注呼吸健康引言-TEACHING SEMINARS- “电子烟无害”“替烟更健康”——这类营销话术让许多人误以为电子烟是传统卷烟的“安全平替”。然而,最新研究敲响警钟:电子烟不仅未降低风险,反而可能将肺癌风险推高至38.7倍!今天,我们揭开电子烟的真相。电子烟...
杜苏芮、苏拉、海葵被“除名” 台风名称为什么会被替换? - 天天要闻

杜苏芮、苏拉、海葵被“除名” 台风名称为什么会被替换?

记者今天(5月28日)从中国气象局获悉,在今年2月份召开的世界气象组织台风委员会第57次届会上,与会会员达成一致,决定对2024年度3个台风名称进行替换。新增的3个台风名称分别是“Bori”“Saobien”和“Tianma”。其中,“Bori”由韩国提供,用于替换“Doksuri/杜苏芮”;“Saobien”由越南提供,替换“Saola/苏拉”;“T...
来宾象州成功救助4只落难“毛孩”,居然是国家二级保护动物 - 天天要闻

来宾象州成功救助4只落难“毛孩”,居然是国家二级保护动物

近日,来宾市象州县境内遭遇持续强降雨天气,象州县公安局先后接到3起群众求助报警,称在树下发现疑似鹰类幼崽的野生动物。接警后,相关部门迅速行动,将4只幼崽移交至县林业局。经鉴定,这批幼崽包括2只鸺鹠和2只领角鸮,均为国家二级保护动物。右边两只为第一批发现救助的领角鸮,左边第一只为第二批发现救助的鸺鹠。据象...
趣味实验点亮科技梦 - 天天要闻

趣味实验点亮科技梦

【来源:菏泽日报】日前,山师中铁实验学校小学部以“科技筑梦 强国有我”为主题的2025年校园科技节开幕。活动现场,学生们化身小小“科学家”,通过“悬浮的鸡蛋”“磁力小车”“隔空捏气球”“自制小电扇”等趣味实验,将抽象的科学知识转化为具象的实
“硬”理论的守圈破圈之道 - 天天要闻

“硬”理论的守圈破圈之道

原标题:“硬”理论的守圈破圈之道5月25日,“理响中国”党的创新理论网络传播精品分享会在北京举办。来自有关部门和媒体网站的9位网络理论传播工作者,围绕如何做好党的创新理论网络传播,结合实践案例作了分享。求是网编辑部副主任、“学习笔记 ”栏目主编韩辰以《真理的味道也可以非常甜》,介绍了他们如何把真理讲出甜...