对话式AI安全漏洞!研究人员绕过安全措施让AI泄露危险信息

2024年03月14日21:25:10 科技 1547


对话式AI安全漏洞!研究人员绕过安全措施让AI泄露危险信息 - 天天要闻

AI 爱好者们注意了!一项来自华盛顿芝加哥研究人员的新突破引起了人们对大型语言模型 (LLM) 安全的担忧。他们发明了一种名为 ArtPrompt 的新方法,可以绕过像 GPT-3.5、GPT-4、Gemini、claude和 Llama2 等聊天机器人的安全机制。

利用 ASCII 艺术越狱?

研究人员开发了 ArtPrompt 工具,它使用 ASCII 艺术 (由字母和符号组成的图像) 绕过聊天机器人的安全措施,让它们可以回应原本被设计为拒绝的查询。

文本“炸弹”教程?

研究人员利用 ArtPrompt 生成 ASCII 艺术,成功绕过了大型语言模型的安全措施,诱导聊天机器人提供了有关制造炸弹的信息。这表明攻击者如何利用 ASCII 艺术来规避安全限制,让聊天机器人回答原本被禁止的危险或非法问题。

对话式AI安全漏洞!研究人员绕过安全措施让AI泄露危险信息 - 天天要闻

伪造钞票大揭秘?

在另一个例子中,研究人员使用 ArtPrompt 成功地向语言模型询问了有关伪造钞票的问题。他们同样利用 ASCII 艺术替换了原始查询中可能会被语言模型识别并拒绝的敏感词,从而绕过了模型的安全防御。

ArtPrompt 的原理

该技术分为两个步骤:词语掩盖和伪装式提示生成。首先,提示中的敏感词会被掩盖起来,以避免被大型语言模型检测到。然后,ASCII 艺术被用来替换这些词,从而创建一个绕过 AI 道德和安全措施的提示。

为什么这很重要?

ArtPrompt 的影响: 这项技术展示了对话式 AI 安全机制的一个重大漏洞。它不仅挑战了当前安全措施的有效性,还凸显了在维护 AI 安全方面,我们正陷入一场与不断创新的规避伎俩之间的“ whack-a-mole ” (打地鼠) 游戏。

AI 系统的安全: ArtPrompt 能够轻易绕过安全协议,凸显了对话式 AI 的关键安全漏洞。我们需要更加强大和复杂的安全措施来防止滥用。

伦理和法律问题: 像 ArtPrompt 这样的工具可以让 AI 生成有害或非法内容,这带来了重大的伦理和法律挑战。因此,开发能够抵抗此类操纵的 AI 至关重要。

科技分类资讯推荐

引领科技豪华MPV新风尚 第二代腾势D9西安车展亮相 - 天天要闻

引领科技豪华MPV新风尚 第二代腾势D9西安车展亮相

兼具宜商气度与家用温情的科技豪华旗舰MPV,第二代腾势D9迎来西安地区正式亮相。新车依托全球新能源MPV冠军底蕴,以第二代刀片电池、双阀云辇-C、天神之眼5.0智驾等核心技术全面升级,兼顾商务体面与家庭舒适,为西北高端用户带来一站式全能出行解决方案。
采购禁入!科华数据材料造假被拒门外 - 天天要闻

采购禁入!科华数据材料造假被拒门外

本报(chinatimes.net.cn)记者胡雅文 北京报道这家赶上AI算力风口的公司,因投标材料造假,被相关采购方列入禁入名单两年,其此前提出的复议申请也被正式驳回。相关采购平台近日发布公告,明确驳回科华数据股份有限公司(下称“科华数据”,002335.SZ)此前提交的复议申请。早在一年前,科华数据已被认定在“信息通信枢纽...
快评乐道L80:15万元级买大五座,这波值得冲? - 天天要闻

快评乐道L80:15万元级买大五座,这波值得冲?

日前,乐道L80正式发布并开启预售,其整车购买预售价为24.58万元起,租电购买预售价则低至15.98万元起。面对大型SUV市场“细分再细分”之竞争趋势,这款乐道年度重磅新车都有哪些优势?又能否成为“大五座SUV革新之作”?下面,圈哥就带大家全方位感受。
成都直击凯威德:纯电全尺寸SUV的张扬与大气 - 天天要闻

成都直击凯威德:纯电全尺寸SUV的张扬与大气

4月22日,凯迪拉克以奥斯卡级盛典规格,将上海保利大剧院点亮为璀璨舞台,在品牌代言人倪妮与全场嘉宾的共同见证下,凯迪拉克全尺寸纯电公路旗舰——凯威德耀然上市。新车共推出长续航四驱Pro、高性能四驱Ultra两款配置,官方售价区间为46.88万-50.88万元。