对话式AI安全漏洞!研究人员绕过安全措施让AI泄露危险信息

2024年03月14日21:25:10 科技 1547


对话式AI安全漏洞!研究人员绕过安全措施让AI泄露危险信息 - 天天要闻

AI 爱好者们注意了!一项来自华盛顿芝加哥研究人员的新突破引起了人们对大型语言模型 (LLM) 安全的担忧。他们发明了一种名为 ArtPrompt 的新方法,可以绕过像 GPT-3.5、GPT-4、Gemini、claude和 Llama2 等聊天机器人的安全机制。

利用 ASCII 艺术越狱?

研究人员开发了 ArtPrompt 工具,它使用 ASCII 艺术 (由字母和符号组成的图像) 绕过聊天机器人的安全措施,让它们可以回应原本被设计为拒绝的查询。

文本“炸弹”教程?

研究人员利用 ArtPrompt 生成 ASCII 艺术,成功绕过了大型语言模型的安全措施,诱导聊天机器人提供了有关制造炸弹的信息。这表明攻击者如何利用 ASCII 艺术来规避安全限制,让聊天机器人回答原本被禁止的危险或非法问题。

对话式AI安全漏洞!研究人员绕过安全措施让AI泄露危险信息 - 天天要闻

伪造钞票大揭秘?

在另一个例子中,研究人员使用 ArtPrompt 成功地向语言模型询问了有关伪造钞票的问题。他们同样利用 ASCII 艺术替换了原始查询中可能会被语言模型识别并拒绝的敏感词,从而绕过了模型的安全防御。

ArtPrompt 的原理

该技术分为两个步骤:词语掩盖和伪装式提示生成。首先,提示中的敏感词会被掩盖起来,以避免被大型语言模型检测到。然后,ASCII 艺术被用来替换这些词,从而创建一个绕过 AI 道德和安全措施的提示。

为什么这很重要?

ArtPrompt 的影响: 这项技术展示了对话式 AI 安全机制的一个重大漏洞。它不仅挑战了当前安全措施的有效性,还凸显了在维护 AI 安全方面,我们正陷入一场与不断创新的规避伎俩之间的“ whack-a-mole ” (打地鼠) 游戏。

AI 系统的安全: ArtPrompt 能够轻易绕过安全协议,凸显了对话式 AI 的关键安全漏洞。我们需要更加强大和复杂的安全措施来防止滥用。

伦理和法律问题: 像 ArtPrompt 这样的工具可以让 AI 生成有害或非法内容,这带来了重大的伦理和法律挑战。因此,开发能够抵抗此类操纵的 AI 至关重要。

科技分类资讯推荐

中国面向全球发出警告:谁配合美国,封杀升腾芯片,决不轻饶 - 天天要闻

中国面向全球发出警告:谁配合美国,封杀升腾芯片,决不轻饶

文/王新喜芯片行业正在上演中美关税战的翻版。前段时间,中美关税谈妥,美国突然变脸,不准各国使用华为AI芯片,公布了三条新的AI芯片出口管制措施。1)任何国家使用华为Ascend芯片均视为违反美国出口管制。2)限制AI芯片用于中国AI模型:警告企业若美国AI芯片被用于训练或干预中国AI模型,将面临后果。3)要求美企审查合作...
珀莱雅准备出海反向收购;董明珠喊话孟羽童“回家吃饭”;群邑赢得lululemon新业务 | Morketing周刊342期 - 天天要闻

珀莱雅准备出海反向收购;董明珠喊话孟羽童“回家吃饭”;群邑赢得lululemon新业务 | Morketing周刊342期

亲爱的读者朋友,微信改了推送规则不星标就会收不到我们的最新推送星标《Morketing》公众号,及时接收每日新鲜的推文!一周要闻速览珀莱雅准备出海反向收购珀莱雅预备通过海外并购来填补其细分赛道的空白。在5月19日举行的珀莱雅(603605.SH)2024年度股东大会上,公司董事长侯军呈表示,公司考虑通过巴黎分公司进行并购,...
荣耀平板 10 海外发布:12.1 英寸 LCD 屏、骁龙 7 Gen3 处理器 - 天天要闻

荣耀平板 10 海外发布:12.1 英寸 LCD 屏、骁龙 7 Gen3 处理器

IT之家 5 月 25 日消息,荣耀在海外“悄悄”发布了荣耀平板 10 新品,其定位中端,配备 12.1 英寸 LCD 屏、搭载骁龙 7 Gen3 处理器,售价暂未公布。据介绍,荣耀平板 10 的屏幕分辨率为 2560×1600(刷新率预计为 60Hz),支持 10.7 亿色显示。平板机身厚度约 6.29mm、重约 525g(含电池),提供「青色」和「灰色」
618最值得入手的超高刷电竞显示器,联合创新27G2T体验 - 天天要闻

618最值得入手的超高刷电竞显示器,联合创新27G2T体验

自从三月搬到新家以后,我就一直在脑海里计划着如何设计专属我自己的电竞空间。于是从买桌椅开始,一步一步完善我的电竞空间。三月初也算是简单布置了一下我的电竞空间吧。先和大家小小的汇报一下我的电竞空间。