对话式AI安全漏洞!研究人员绕过安全措施让AI泄露危险信息

2024年03月14日21:25:10 科技 1547


对话式AI安全漏洞!研究人员绕过安全措施让AI泄露危险信息 - 天天要闻

AI 爱好者们注意了!一项来自华盛顿芝加哥研究人员的新突破引起了人们对大型语言模型 (LLM) 安全的担忧。他们发明了一种名为 ArtPrompt 的新方法,可以绕过像 GPT-3.5、GPT-4、Gemini、claude和 Llama2 等聊天机器人的安全机制。

利用 ASCII 艺术越狱?

研究人员开发了 ArtPrompt 工具,它使用 ASCII 艺术 (由字母和符号组成的图像) 绕过聊天机器人的安全措施,让它们可以回应原本被设计为拒绝的查询。

文本“炸弹”教程?

研究人员利用 ArtPrompt 生成 ASCII 艺术,成功绕过了大型语言模型的安全措施,诱导聊天机器人提供了有关制造炸弹的信息。这表明攻击者如何利用 ASCII 艺术来规避安全限制,让聊天机器人回答原本被禁止的危险或非法问题。

对话式AI安全漏洞!研究人员绕过安全措施让AI泄露危险信息 - 天天要闻

伪造钞票大揭秘?

在另一个例子中,研究人员使用 ArtPrompt 成功地向语言模型询问了有关伪造钞票的问题。他们同样利用 ASCII 艺术替换了原始查询中可能会被语言模型识别并拒绝的敏感词,从而绕过了模型的安全防御。

ArtPrompt 的原理

该技术分为两个步骤:词语掩盖和伪装式提示生成。首先,提示中的敏感词会被掩盖起来,以避免被大型语言模型检测到。然后,ASCII 艺术被用来替换这些词,从而创建一个绕过 AI 道德和安全措施的提示。

为什么这很重要?

ArtPrompt 的影响: 这项技术展示了对话式 AI 安全机制的一个重大漏洞。它不仅挑战了当前安全措施的有效性,还凸显了在维护 AI 安全方面,我们正陷入一场与不断创新的规避伎俩之间的“ whack-a-mole ” (打地鼠) 游戏。

AI 系统的安全: ArtPrompt 能够轻易绕过安全协议,凸显了对话式 AI 的关键安全漏洞。我们需要更加强大和复杂的安全措施来防止滥用。

伦理和法律问题: 像 ArtPrompt 这样的工具可以让 AI 生成有害或非法内容,这带来了重大的伦理和法律挑战。因此,开发能够抵抗此类操纵的 AI 至关重要。

科技分类资讯推荐

重磅!宇树科技C轮融资终于落地,投资人终于浮出水面,央企中国移动、腾讯、阿里等互联网巨头成功上车,具体估值仍然成谜 - 天天要闻

重磅!宇树科技C轮融资终于落地,投资人终于浮出水面,央企中国移动、腾讯、阿里等互联网巨头成功上车,具体估值仍然成谜

金融界6月19日消息 备受关注的宇树科技C轮融资终于落地,投资人纷纷浮出水面,中国移动、腾讯、阿里、蚂蚁、吉利等巨头集体现身。19日,市场消息称宇树科技已完成了始于去年年底的C轮融资交割,由中国移动旗下基金、腾讯、锦秋、阿里、蚂蚁、吉利资本共同领投,绝大部分老股东跟投。对此,宇树科技方面表示,“我们最近确实...
小红书“种草”首次登上国际营销界顶级舞台 - 天天要闻

小红书“种草”首次登上国际营销界顶级舞台

6月18日,在法国戛纳国际创意节的聚光灯下,受邀参会的小红书CMO之恒发表主旨演讲,首次在国际顶级舞台上系统阐释了小红书独特的社区生态,以及从社区中原生而出的营销新范式“种草”,并对种草的价值、底层逻辑、成功因素等进行了分享。之恒表示,有用户将小红书视为“电子闺蜜”和“情感树洞”,在小红书上寻找与自己爱好...
大摩北美IT硬件数据追踪:App Store 仍跑赢市场预期,甲骨文引爆云计算资本支出 - 天天要闻

大摩北美IT硬件数据追踪:App Store 仍跑赢市场预期,甲骨文引爆云计算资本支出

智通财经APP获悉,大摩的追踪数据显示,App Store 年初至今净收入同比增长 12.5%,超出该行对第二季度的预测 150 个基点,并相当于服务业务超预期 40 个基点。大摩将2025年全球云资本支出预测上调至4060亿美元(同比增长43%),较1个月前预测提升4个百分点(新增140亿美元)。增长由甲骨文(ORCL.US)和阿里巴巴的上调驱动。...
宝洁失速背后,消费品正在被碎片化重构 - 天天要闻

宝洁失速背后,消费品正在被碎片化重构

本文来自微信公众号:刀姐doris,作者:刀法智库,原文标题:《宝洁失速的背后:加剧分化的时代,大品牌服务不了所有人》,头图来自:AI生成宝洁宣布裁员7000人,外表看起来是大集团走下坡路,本质上是大品牌服务不了所有人。前段时间,宝洁公司宣布,计划未来两年在全球裁员 7000 人,甚至要退出某些品类和产品,或出售旗...
TDK 收购智能眼镜软硬件开发商 SoftEye,扩大 AI 生态系统业务 - 天天要闻

TDK 收购智能眼镜软硬件开发商 SoftEye,扩大 AI 生态系统业务

IT之家 6 月 19 日消息,日本 TDK(东电化)今日宣布收购美国智能眼镜软硬件系统解决方案开发商 SoftEye,进一步扩大其 AI 生态系统业务。SoftEye 从事智能眼镜定制芯片、摄像机、软件和算法的开发工作,具备低功耗眼动追踪和物体识别方面的技术,交易完成后将成为 TDK 的全资子公司。TDK 通过此次收购将能够以更快的速度交...
消息称广汽埃安即将发布 B 端专用品牌,明日对外公布信息 - 天天要闻

消息称广汽埃安即将发布 B 端专用品牌,明日对外公布信息

IT之家 6 月 19 日消息,蓝鲸汽车今日报道称,从广汽方面获悉,广汽旗下自主品牌埃安即将发布 B 端专用品牌。有内部知情人士对该媒体称,明天(6 月 20 日)会有对外信息发布。报道还提到,继去年发布全新“AION”字母标并推出 3 款 C 端全球战略车型后,广汽埃安 C 端销量占比有所提升,下半年即将启动 B / C 端品牌全面分...
阿里云将在韩国启用第二座数据中心,加速海外布局 - 天天要闻

阿里云将在韩国启用第二座数据中心,加速海外布局

新京报贝壳财经讯(记者罗亦丹)6月19日,阿里云宣布将于本月底在韩国启用第二座数据中心,来满足生成式AI快速发展带来的需求增长。这是今年以来,阿里云继墨西哥、泰国之后在全球落地的又一新节点。届时阿里云全球布局将扩展至29个地域、88个可用区