對話式AI安全漏洞!研究人員繞過安全措施讓AI泄露危險信息

2024年03月14日21:25:10 科技 1547


對話式AI安全漏洞!研究人員繞過安全措施讓AI泄露危險信息 - 天天要聞

AI 愛好者們注意了!一項來自華盛頓芝加哥研究人員的新突破引起了人們對大型語言模型 (LLM) 安全的擔憂。他們發明了一種名為 ArtPrompt 的新方法,可以繞過像 GPT-3.5、GPT-4、Gemini、claude和 Llama2 等聊天機械人的安全機制。

利用 ASCII 藝術越獄?

研究人員開發了 ArtPrompt 工具,它使用 ASCII 藝術 (由字母和符號組成的圖像) 繞過聊天機械人的安全措施,讓它們可以回應原本被設計為拒絕的查詢。

文本「炸彈」教程?

研究人員利用 ArtPrompt 生成 ASCII 藝術,成功繞過了大型語言模型的安全措施,誘導聊天機械人提供了有關製造炸彈的信息。這表明攻擊者如何利用 ASCII 藝術來規避安全限制,讓聊天機械人回答原本被禁止的危險或非法問題。

對話式AI安全漏洞!研究人員繞過安全措施讓AI泄露危險信息 - 天天要聞

偽造鈔票大揭秘?

在另一個例子中,研究人員使用 ArtPrompt 成功地向語言模型詢問了有關偽造鈔票的問題。他們同樣利用 ASCII 藝術替換了原始查詢中可能會被語言模型識別並拒絕的敏感詞,從而繞過了模型的安全防禦。

ArtPrompt 的原理

該技術分為兩個步驟:詞語掩蓋和偽裝式提示生成。首先,提示中的敏感詞會被掩蓋起來,以避免被大型語言模型檢測到。然後,ASCII 藝術被用來替換這些詞,從而創建一個繞過 AI 道德和安全措施的提示。

為什麼這很重要?

ArtPrompt 的影響: 這項技術展示了對話式 AI 安全機制的一個重大漏洞。它不僅挑戰了當前安全措施的有效性,還凸顯了在維護 AI 安全方面,我們正陷入一場與不斷創新的規避伎倆之間的「 whack-a-mole 」 (打地鼠) 遊戲。

AI 系統的安全: ArtPrompt 能夠輕易繞過安全協議,凸顯了對話式 AI 的關鍵安全漏洞。我們需要更加強大和複雜的安全措施來防止濫用。

倫理和法律問題: 像 ArtPrompt 這樣的工具可以讓 AI 生成有害或非法內容,這帶來了重大的倫理和法律挑戰。因此,開發能夠抵抗此類操縱的 AI 至關重要。

科技分類資訊推薦

中國面向全球發出警告:誰配合美國,封殺昇騰芯片,決不輕饒 - 天天要聞

中國面向全球發出警告:誰配合美國,封殺昇騰芯片,決不輕饒

文/王新喜芯片行業正在上演中美關稅戰的翻版。前段時間,中美關稅談妥,美國突然變臉,不準各國使用華為AI芯片,公布了三條新的AI芯片出口管制措施。1)任何國家使用華為Ascend芯片均視為違反美國出口管制。2)限制AI芯片用於中國AI模型:警告企業若美國AI芯片被用於訓練或干預中國AI模型,將面臨後果。3)要求美企審查合作...
珀萊雅準備出海反向收購;董明珠喊話孟羽童「回家吃飯」;群邑贏得lululemon新業務 | Morketing周刊342期 - 天天要聞

珀萊雅準備出海反向收購;董明珠喊話孟羽童「回家吃飯」;群邑贏得lululemon新業務 | Morketing周刊342期

親愛的讀者朋友,微信改了推送規則不星標就會收不到我們的最新推送星標《Morketing》公眾號,及時接收每日新鮮的推文!一周要聞速覽珀萊雅準備出海反向收購珀萊雅預備通過海外併購來填補其細分賽道的空白。在5月19日舉行的珀萊雅(603605.SH)2024年度股東大會上,公司董事長侯軍呈表示,公司考慮通過巴黎分公司進行併購,...
榮耀平板 10 海外發佈:12.1 英寸 LCD 屏、驍龍 7 Gen3 處理器 - 天天要聞

榮耀平板 10 海外發佈:12.1 英寸 LCD 屏、驍龍 7 Gen3 處理器

IT之家 5 月 25 日消息,榮耀在海外「悄悄」發佈了榮耀平板 10 新品,其定位中端,配備 12.1 英寸 LCD 屏、搭載驍龍 7 Gen3 處理器,售價暫未公布。據介紹,榮耀平板 10 的屏幕分辨率為 2560×1600(刷新率預計為 60Hz),支持 10.7 億色顯示。平板機身厚度約 6.29mm、重約 525g(含電池),提供「青色」和「灰色」
618最值得入手的超高刷電競顯示器,聯合創新27G2T體驗 - 天天要聞

618最值得入手的超高刷電競顯示器,聯合創新27G2T體驗

自從三月搬到新家以後,我就一直在腦海里計划著如何設計專屬我自己的電競空間。於是從買桌椅開始,一步一步完善我的電競空間。三月初也算是簡單布置了一下我的電競空間吧。先和大家小小的彙報一下我的電競空間。