對話式AI安全漏洞!研究人員繞過安全措施讓AI泄露危險信息

2024年03月14日21:25:10 科技 1547


對話式AI安全漏洞!研究人員繞過安全措施讓AI泄露危險信息 - 天天要聞

AI 愛好者們注意了!一項來自華盛頓芝加哥研究人員的新突破引起了人們對大型語言模型 (LLM) 安全的擔憂。他們發明了一種名為 ArtPrompt 的新方法,可以繞過像 GPT-3.5、GPT-4、Gemini、claude和 Llama2 等聊天機器人的安全機制。

利用 ASCII 藝術越獄?

研究人員開發了 ArtPrompt 工具,它使用 ASCII 藝術 (由字母和符號組成的圖像) 繞過聊天機器人的安全措施,讓它們可以回應原本被設計為拒絕的查詢。

文本“炸彈”教程?

研究人員利用 ArtPrompt 生成 ASCII 藝術,成功繞過了大型語言模型的安全措施,誘導聊天機器人提供了有關製造炸彈的信息。這表明攻擊者如何利用 ASCII 藝術來規避安全限制,讓聊天機器人回答原本被禁止的危險或非法問題。

對話式AI安全漏洞!研究人員繞過安全措施讓AI泄露危險信息 - 天天要聞

偽造鈔票大揭秘?

在另一個例子中,研究人員使用 ArtPrompt 成功地向語言模型詢問了有關偽造鈔票的問題。他們同樣利用 ASCII 藝術替換了原始查詢中可能會被語言模型識別並拒絕的敏感詞,從而繞過了模型的安全防禦。

ArtPrompt 的原理

該技術分為兩個步驟:詞語掩蓋和偽裝式提示生成。首先,提示中的敏感詞會被掩蓋起來,以避免被大型語言模型檢測到。然後,ASCII 藝術被用來替換這些詞,從而創建一個繞過 AI 道德和安全措施的提示。

為什麼這很重要?

ArtPrompt 的影響: 這項技術展示了對話式 AI 安全機制的一個重大漏洞。它不僅挑戰了當前安全措施的有效性,還凸顯了在維護 AI 安全方面,我們正陷入一場與不斷創新的規避伎倆之間的“ whack-a-mole ” (打地鼠) 遊戲。

AI 系統的安全: ArtPrompt 能夠輕易繞過安全協議,凸顯了對話式 AI 的關鍵安全漏洞。我們需要更加強大和複雜的安全措施來防止濫用。

倫理和法律問題: 像 ArtPrompt 這樣的工具可以讓 AI 生成有害或非法內容,這帶來了重大的倫理和法律挑戰。因此,開發能夠抵抗此類操縱的 AI 至關重要。

科技分類資訊推薦

引領科技豪華MPV新風尚 第二代騰勢D9西安車展亮相 - 天天要聞

引領科技豪華MPV新風尚 第二代騰勢D9西安車展亮相

兼具宜商氣度與家用溫情的科技豪華旗艦MPV,第二代騰勢D9迎來西安地區正式亮相。新車依託全球新能源MPV冠軍底蘊,以第二代刀片電池、雙閥雲輦-C、天神之眼5.0智駕等核心技術全面升級,兼顧商務體面與家庭舒適,為西北高端用戶帶來一站式全能出行解決方案。
採購禁入!科華數據材料造假被拒門外 - 天天要聞

採購禁入!科華數據材料造假被拒門外

本報(chinatimes.net.cn)記者胡雅文 北京報道這家趕上AI算力風口的公司,因投標材料造假,被相關採購方列入禁入名單兩年,其此前提出的複議申請也被正式駁回。相關採購平台近日發布公告,明確駁回科華數據股份有限公司(下稱“科華數據”,002335.SZ)此前提交的複議申請。早在一年前,科華數據已被認定在“信息通信樞紐...
快評樂道L80:15萬元級買大五座,這波值得沖? - 天天要聞

快評樂道L80:15萬元級買大五座,這波值得沖?

日前,樂道L80正式發布並開啟預售,其整車購買預售價為24.58萬元起,租電購買預售價則低至15.98萬元起。面對大型SUV市場“細分再細分”之競爭趨勢,這款樂道年度重磅新車都有哪些優勢?又能否成為“大五座SUV革新之作”?下面,圈哥就帶大家全方位感受。
成都直擊凱威德:純電全尺寸SUV的張揚與大氣 - 天天要聞

成都直擊凱威德:純電全尺寸SUV的張揚與大氣

4月22日,凱迪拉克以奧斯卡級盛典規格,將上海保利大劇院點亮為璀璨舞台,在品牌代言人倪妮與全場嘉賓的共同見證下,凱迪拉克全尺寸純電公路旗艦——凱威德耀然上市。新車共推出長續航四驅Pro、高性能四驅Ultra兩款配置,官方售價區間為46.88萬-50.88萬元。