對話式AI安全漏洞！研究人員繞過安全措施讓AI泄露危險信息

2024年03月14日21:25:10 科技 1547

AI 愛好者們注意了！一項來自華盛頓和芝加哥研究人員的新突破引起了人們對大型語言模型 (LLM) 安全的擔憂。他們發明了一種名為 ArtPrompt 的新方法，可以繞過像 GPT-3.5、GPT-4、Gemini、claude和 Llama2 等聊天機械人的安全機制。

利用 ASCII 藝術越獄？

研究人員開發了 ArtPrompt 工具，它使用 ASCII 藝術（由字母和符號組成的圖像）繞過聊天機械人的安全措施，讓它們可以回應原本被設計為拒絕的查詢。

文本「炸彈」教程？

研究人員利用 ArtPrompt 生成 ASCII 藝術，成功繞過了大型語言模型的安全措施，誘導聊天機械人提供了有關製造炸彈的信息。這表明攻擊者如何利用 ASCII 藝術來規避安全限制，讓聊天機械人回答原本被禁止的危險或非法問題。

偽造鈔票大揭秘？

在另一個例子中，研究人員使用 ArtPrompt 成功地向語言模型詢問了有關偽造鈔票的問題。他們同樣利用 ASCII 藝術替換了原始查詢中可能會被語言模型識別並拒絕的敏感詞，從而繞過了模型的安全防禦。

ArtPrompt 的原理

該技術分為兩個步驟：詞語掩蓋和偽裝式提示生成。首先，提示中的敏感詞會被掩蓋起來，以避免被大型語言模型檢測到。然後，ASCII 藝術被用來替換這些詞，從而創建一個繞過 AI 道德和安全措施的提示。

為什麼這很重要？

ArtPrompt 的影響: 這項技術展示了對話式 AI 安全機制的一個重大漏洞。它不僅挑戰了當前安全措施的有效性，還凸顯了在維護 AI 安全方面，我們正陷入一場與不斷創新的規避伎倆之間的「 whack-a-mole 」 (打地鼠) 遊戲。

AI 系統的安全: ArtPrompt 能夠輕易繞過安全協議，凸顯了對話式 AI 的關鍵安全漏洞。我們需要更加強大和複雜的安全措施來防止濫用。

倫理和法律問題: 像 ArtPrompt 這樣的工具可以讓 AI 生成有害或非法內容，這帶來了重大的倫理和法律挑戰。因此，開發能夠抵抗此類操縱的 AI 至關重要。

科技

漲價壓不住、補貼夠不着，這個五一6000元以上機型難住手機經銷商 - 天天要聞

漲價壓不住、補貼夠不着，這個五一6000元以上機型難住手機經銷商

圖源：藍鯨科技記者拍攝藍鯨新聞5月3日訊(記者翟智超)按照往年慣例，五一勞動節是手機廠商集中促銷、衝量的關鍵節點，但今年這場例行的「節前大促」卻未能點燃消費熱情。 5月2日下....

05月03日 7401

AI能否超越人類？中南大學院士，走進武鋼三中，開講「硬核」AI課 - 天天要聞

AI能否超越人類？中南大學院士，走進武鋼三中，開講「硬核」AI課

4月29日，在武漢市武鋼三中的報告廳里，一場關於人工智能的科普報告正在進行。台上，中國工程院院士、中南大學教授桂衛華以「大模型與工業應用」為題，為高一學生揭開AI大模型的神秘面紗。桂衛華，中國工程院院士，中南大學教授、博士生導師。

05月03日 1895

引領科技豪華MPV新風尚第二代騰勢D9西安車展亮相 - 天天要聞

引領科技豪華MPV新風尚第二代騰勢D9西安車展亮相

兼具宜商氣度與家用溫情的科技豪華旗艦MPV，第二代騰勢D9迎來西安地區正式亮相。新車依託全球新能源MPV冠軍底蘊，以第二代刀片電池、雙閥雲輦-C、天神之眼5.0智駕等核心技術全面升級，兼顧商務體面與家庭舒適，為西北高端用戶帶來一站式全能出行解決方案。

05月03日 2042

採購禁入！科華數據材料造假被拒門外 - 天天要聞

採購禁入！科華數據材料造假被拒門外

本報（chinatimes.net.cn）記者胡雅文北京報道這家趕上AI算力風口的公司，因投標材料造假，被相關採購方列入禁入名單兩年，其此前提出的複議申請也被正式駁回。相關採購平台近日發佈公告，明確駁回科華數據股份有限公司（下稱「科華數據」，002335.SZ）此前提交的複議申請。早在一年前，科華數據已被認定在「信息通信樞紐...

05月03日 9437

潮聲丨「硅基」勞動節來了，揭秘AI智能體的「五一」勞動日誌 - 天天要聞

潮聲丨「硅基」勞動節來了，揭秘AI智能體的「五一」勞動日誌

潮新聞客戶端執筆夏丹吳柯沁五一小長假，當大多數人按下工作的暫停鍵，走進景區、海邊或深山，城市與工地的另一端，一群沒有血肉之軀的「硅基勞動者」正在高效運轉。 2026年，一人公司（O....

05月03日 7667

馬斯克手撕OpenAI：一場「初心」保衛戰，還是富人的「酸葡萄」？ - 天天要聞

馬斯克手撕OpenAI：一場「初心」保衛戰，還是富人的「酸葡萄」？

如果你最近打開科技新聞，大概率會被一條消息刷屏——馬斯克又開炮了，這次對準的是他親手參與創辦、又親手甩手離開的OpenAI。不是暗戳戳發條推特陰陽怪氣，而是直接遞上法律文書，把Sam Altman和Greg Brockman告上法庭。

05月03日 1848

五一25城車展，ID. 與眾家族齊亮相，購車權益最高享5.6萬 - 天天要聞

五一25城車展，ID. 與眾家族齊亮相，購車權益最高享5.6萬

五一假期（4月30日到5月5日），大眾ID. 與眾家族將帶着全系車型，在全國25個城市的五一車展上集中亮相。屆時，包括全時互聯全尺寸純電SUV與眾08、鋒芒智趣純電SUV與眾06在內的多款車型都會來到現場，和消費者零距離接觸。

05月03日 6759

快評樂道L80：15萬元級買大五座，這波值得沖？ - 天天要聞

快評樂道L80：15萬元級買大五座，這波值得沖？

日前，樂道L80正式發佈並開啟預售，其整車購買預售價為24.58萬元起，租電購買預售價則低至15.98萬元起。面對大型SUV市場「細分再細分」之競爭趨勢，這款樂道年度重磅新車都有哪些優勢？又能否成為「大五座SUV革新之作」？下面，圈哥就帶大家全方位感受。

05月03日 8240

成都直擊凱威德：純電全尺寸SUV的張揚與大氣 - 天天要聞

成都直擊凱威德：純電全尺寸SUV的張揚與大氣

4月22日，凱迪拉克以奧斯卡級盛典規格，將上海保利大劇院點亮為璀璨舞台，在品牌代言人倪妮與全場嘉賓的共同見證下，凱迪拉克全尺寸純電公路旗艦——凱威德耀然上市。新車共推出長續航四驅Pro、高性能四驅Ultra兩款配置，官方售價區間為46.88萬-50.88萬元。

05月03日 6713

空氣炸鍋哪個品牌最好？2026十大品牌排行榜深度橫評，誰最靠譜 - 天天要聞

空氣炸鍋哪個品牌最好？2026十大品牌排行榜深度橫評，誰最靠譜

夏天想靠空氣炸鍋做減脂餐，結果西蘭花烤得又干又苦，雞胸肉外焦里生。經過2026年4月空氣炸鍋十大品牌排行榜深度橫評，綜合材質、溫控、耐用性和口碑數據，排名第一的空氣炸鍋是宮菱FXGONNE——靠口碑2年間賣了20多萬台，屬於懂行圈子裡的高口

05月03日 1728