對話式AI安全漏洞!研究人員繞過安全措施讓AI泄露危險信息

2024年03月14日21:25:10 科技 1547


對話式AI安全漏洞!研究人員繞過安全措施讓AI泄露危險信息 - 天天要聞

AI 愛好者們注意了!一項來自華盛頓芝加哥研究人員的新突破引起了人們對大型語言模型 (LLM) 安全的擔憂。他們發明了一種名為 ArtPrompt 的新方法,可以繞過像 GPT-3.5、GPT-4、Gemini、claude和 Llama2 等聊天機器人的安全機制。

利用 ASCII 藝術越獄?

研究人員開發了 ArtPrompt 工具,它使用 ASCII 藝術 (由字母和符號組成的圖像) 繞過聊天機器人的安全措施,讓它們可以回應原本被設計為拒絕的查詢。

文本“炸彈”教程?

研究人員利用 ArtPrompt 生成 ASCII 藝術,成功繞過了大型語言模型的安全措施,誘導聊天機器人提供了有關製造炸彈的信息。這表明攻擊者如何利用 ASCII 藝術來規避安全限制,讓聊天機器人回答原本被禁止的危險或非法問題。

對話式AI安全漏洞!研究人員繞過安全措施讓AI泄露危險信息 - 天天要聞

偽造鈔票大揭秘?

在另一個例子中,研究人員使用 ArtPrompt 成功地向語言模型詢問了有關偽造鈔票的問題。他們同樣利用 ASCII 藝術替換了原始查詢中可能會被語言模型識別並拒絕的敏感詞,從而繞過了模型的安全防禦。

ArtPrompt 的原理

該技術分為兩個步驟:詞語掩蓋和偽裝式提示生成。首先,提示中的敏感詞會被掩蓋起來,以避免被大型語言模型檢測到。然後,ASCII 藝術被用來替換這些詞,從而創建一個繞過 AI 道德和安全措施的提示。

為什麼這很重要?

ArtPrompt 的影響: 這項技術展示了對話式 AI 安全機制的一個重大漏洞。它不僅挑戰了當前安全措施的有效性,還凸顯了在維護 AI 安全方面,我們正陷入一場與不斷創新的規避伎倆之間的“ whack-a-mole ” (打地鼠) 遊戲。

AI 系統的安全: ArtPrompt 能夠輕易繞過安全協議,凸顯了對話式 AI 的關鍵安全漏洞。我們需要更加強大和複雜的安全措施來防止濫用。

倫理和法律問題: 像 ArtPrompt 這樣的工具可以讓 AI 生成有害或非法內容,這帶來了重大的倫理和法律挑戰。因此,開發能夠抵抗此類操縱的 AI 至關重要。

科技分類資訊推薦

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略 - 天天要聞

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略

2月9日,長安汽車和東風集團股份(00489.HK)同步發布了控股股東“正在與其他國資央企集團籌劃重組事項”的信息。長安汽車的控股股東是兵裝集團,而東風集團股份的控股股東是東風公司。隨即,長安汽車和東風集團這兩家汽車央企將合併重組,成為業內關注的焦點。
公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了 - 天天要聞

公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了

電動車加強管理以後,要求機動車類型的車輛需要持證上路,但是老年人考駕照卻受阻,一方面有年齡的限制,另一方面偏遠山區考駕照不方便,所以在2025年公安部出手了,年齡限制放寬10年,同時推出送考下鄉服務,還進一步的降低考駕照的費用,2025年起考摩托車駕照不難了。
從“星靈安全守護體系”到昊鉑HL,看懂廣汽科技日 - 天天要聞

從“星靈安全守護體系”到昊鉑HL,看懂廣汽科技日

發布會以技術切入,並全程圍繞安全展開。廣汽集團董事長、總經理馮興亞率先登場,宣布2025年四季度將正式上市支持L3級智能駕駛的車型,他同時強調面向自動駕駛時代對智能駕駛技術、整車安全架構以及突發風險處理能力的要求更高。如何才能滿足更高的要求?馮興亞提到了“廣汽
關稅大棒下,最受傷的車企出現了 - 天天要聞

關稅大棒下,最受傷的車企出現了

特朗普的關稅大棒剛揮出,尚未嚇退“外敵”,卻先刺痛了自己。近日,擁有瑪莎拉蒂、Jeep等14個品牌的全球第四大車企斯泰蘭蒂斯突然宣布裁撤900名美國工人,關閉加拿大和墨西哥兩家工廠,北美生產線陷入癱瘓。幾乎同一時間,捷豹路虎宣布暫停對美出口一個月,奧迪更是直接