對話式AI安全漏洞!研究人員繞過安全措施讓AI泄露危險信息

2024年03月14日21:25:10 科技 1547


對話式AI安全漏洞!研究人員繞過安全措施讓AI泄露危險信息 - 天天要聞

AI 愛好者們注意了!一項來自華盛頓芝加哥研究人員的新突破引起了人們對大型語言模型 (LLM) 安全的擔憂。他們發明了一種名為 ArtPrompt 的新方法,可以繞過像 GPT-3.5、GPT-4、Gemini、claude和 Llama2 等聊天機械人的安全機制。

利用 ASCII 藝術越獄?

研究人員開發了 ArtPrompt 工具,它使用 ASCII 藝術 (由字母和符號組成的圖像) 繞過聊天機械人的安全措施,讓它們可以回應原本被設計為拒絕的查詢。

文本「炸彈」教程?

研究人員利用 ArtPrompt 生成 ASCII 藝術,成功繞過了大型語言模型的安全措施,誘導聊天機械人提供了有關製造炸彈的信息。這表明攻擊者如何利用 ASCII 藝術來規避安全限制,讓聊天機械人回答原本被禁止的危險或非法問題。

對話式AI安全漏洞!研究人員繞過安全措施讓AI泄露危險信息 - 天天要聞

偽造鈔票大揭秘?

在另一個例子中,研究人員使用 ArtPrompt 成功地向語言模型詢問了有關偽造鈔票的問題。他們同樣利用 ASCII 藝術替換了原始查詢中可能會被語言模型識別並拒絕的敏感詞,從而繞過了模型的安全防禦。

ArtPrompt 的原理

該技術分為兩個步驟:詞語掩蓋和偽裝式提示生成。首先,提示中的敏感詞會被掩蓋起來,以避免被大型語言模型檢測到。然後,ASCII 藝術被用來替換這些詞,從而創建一個繞過 AI 道德和安全措施的提示。

為什麼這很重要?

ArtPrompt 的影響: 這項技術展示了對話式 AI 安全機制的一個重大漏洞。它不僅挑戰了當前安全措施的有效性,還凸顯了在維護 AI 安全方面,我們正陷入一場與不斷創新的規避伎倆之間的「 whack-a-mole 」 (打地鼠) 遊戲。

AI 系統的安全: ArtPrompt 能夠輕易繞過安全協議,凸顯了對話式 AI 的關鍵安全漏洞。我們需要更加強大和複雜的安全措施來防止濫用。

倫理和法律問題: 像 ArtPrompt 這樣的工具可以讓 AI 生成有害或非法內容,這帶來了重大的倫理和法律挑戰。因此,開發能夠抵抗此類操縱的 AI 至關重要。

科技分類資訊推薦

廣東:科技提速鄉音尋親,鏈接企業就業資源 - 天天要聞

廣東:科技提速鄉音尋親,鏈接企業就業資源

今年6月19日是第13個全國救助管理機構「開放日」,廣東省民政廳、廣州市民政局在廣州市救助管理站市區分站設立「開放日」活動主會場,省、市救助管理工作特邀監督員、人大代表、政協委員,相關社會組織、志願者、市民群眾代表等走進救助管理機構。2024年,廣州市被民政部、省民政廳確定為救助管理區域性中心試點城市之一。...
卡邦電氣 PLC 控制櫃:工業控制主體力量! - 天天要聞

卡邦電氣 PLC 控制櫃:工業控制主體力量!

在現代工業領域,自動化控制的重要性不言而喻,而 PLC 控制櫃則是實現這一關鍵環節的核心設備。今天,我們就來深入了解一下卡邦電氣的 PLC 控制櫃,看看它是如何在工業舞台上大放異彩的。
2025品牌影響力大,姚遠新能源榮獲多個獎項! - 天天要聞

2025品牌影響力大,姚遠新能源榮獲多個獎項!

2025年6月14日至15日,由《中國企業報》、《中國商界》雜誌社、CCTV《發現品牌》欄目組和中國品牌影響力評價辦公室聯合主辦的「2025(第十二屆)品牌影響力發展大會暨成果發佈活動」在北京隆重舉行。
螞蟻消金林嘉南:大模型賦能智能風控,額度互動促進金融健康 - 天天要聞

螞蟻消金林嘉南:大模型賦能智能風控,額度互動促進金融健康

「螞蟻消金希望利用交互式智能風控技術,挖掘年輕人努力成長的證明」。6月19日,在上海舉行的2025中國國際金融展上,螞蟻消金首席風險官林嘉南分享了,如何將大模型技術應用在交互式智能風控領域,從而促進額度的互動性,促進用戶與機構的金融健康。這契合了本屆展會 「開放創新,科技賦能,共創金融新未來」的主題。普惠金...
德國西格瑪(SIGMA Audio)品牌介紹 - 天天要聞

德國西格瑪(SIGMA Audio)品牌介紹

德國西格瑪(SIGMA Audio)品牌溯源:精密工藝與純粹音質的融合德國西格瑪(SIGMA Audio)是享譽全球的高端音響品牌,誕生於德國精密工程與聲學技術的沃土。