康奈爾團隊提出攻擊語言模型新方法,能通過輸出來重構輸入

2024年05月12日18:05:12 科技 1850

近日,美國康奈爾大學博士生趙文婷和所在團隊提出了一種攻擊語言模型的新方法,可以通過語言模型的輸出來重構語言模型的輸入。



康奈爾團隊提出攻擊語言模型新方法,能通過輸出來重構輸入 - 天天要聞

圖 | 趙文婷(來源:趙文婷)


OpenAIChatGPT 語言模型為例, 它會根據用戶的 prompts 計算出一個概率分布,這個概率分布會告訴用戶接下來的輸出是什麼。


那麼,這個概率分布是否也可以用來重構 prompts?而本次研究則展示了通過概率分布,所能實現的高精度重構提示。


這一課題的意義在於:很多商家在提供語言模型的服務時,語言模型里往往都有一些沒有展示給公眾的提示。但是,恰恰是這些提示使得語言模型表現得更好、更精準。


當這些提示被泄露之後,很可能會導致他們商業機密的泄露,從而導致巨大的損失。


另據悉,目前已有越來越多的創業公司進入提供語言模型服務的賽道,很多公司的服務都會基於一些秘密的提示。


而本次成果可以讓這些公司根據所設計的攻擊,提前做一些防禦,讓商業機密得到有效的保護。


趙文婷表示:“做這個課題就是因為我們猜測針對用戶不一樣的任務,ChatGPT 會把這些任務分門別類,然後加上秘密的提示語。”


雖然由於資金有限,該團隊最後沒有成功重構 OpenAI 的提示語,但是在本次論文發表不久之後,OpenAI 去掉了一部分原本會返回給用戶的信息。


“所以,我們猜想 OpenAI 的改變跟我們的論文有聯繫。”趙文婷說。


日前,相關論文以《語言模型反轉》(LANGUAGE MODEL INVERSION)為題發在 arXiv[1]。康奈爾大學約翰·莫里斯(John X. Morris)博士是第一作者,趙文婷是第二作者。



康奈爾團隊提出攻擊語言模型新方法,能通過輸出來重構輸入 - 天天要聞

圖 | 相關論文(來源:arXiv)


審稿人表示,此前從未有人想過可以在語言模型里,用很少的輸出信息重構輸入。而本次方法不僅非常有效,而且十分合理。


趙文婷表示:“我們暫時尚無後續工作,但是論文引起了其他研究者的大量關注。”


有的學者基於本次工作提升了攻擊效率,有的學者發現不僅可以通過概率分布去重構輸入,還可以通過概率分布去獲取別的跟模型有關的信息。


此外,趙文婷表示:“我本科就讀於美國伊利諾伊威斯利安文理學院,大二時發表了人生第一篇 AI 論文。”


大三,她去英國牛津大學交換一年,在那裡第一次接觸到自然語言處理的研究。本科畢業之後,她來到康奈爾大學讀博。


其表示:“我在 2023 年還發表了 WildChat 數據集。該數據集收集了大量真實用戶和 ChatGPT 的聊天記錄,使得公眾第一次能用大量數據去了解 ChatGPT 的真實使用情況。”


數據集發表之後獲得了較大關注,Anthropic 公司的大模型 Claude 也在該數據集上做了評估。


目前,趙文婷主要研究如何使用大語言模型去做複雜的推理任務,從而讓用戶更好地解決複雜問題。


此外,她還做一些跟 data&evaluation 方面的研究。比如,研究如何使用數據訓練更好的語言模型,以及如何有效評估語言模型的能力。


參考資料:

1.https://arxiv.org/pdf/2311.13647


排版:劉雅坤

科技分類資訊推薦

華為Mate80雙重升級曝光,雙潛望+超聲波指紋,麒麟9030也穩了 - 天天要聞

華為Mate80雙重升級曝光,雙潛望+超聲波指紋,麒麟9030也穩了

華為Mate80系列的發布時間,悄悄地又往後挪了一步,但這次的“拖延”,看起來很可能是蓄謀已久的技術升級伏筆。作為年度壓軸旗艦,Mate80並沒有選擇按部就班,而是打破了節奏,用兩個技術大招提前把熱度拉滿。說白了,這不僅不是壞消息,反而預示
蘋果官宣降價:市場策略與行業影響的雙重奏 - 天天要聞

蘋果官宣降價:市場策略與行業影響的雙重奏

在消費電子領域,蘋果公司的一舉一動都備受矚目。近日,蘋果官宣降價的消息如同一顆石子投入平靜的湖面,激起層層漣漪,在消費者、市場以及整個行業中引發了廣泛的關注與熱議。一、降價舉措的背後邏輯蘋果公司此次官宣降價,並非毫無徵兆的突發奇想,而是多種
卷出天花板的電混旗艦?吉利銀河星耀8試駕後,我有些話想說 - 天天要聞

卷出天花板的電混旗艦?吉利銀河星耀8試駕後,我有些話想說

5月9日,吉利銀河星耀8正式上市,僅幾天時間,話題熱度就迅速攀升。不誇張地說,不少車友群、朋友圈幾乎被這台車“刷了屏”。身邊很多朋友也跑來問我:這車真有說的那麼牛嗎?值得入手嗎?帶着這個疑問,我參加了在成都舉行的區域上市品鑒會暨試駕活動。試完之後,我的第一反應
演繹科技浪漫 “手搓”搓出一個全宇宙 - 天天要聞

演繹科技浪漫 “手搓”搓出一個全宇宙

一個從小愛拆車、沒考上大學的孩子,長大後在幹什麼?答案是在雲南農村造車,把科幻片里的車變成現實。雲南昆明山區的農家院里,抖音創作者@豬堅強 的“床車系列”正在刷新認知,能爬樓的履帶車、水陸兩棲的變形車、帶 AI 語音控制的車。
洞察生意本質,開啟財富密碼 - 天天要聞

洞察生意本質,開啟財富密碼

在當今競爭激烈的商業世界中,人人都渴望抓住生意的本質,實現財富的增長。但究竟什麼才是生意的本質?又該如何憑藉它來賺錢呢?生意的本質,說白了就是滿足需求。就像蘋果公司,他們洞察到人們對於簡潔、美觀且功能強大的電子產品的需求,於是推出了一系列驚
小米高端機大跳水,16GB+512GB+60倍變焦,降幅高達2050元 - 天天要聞

小米高端機大跳水,16GB+512GB+60倍變焦,降幅高達2050元

如果你的預算在3000元左右,你會選擇新款中端旗艦還是會選擇某些大跳水的老款高端手機呢?相信不同的人會有不同的決定。如果你比較側重的是遊戲體驗,對拍照的要求不是很高,相信不少網友都會選擇新款中端旗艦....
一季度華為小米手機銷量大增 蘋果再下滑 - 天天要聞

一季度華為小米手機銷量大增 蘋果再下滑

時間來到了5月末,除了華為的影像旗艦Pura 80系列外,各家廠商都已經完成了這一輪的旗艦機型發布。就在近日,Counterpoint帶來了2025年第一季度的手機銷量統計。各家廠商表現如何?一起來看看。先來看全球市場方面的表現,據報告介紹,2025年Q1全球智能手機市場收入同比增長3%,主要由Apple、vivo及非排名前五的品牌推動。...