康奈尔团队提出攻击语言模型新方法,能通过输出来重构输入

2024年05月12日18:05:12 科技 1850

近日,美国康奈尔大学博士生赵文婷和所在团队提出了一种攻击语言模型的新方法,可以通过语言模型的输出来重构语言模型的输入。



康奈尔团队提出攻击语言模型新方法,能通过输出来重构输入 - 天天要闻

图 | 赵文婷(来源:赵文婷)


OpenAIChatGPT 语言模型为例, 它会根据用户的 prompts 计算出一个概率分布,这个概率分布会告诉用户接下来的输出是什么。


那么,这个概率分布是否也可以用来重构 prompts?而本次研究则展示了通过概率分布,所能实现的高精度重构提示。


这一课题的意义在于:很多商家在提供语言模型的服务时,语言模型里往往都有一些没有展示给公众的提示。但是,恰恰是这些提示使得语言模型表现得更好、更精准。


当这些提示被泄露之后,很可能会导致他们商业机密的泄露,从而导致巨大的损失。


另据悉,目前已有越来越多的创业公司进入提供语言模型服务的赛道,很多公司的服务都会基于一些秘密的提示。


而本次成果可以让这些公司根据所设计的攻击,提前做一些防御,让商业机密得到有效的保护。


赵文婷表示:“做这个课题就是因为我们猜测针对用户不一样的任务,ChatGPT 会把这些任务分门别类,然后加上秘密的提示语。”


虽然由于资金有限,该团队最后没有成功重构 OpenAI 的提示语,但是在本次论文发表不久之后,OpenAI 去掉了一部分原本会返回给用户的信息。


“所以,我们猜想 OpenAI 的改变跟我们的论文有联系。”赵文婷说。


日前,相关论文以《语言模型反转》(LANGUAGE MODEL INVERSION)为题发在 arXiv[1]。康奈尔大学约翰·莫里斯(John X. Morris)博士是第一作者,赵文婷是第二作者。



康奈尔团队提出攻击语言模型新方法,能通过输出来重构输入 - 天天要闻

图 | 相关论文(来源:arXiv)


审稿人表示,此前从未有人想过可以在语言模型里,用很少的输出信息重构输入。而本次方法不仅非常有效,而且十分合理。


赵文婷表示:“我们暂时尚无后续工作,但是论文引起了其他研究者的大量关注。”


有的学者基于本次工作提升了攻击效率,有的学者发现不仅可以通过概率分布去重构输入,还可以通过概率分布去获取别的跟模型有关的信息。


此外,赵文婷表示:“我本科就读于美国伊利诺伊威斯利安文理学院,大二时发表了人生第一篇 AI 论文。”


大三,她去英国牛津大学交换一年,在那里第一次接触到自然语言处理的研究。本科毕业之后,她来到康奈尔大学读博。


其表示:“我在 2023 年还发表了 WildChat 数据集。该数据集收集了大量真实用户和 ChatGPT 的聊天记录,使得公众第一次能用大量数据去了解 ChatGPT 的真实使用情况。”


数据集发表之后获得了较大关注,Anthropic 公司的大模型 Claude 也在该数据集上做了评估。


目前,赵文婷主要研究如何使用大语言模型去做复杂的推理任务,从而让用户更好地解决复杂问题。


此外,她还做一些跟 data&evaluation 方面的研究。比如,研究如何使用数据训练更好的语言模型,以及如何有效评估语言模型的能力。


参考资料:

1.https://arxiv.org/pdf/2311.13647


排版:刘雅坤

科技分类资讯推荐

探秘vivo影像之美,与X系列技术沟通会共同见证卓越蓝图 - 天天要闻

探秘vivo影像之美,与X系列技术沟通会共同见证卓越蓝图

前段时间的vivo X系列新品发布让我们记忆深刻,而刚刚结束结束的“影像新蓝图X系列技术沟通会”也十分精彩,这次沟通会不仅告诉了大家vivo在影像领域的最新成果,也让粉丝们对vivo影像背后的故事有更多了解,在vivo影像的发展历程中可以分成两方面,一方面,vivo通过自主研发,不断提升自身的影像技术实力,另一方面,vivo...
华为再次亮剑,鸿蒙系统亮点多多 - 天天要闻

华为再次亮剑,鸿蒙系统亮点多多

5月15日,华为夏季全场景新品发布会简直是一场视觉与科技的盛宴,看得我热血沸腾!不得不说,华为这次真的是大招频出,新品多到让人眼花缭乱!先说说那个华为MatePad 11.5 ” S吧,一亮相就让人眼前一亮!它的设计简约而不失时尚,屏幕清晰得让人仿佛置身其中。
【新机】升级了个寂寞?蓝厂新机发布 - 天天要闻

【新机】升级了个寂寞?蓝厂新机发布

昨天晚上蓝厂发布了新机iQOO Neo9s Pro,机子采用了6.78英寸1.5K 8T LTPO直面屏,支持144Hz刷新率。搭载天玑9300+,前置1600万像素,后置IMX920主摄+5000万超广角。电池容量5160mAh,支持120W快充。新增白色版本,用上了白色玻璃后盖,颜值确实提升了不少。不过还是塑料中框+短焦指纹。12+256GB 2699元
AI Agent在哪些行业领域会产生影响? - 天天要闻

AI Agent在哪些行业领域会产生影响?

在如今飞速前进的科技浪潮中,人工智能(AI)技术的创新正以前所未有的速度重塑我们的生活和工作的每一个角落。在这一浪潮中,Agent AI智能体以其卓越的能力脱颖而出,它通过模拟人类智能行为,能够胜任一系列复杂任务,并在多个领域展现出了其无法替代的价值。
续航王者vivo Y200系列掀起购机狂潮,618购机可享多重福利优惠 - 天天要闻

续航王者vivo Y200系列掀起购机狂潮,618购机可享多重福利优惠

智能手机的选择五花八门,但有一条赛道被vivo独占,那就是长续航。刚刚发布的vivo Y200系列凭借其超长的续航能力和轻薄的设计,一经推出便受到广大用户的关注和好评,彻底改变了行业续航的基准线。如今Y200系列新品已正式开启预售及首销,期间购机可享多重福利优惠。
【现场】人工关节集采续约开标:企业代表“不紧张”,多家报价压线进 - 天天要闻

【现场】人工关节集采续约开标:企业代表“不紧张”,多家报价压线进

界面新闻记者 | 唐卓雅界面新闻编辑 | 谢欣5月21日,国家组织人工关节集中带量采购协议期满接续采购(下称“人工关节续采”)在天津东丽湖恒大酒店国际会议中心开标。此次续标的产品范围与2021年的首轮集采相同,包括髋关节(陶瓷-陶瓷类、陶瓷-聚乙烯类和合金-聚乙烯类)和膝关节,采购周期由两年延长为三年,采购需求量为...
产品经理谈一谈:水果店应该怎么开 - 天天要闻

产品经理谈一谈:水果店应该怎么开

这几年,不少人都计划着整个副业,或者以后被毕业了去做什么。有准备摆摊的,有准备开咖啡店开书店的,也有人准备开水果店的。只是工作这么久了,相关的经验能否平移过去?如果用产品思维来看,我们做一个店面,需要怎么做呢?