Google DeepMind 推出评估AI模型危险性的新框架

2024年05月18日17:45:16 科技 1454

Google DeepMind 周五发布了一个框架,用于窥视人工智能模型内部,以确定它们是否正在接近危险能力。周五发布的论文描述了这样一个过程:每当用于训练模型的计算能力提高六倍,或者微调三个月,DeepMind 的模型就会被重新评估。在两次评估之间,DeepMind 将设计预警评估。

Google DeepMind 推出评估AI模型危险性的新框架 - 天天要闻

根据一份与 Semafor 独家分享的声明,DeepMind 将与其他公司、学术界和立法者合作,共同完善该框架。该公司计划在2025年前开始实施其审计工具。

如今,评估功能强大的前沿人工智能模型更像是一个临时过程,随着研究人员开发新技术而不断演变。"红队"会花费数周或数月的时间对其进行测试,尝试可能绕过保障措施的不同提示。然后,公司会采用各种技术,从强化学习到特殊提示,使模型符合要求。

这种方法对现在的模型很有效,因为它们还不够强大,不足以构成太大的威胁,但研究人员认为,随着模型能力的增强,需要一个更强大的过程。批评者担心,当人们意识到这种技术已经走得太远时,为时已晚。

DeepMind 发布的"前沿安全框架"希望解决这个问题。这是包括 MetaOpenAI 和微软在内的主要科技公司为减轻人们对人工智能的担忧而宣布的几种方法之一。

该公司表示:"尽管这些风险超出了现有模型的能力范围,但我们希望实施和改进该框架将有助于我们做好应对这些风险的准备。"

Google DeepMind 推出评估AI模型危险性的新框架 - 天天要闻

DeepMind 开发人工智能模型"预警"系统已有一年多时间。它还发表了关于评估模型的新方法的论文,这些方法远远超出了目前大多数公司所使用的方法。

前沿模型框架将这些进展纳入一套简洁的协议中,包括对模型的持续评估,以及研究人员在发现所谓"临界能力水平"时应采取的缓解方法。这可能是指模型能够通过操纵人类对其施加意志,在人工智能研究领域被称为"超常代理",也可能是指模型具有编写复杂恶意软件的能力。

DeepMind 为四个领域设定了具体的关键能力级别:自主、生物安全、网络安全和机器学习研发。

该公司表示:"在降低风险与促进获取和创新之间取得最佳平衡,对于负责任地发展人工智能至关重要。"DeepMind 将于下周在首尔举行的人工智能安全峰会上讨论该框架,届时其他行业领袖也将出席。

令人鼓舞的是,DeepMind 的人工智能研究人员正在用更科学的方法确定人工智能模型内部发生了什么,尽管他们还有很长的路要走。

研究人员在能力方面取得突破的同时,也在提高他们理解并最终控制这些软件的能力,这对人工智能安全也很有帮助。

不过,今天发布的论文对如何进行这些评估的技术细节着墨不多。就目前而言,可以说我们还不知道目前的技术是否能让这个框架取得成功。

这其中还有一个有趣的监管因素。由加州参议员斯科特-维纳(Scott Wiener)发起的一项新的人工智能综合法案将要求人工智能公司在训练模型之前对其危险性进行评估。这个框架是目前看到的第一个可能使遵守该法律成为可能的框架。但同样还不清楚技术上是否可行。

还有一点:构建这些技术还有另一种用途:它可以帮助公司预测人工智能模型的能力在未来数月或数年内会发生怎样的变化。这些知识可以帮助产品团队更快地设计出新产品,从而为Google和其他有能力进行这些评估的公司带来优势。

了解更多:

https://deepmind.google/discover/blog/introducing-the-frontier-safety-framework/

科技分类资讯推荐

哈弗 H6 国潮版一口价 7.19 万元起!配备 12.3 英寸中控屏 - 天天要闻

哈弗 H6 国潮版一口价 7.19 万元起!配备 12.3 英寸中控屏

在紧凑型 SUV 市场的激烈角逐中,哈弗 H6 国潮版以震撼低价掀起购车热潮 —— 一口价 7.19 万元起的超值定价,搭配越级配置,成为家庭用户的高性价比之选。其中,1.5T 手动两驱都市版售价 7.19 万元,1.5T 自动两驱都市版售价 8.19 万元,
极狐全新轿车谍照曝光!或命名为极狐 S1 - 天天要闻

极狐全新轿车谍照曝光!或命名为极狐 S1

新能源汽车赛道竞争愈发激烈,各车企纷纷加速新品布局。近日,一组极狐全新轿车的谍照在网络上曝光,据悉,这款新车或命名为极狐 S1。尽管谍照中的车辆身披厚重伪装,但仍难掩其独特魅力,从外观到内饰,再到动力系统,都引发了市场的广泛猜测与期待。
极氪 9X 车型实车曝光!计划今第三季度正式上市 - 天天要闻

极氪 9X 车型实车曝光!计划今第三季度正式上市

近日,极氪旗下全新车型 —— 极氪 9X 实车惊艳曝光,引发汽车圈广泛关注。据悉,这款备受期待的车型计划于今年第三季度正式上市,有望为紧凑级豪华纯电 SUV 市场注入全新活力。从实车展现的外观,及动力来看,极氪 9X 亮点满满,令人期待值拉满。
中国关系型数据库软件市场年复合增长率超20%,软件ETF连续3天净流入超亿元 - 天天要闻

中国关系型数据库软件市场年复合增长率超20%,软件ETF连续3天净流入超亿元

截至2025年6月20日 13:02,中证软件服务指数下跌1.29%。成分股方面,国联股份领跌,电科网安、太极股份、恒生电子、启明星辰跟跌。软件ETF(159852)回调蓄势。拉长时间看,截至2025年6月19日,软件ETF近1年累计上涨29.13%。流动性方面,软件ETF盘中换手3.44%,成交1.01亿元。拉长时间看,截至6月19日,软件ETF近1年日均
荣耀GT Pro续航称霸 vs vivo S30 Pro mini轻薄碾压! - 天天要闻

荣耀GT Pro续航称霸 vs vivo S30 Pro mini轻薄碾压!

当7200mAh怪兽电池遇上186g羽量级机身,2025年这两款旗舰究竟谁能笑到最后?我们通过四款新机的硬核参数,揭晓不同需求的终极答案。荣耀 GT Pro:性能与续航的双料王者骁龙8 Elite领先版+144Hz电竞屏的组合,让这款手机成
荣耀Magic V5登场:最薄大折叠+最强AI,手机行业的下一站答案 - 天天要闻

荣耀Magic V5登场:最薄大折叠+最强AI,手机行业的下一站答案

在2025年AI技术迅猛发展的浪潮中,行业各大厂商竞相发力,而苹果则显得动作迟缓。在刚刚落幕的苹果WWDC2025上,苹果将升级重点放在全新界面UI上,AI创新不足且国行版仍无期,让用户直呼失望,有媒体称“这应该是苹果近些年最无聊的一场WWDC了”。6月19日在上海MWC期间,荣耀召开了AI技术沟通会,深度阐释其在 AI 领域的技术...
2025商旅平台盘点:AI驱动下的商旅平台 - 天天要闻

2025商旅平台盘点:AI驱动下的商旅平台

当 AI 大模型开始重构企业管理流程,2025 年的中国商旅市场正经历一场从 “资源竞争” 到 “技术革命” 的深层变革。据行业数据显示,智能商旅平台渗透率已大大突破 ,AI 驱动的商旅管理自动化使企业商旅成本显著下降 ,这场由技术主导的生态重构,正在重新定义企业商旅管理的价值边界。适合大中型企业的综合型平台:分贝通...