Google DeepMind 推出评估AI模型危险性的新框架

2024年05月18日17:45:16 科技 1454

Google DeepMind 周五发布了一个框架,用于窥视人工智能模型内部,以确定它们是否正在接近危险能力。周五发布的论文描述了这样一个过程:每当用于训练模型的计算能力提高六倍,或者微调三个月,DeepMind 的模型就会被重新评估。在两次评估之间,DeepMind 将设计预警评估。

Google DeepMind 推出评估AI模型危险性的新框架 - 天天要闻

根据一份与 Semafor 独家分享的声明,DeepMind 将与其他公司、学术界和立法者合作,共同完善该框架。该公司计划在2025年前开始实施其审计工具。

如今,评估功能强大的前沿人工智能模型更像是一个临时过程,随着研究人员开发新技术而不断演变。"红队"会花费数周或数月的时间对其进行测试,尝试可能绕过保障措施的不同提示。然后,公司会采用各种技术,从强化学习到特殊提示,使模型符合要求。

这种方法对现在的模型很有效,因为它们还不够强大,不足以构成太大的威胁,但研究人员认为,随着模型能力的增强,需要一个更强大的过程。批评者担心,当人们意识到这种技术已经走得太远时,为时已晚。

DeepMind 发布的"前沿安全框架"希望解决这个问题。这是包括 MetaOpenAI 和微软在内的主要科技公司为减轻人们对人工智能的担忧而宣布的几种方法之一。

该公司表示:"尽管这些风险超出了现有模型的能力范围,但我们希望实施和改进该框架将有助于我们做好应对这些风险的准备。"

Google DeepMind 推出评估AI模型危险性的新框架 - 天天要闻

DeepMind 开发人工智能模型"预警"系统已有一年多时间。它还发表了关于评估模型的新方法的论文,这些方法远远超出了目前大多数公司所使用的方法。

前沿模型框架将这些进展纳入一套简洁的协议中,包括对模型的持续评估,以及研究人员在发现所谓"临界能力水平"时应采取的缓解方法。这可能是指模型能够通过操纵人类对其施加意志,在人工智能研究领域被称为"超常代理",也可能是指模型具有编写复杂恶意软件的能力。

DeepMind 为四个领域设定了具体的关键能力级别:自主、生物安全、网络安全和机器学习研发。

该公司表示:"在降低风险与促进获取和创新之间取得最佳平衡,对于负责任地发展人工智能至关重要。"DeepMind 将于下周在首尔举行的人工智能安全峰会上讨论该框架,届时其他行业领袖也将出席。

令人鼓舞的是,DeepMind 的人工智能研究人员正在用更科学的方法确定人工智能模型内部发生了什么,尽管他们还有很长的路要走。

研究人员在能力方面取得突破的同时,也在提高他们理解并最终控制这些软件的能力,这对人工智能安全也很有帮助。

不过,今天发布的论文对如何进行这些评估的技术细节着墨不多。就目前而言,可以说我们还不知道目前的技术是否能让这个框架取得成功。

这其中还有一个有趣的监管因素。由加州参议员斯科特-维纳(Scott Wiener)发起的一项新的人工智能综合法案将要求人工智能公司在训练模型之前对其危险性进行评估。这个框架是目前看到的第一个可能使遵守该法律成为可能的框架。但同样还不清楚技术上是否可行。

还有一点:构建这些技术还有另一种用途:它可以帮助公司预测人工智能模型的能力在未来数月或数年内会发生怎样的变化。这些知识可以帮助产品团队更快地设计出新产品,从而为Google和其他有能力进行这些评估的公司带来优势。

了解更多:

https://deepmind.google/discover/blog/introducing-the-frontier-safety-framework/

科技分类资讯推荐

无线信号增强秘籍,桥接和中继模式哪个更强? - 天天要闻

无线信号增强秘籍,桥接和中继模式哪个更强?

【ZOL中关村在线原创技术解析】随着无线通信与计算机技术飞速发展,人们愈发渴望随时随地享受稳定的数据通信服务。无线路由器作为无线网络核心设备,作用关键。但当其信号覆盖不足,如穿过两堵墙后信号微弱时,可通过无线桥接或中继模式连接两个无线路由器,扩展网络、增强信号。中继模式和桥接模式虽都能扩展网络覆盖,但...
流畅更耐用 魅族Note 16将预装Flyme 12 - 天天要闻

流畅更耐用 魅族Note 16将预装Flyme 12

魅族官方透露,将于5月发布的魅族Note 16系列将出厂预装Flyme 12新系统,这也是Flyme系统大版本首次在非旗舰机型上首发。魅族Note 16搭载紫光展锐T765处理器,配备6.78英寸LCD屏,分辨率达2460*1080。后置采用八边形相机模组,由5000万像素主摄和200万像素镜头组成。续航方面,内置6600mAh大容量电池,支持40W有线充电
跨境电商迎“成本地震”,行业洗牌加速 - 天天要闻

跨境电商迎“成本地震”,行业洗牌加速

【环球网财经综合报道】近日,美国正式终止了对中国价值不超过800美元的小额包裹免征关税的政策,这一变化引发了中国跨境电商行业的连锁反应。多家物流公司随即调整策略,物流费用普遍上涨,并增加了高额预收税金。(图片来源:东方IC)美国的800美元小额免税政策(De Minimis)自2016年实施以来,极大地推动了全球跨境电商...
音乐节超时粉丝吵上热搜!罗云熙周深发布联合说明 - 天天要闻

音乐节超时粉丝吵上热搜!罗云熙周深发布联合说明

5月4日,太湖湾音乐节组委会“关于5月1日太湖湾音乐节的相关讨论”,联合罗云熙工作室、周深工作室作出如下说明:在演出过程中,现场因节奏调整产生变化,相关团队均已积极协作,确保了整体流程顺利完成。对于由此引发的相关关注,我们充分理解大家的关心
国外一公司推出“空中自行车”:可垂直起飞、极速200公里/时 - 天天要闻

国外一公司推出“空中自行车”:可垂直起飞、极速200公里/时

快科技5月5日消息,近日,国外一家名为Volonaut的新成立公司推出了一款 “空中自行车”,这是一款具有创新性和颠覆性的飞行载具。其由Jetson One(注:一款飞行器)创造者托马斯・帕坦(Tomasz Patan)在波兰研发,其设计灵感源自科幻电影,尤其是《星球大战》中的飞行摩托。外观上没有传统飞行器的冗余结构,仅见容纳推进...
全球首款双形态人形机器人正式发布! - 天天要闻

全球首款双形态人形机器人正式发布!

前言首次定义具身人形机器人商用范式。近日消息,全球首款双形态人形机器人——数字华夏IP系列开山之作星行侠P01正式发布。颜值高、智商高、易使用首次定义具身人形机器人商用范式据悉,数字华夏推出IP系列的初衷,是打造属于这个时代的“商用机器人”。“外形潮流时尚、智商情商兼具、使用维护极简,首次定义具身人形机...
三星One UI 8测试版或下月推出 给后续修复留出时间 - 天天要闻

三星One UI 8测试版或下月推出 给后续修复留出时间

【CNMO科技消息】三星已经开始内部测试全新的One UI 8系统,同时也在包括Galaxy Z Flip6在内的多款设备上进行适配测试。按照目前的进度来看,这次更新的到来时间可能比很多人预想得更早,有可能会在今年7月或8月之前就正式推出。 和以往一样,三星应该会先上线One UI 8的测试版计划,给部分用户提前尝鲜的机会。根据最新消...
苹果引入Anthropic开发的Claude AI系统 欲放弃自研? - 天天要闻

苹果引入Anthropic开发的Claude AI系统 欲放弃自研?

【CNMO科技消息】苹果最近开始引入Anthropic公司开发的Claude AI系统,用于协助其工程师更高效地编写代码。 长期以来,苹果一直坚持自主研发核心技术,很少依赖外部力量。但这一次,它选择与Anthropic合作,将后者的Claude Sonnet模型集成到自家开发工具Xcode的升级版本中。据彭博社报道,这项合作已经开始在内部落地,主要...
6 大升级!Apple Watch SE 3 入门款到底有多能打? - 天天要闻

6 大升级!Apple Watch SE 3 入门款到底有多能打?

文 | 路边同学还有 4 个月,苹果将推出新一代入门级智能手表 —— Apple Watch SE 3。这款原计划在 2024 年发布的机型,因市场节奏调整延后至今,却也让外界对其升级细节有了更充分的爆料空间。