Google DeepMind 推出评估AI模型危险性的新框架

2024年05月18日17:45:16 科技 1454

Google DeepMind 周五发布了一个框架,用于窥视人工智能模型内部,以确定它们是否正在接近危险能力。周五发布的论文描述了这样一个过程:每当用于训练模型的计算能力提高六倍,或者微调三个月,DeepMind 的模型就会被重新评估。在两次评估之间,DeepMind 将设计预警评估。

Google DeepMind 推出评估AI模型危险性的新框架 - 天天要闻

根据一份与 Semafor 独家分享的声明,DeepMind 将与其他公司、学术界和立法者合作,共同完善该框架。该公司计划在2025年前开始实施其审计工具。

如今,评估功能强大的前沿人工智能模型更像是一个临时过程,随着研究人员开发新技术而不断演变。"红队"会花费数周或数月的时间对其进行测试,尝试可能绕过保障措施的不同提示。然后,公司会采用各种技术,从强化学习到特殊提示,使模型符合要求。

这种方法对现在的模型很有效,因为它们还不够强大,不足以构成太大的威胁,但研究人员认为,随着模型能力的增强,需要一个更强大的过程。批评者担心,当人们意识到这种技术已经走得太远时,为时已晚。

DeepMind 发布的"前沿安全框架"希望解决这个问题。这是包括 MetaOpenAI 和微软在内的主要科技公司为减轻人们对人工智能的担忧而宣布的几种方法之一。

该公司表示:"尽管这些风险超出了现有模型的能力范围,但我们希望实施和改进该框架将有助于我们做好应对这些风险的准备。"

Google DeepMind 推出评估AI模型危险性的新框架 - 天天要闻

DeepMind 开发人工智能模型"预警"系统已有一年多时间。它还发表了关于评估模型的新方法的论文,这些方法远远超出了目前大多数公司所使用的方法。

前沿模型框架将这些进展纳入一套简洁的协议中,包括对模型的持续评估,以及研究人员在发现所谓"临界能力水平"时应采取的缓解方法。这可能是指模型能够通过操纵人类对其施加意志,在人工智能研究领域被称为"超常代理",也可能是指模型具有编写复杂恶意软件的能力。

DeepMind 为四个领域设定了具体的关键能力级别:自主、生物安全、网络安全和机器学习研发。

该公司表示:"在降低风险与促进获取和创新之间取得最佳平衡,对于负责任地发展人工智能至关重要。"DeepMind 将于下周在首尔举行的人工智能安全峰会上讨论该框架,届时其他行业领袖也将出席。

令人鼓舞的是,DeepMind 的人工智能研究人员正在用更科学的方法确定人工智能模型内部发生了什么,尽管他们还有很长的路要走。

研究人员在能力方面取得突破的同时,也在提高他们理解并最终控制这些软件的能力,这对人工智能安全也很有帮助。

不过,今天发布的论文对如何进行这些评估的技术细节着墨不多。就目前而言,可以说我们还不知道目前的技术是否能让这个框架取得成功。

这其中还有一个有趣的监管因素。由加州参议员斯科特-维纳(Scott Wiener)发起的一项新的人工智能综合法案将要求人工智能公司在训练模型之前对其危险性进行评估。这个框架是目前看到的第一个可能使遵守该法律成为可能的框架。但同样还不清楚技术上是否可行。

还有一点:构建这些技术还有另一种用途:它可以帮助公司预测人工智能模型的能力在未来数月或数年内会发生怎样的变化。这些知识可以帮助产品团队更快地设计出新产品,从而为Google和其他有能力进行这些评估的公司带来优势。

了解更多:

https://deepmind.google/discover/blog/introducing-the-frontier-safety-framework/

科技分类资讯推荐

世界首次!中国大疆无人机刷新纪录,珠穆朗玛峰穿越成历史时刻 - 天天要闻

世界首次!中国大疆无人机刷新纪录,珠穆朗玛峰穿越成历史时刻

惊天动地!中国科技巨头大疆创造了全球历史性的壮举,旗下无人机成功穿越世界之巅—珠穆朗玛峰!这一创举不仅震撼了全球科技界,也让欧美国家彻底慌了手脚。中国科技的崛起,已经让全球为之侧目,这次的壮举更是引发了一场前所未有的技术竞赛。让我们一起来看
独家揭秘:享界s9盲订破5万台,文咏珊引爆美丽革命! - 天天要闻

独家揭秘:享界s9盲订破5万台,文咏珊引爆美丽革命!

近日,令人瞩目的消息传出,知名品牌享界推出的最新款手机s9盲订量已突破5万台!令人激动的不仅是这一壮举本身,更是其中的宣传图引发了无尽的赞叹和讨论。一位网友称赞道:“看完宣传图,文咏珊太美了!太适合了!”让我们一起来揭开这个备受瞩目的话题吧
看完不踩坑!618 全价位平板电脑详细推荐 - 天天要闻

看完不踩坑!618 全价位平板电脑详细推荐

很多朋友期待的 618 平板电脑推荐来啦,这段时间各大平台的优惠不知道有没有给你们看花眼,反正果子是花眼了。有些优惠券藏得比我私房钱还深,少部分甚至要私聊客服才能用,想要获得最佳优惠就得好好研究一下。不过年中大促没什么好说的,是一年中比较适合入手数码设备的节点,有需要就可以下手了,我们直接进入推荐环节吧...
荣耀100 Pro高配版不到3000元了?二代骁龙8+写真人像不要太香! - 天天要闻

荣耀100 Pro高配版不到3000元了?二代骁龙8+写真人像不要太香!

无论是为了给新机让路,还是为了在年中大促中抢占更多的市场份额,荣耀前代数字旗舰系列--荣耀100 Pro也迎来了价格大调整,目前16GB+512GB版本已经下调至3000元以内,拥有二代骁龙8处理器并且拥有号称单反级写真相机的它,着实是香得很呐~如果你近期正准备换手机,又对新推出的机子不太满意,那么不妨跟随我的目光一起,看...
联想 EA350 开放式真无线耳机开售:支持蓝牙 5.4,首发 129 元 - 天天要闻

联想 EA350 开放式真无线耳机开售:支持蓝牙 5.4,首发 129 元

IT之家 6 月 9 日消息,日前,联想 EA350 开放式真无线耳机在京东平台开售,原价 179 元,首发价 129 元。据介绍,这款新品耳机采用零感亲肤材质,左右耳都有单独的触控按键,可随意切歌、接听挂断电话、唤醒语音助手,支持闪连 5.4 技术。首次配对后,打开仓盖自动开机,自动完成连接,拿起即可聆听。该产品配备 13mm 动圈...
市场变化:苹果份额25%下滑,国产品牌崛起时机已到? - 天天要闻

市场变化:苹果份额25%下滑,国产品牌崛起时机已到?

文|斗战圣魔归来苹果手机晒出真实遭遇,国产品牌“突飞猛进”时刻到了时间到了六月,如果要问手机市场到底朝着什么样的路线发展,那么答案大概不可能偏离“同质化、跟风与模仿”这些关键词不过正是在这些名词之间,如果稍微细看一眼手机行业的目前最新的趋势
Magic6大跳水跌至3856元,16+512G杀疯了! - 天天要闻

Magic6大跳水跌至3856元,16+512G杀疯了!

512GB顶配竟不到4000元一则荣耀Magic6大降价的消息在网上引起了热议。没错,就是那款今年1月份刚上市,以极致性能和影像实力俘获无数果粉的Magic6系列,仅仅过了短短五个月,就迎来了一次”from天价to白菜”的大跳水。
群体沉迷色情,全因马斯克?评论区不忍直视,笑掉大牙 - 天天要闻

群体沉迷色情,全因马斯克?评论区不忍直视,笑掉大牙

近日,一则新闻让人感到吃惊,一个长期生活在亚马逊雨林深处的原始部落沉浸在互联网中,他们整天所痴迷的并不是求知,也不是直播,而是网络色情!在这个部落里,互联网成为了一种新兴的稀罕物,因为在去年9月突然之间就联网了,网络让这里的人感到前所未有的