DeepMind大模型再登Nature:8分钟预测15日天气,超顶尖物理模型

2024年12月05日15:14:03 科学 1942

克雷西 发自 凹非寺

量子位 | 公众号 QbitAI

DeepMind大模型再登上Nature——

气象预测大模型GenCast,8分钟内完成15天的预测,而且不管常规还是极端天气都能分析。

在97.2%的场景中,GenCast的表现都超过了全球顶尖的中期天气预报系统ENS。

DeepMind大模型再登Nature:8分钟预测15日天气,超顶尖物理模型 - 天天要闻

不同于DeepMind之前推出的GraphCast的确定性预测,GenCast关注的是各种天气情况的概率。

和GraphCast一样,GenCast也已经开源

它基于扩散模型实现,分辨率为0.25度经度/纬度(在赤道处约为28×28公里),相当于将地球表面分割成了超过100万个网格。

每个网格都涵盖80多个地表和大气变量,相当于每次预测都有数千万甚至上亿条数据生成。

测试结果表明,在1320种实验条件中,GenCast在97.2%的任务中,都比ENS更准确

DeepMind大模型再登Nature:8分钟预测15日天气,超顶尖物理模型 - 天天要闻

对于GenCast的表现,论文作者、DeepMind研究人员Ilan Price表示:

我们确实取得了巨大的进步,通过机器学习赶上了并超越了基于物理的模型。

准确率超最强传统方法

传统天气预报基于数值天气预报(NWP)算法实现,核心是对模拟大气动力学方程求近似解。

不过,相比于单一确定性的预测,气象机构越来越依赖集合预报,生成多个基于NWP的结果,对各种可能的情景进行建模。

GenCast做的也是集合式预报,当然基于的原理不是NWP而是AI。

DeepMind大模型再登Nature:8分钟预测15日天气,超顶尖物理模型 - 天天要闻

开头提到的ENS,就是目前最先进的集合预报系统,来自欧洲欧洲中期天气预报中心ECMWF,未来将被纳入其确定性预报系统HRES。

但即便是这种最强的传统方式,也无法战胜AI系统。

在常规预报当中,DeepMind团队利用训练数据中未涵盖的真实历史(2019年)数据,设置了1320种实验条件,涉及不同的物理变量、预报时长和垂直高度。

结果在97.2%的场景当中,GenCast的CRPS都显著优于ENS,如果只看对36小时之后的预测,GenCast在99.6%的条件下都能胜出。

(CRPS衡量了预报与观测值之间累积概率分布的差异,数值越小说明预报越准确)

DeepMind大模型再登Nature:8分钟预测15日天气,超顶尖物理模型 - 天天要闻

对于高温、大风等极端天气事件(实验中按发生概率分为1%/0.1%/0.01%三档),除了在个别场景下,GenCast的预报的相对经济价值(REV)显著优于ENS。

(2t代表距离海平面2米高处温度,10wind_speed代表10米处风速,msl代表平均海平面气压,蓝线代表GenCast)

DeepMind大模型再登Nature:8分钟预测15日天气,超顶尖物理模型 - 天天要闻

除了基础的预测,在下游应用上GenCast也表现出了更强的预测能力。

DeepMind团队测试了一款区域风电应用,使用全球发电厂数据库中的5344个风电场位置和装机容量信息,通过插值获得各风电场位置的10米风速预报,并通过功率曲线转换为风电功率。

在120公里、240公里、480公里三个空间聚合尺度上,GenCast的风电功率预报CRPS和REV在7天内都显著优于ENS。

DeepMind大模型再登Nature:8分钟预测15日天气,超顶尖物理模型 - 天天要闻

不仅精准性强,GenCast的预测速度也很快,完成一次15天的预测仅需约8分钟,而ENS需要几个小时。

用扩散模型预测天气

不同于DeepMind去年在Science上发表的GraphCast(基于图神经网络GNN),GenCast基于扩散模型实现

它以最近的X(t)和前一步天气状态X(t-1)的残差Z(t)为采样条件,经过去噪后得到预测结果,然后利用预测结果计算新的残差作为新的输入依据,将预测向更长时间延伸。

DeepMind大模型再登Nature:8分钟预测15日天气,超顶尖物理模型 - 天天要闻

而具体的去噪过程,DeepMind又选择了交给Transformer来完成。

Transformer编码器首先将物理状态场从经纬度网格表征映射到一个六次细化的二十面体网格上。

然后,在Transformer的自注意力机制中,网格上的每个节点都会关注其周围32跳邻域内的所有节点,从而有效捕捉局部和中等尺度的天气特征。

最后,解码器将结果映射回原始分辨率,得到去噪后的结果。

GenCast从公开的ERA5再分析数据集中,选取了1979至2018这40年的数据(间隔12小时,分辨率0.25°)对GenCast进行了训练。

为了提高预训练效率,数据首先被降采样到1°分辨率,使用5次细化的二十面体网格进行学习。

这个阶段需要200万步,在32个TPUv5实例上运行约3.5天。

完成预训练后,再用原始的0.25度分辨率数据和6次细化的二十面体网格,对模型进行高精度微调,共计64000步,需要约1.5天完成。

目前,像去年发布的确定性预测模型GraphCast一样,GenCast也已经开源,代码和模型权重均已发布。

DeepMind还表示,将会很快发布GenCast(和以前的模型)生成的实时和历史预报结果,为其他研究者提供更多的研究资源。

论文地址:
https://www.nature.com/articles/s41586-024-08252-9

参考链接:
[1]https://deepmind.google/discover/blog/gencast-predicts-weather-and-the-risks-of-extreme-conditions-with-sota-accuracy/

[2]https://www.nature.com/articles/d41586-024-03957-3

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

科学分类资讯推荐

中国交付全球最大“人造太阳”重要部件 - 天天要闻

中国交付全球最大“人造太阳”重要部件

近日,全球最大“人造太阳”国际热核聚变实验堆(ITER)计划磁体馈线采购包项目迎来关键节点,其最后一套校正场线圈内馈线部件在合肥竣工,并交付起运位于法国的ITER现场。这标志着ITER磁体馈线系统中所有超大部件的研制顺利完成。ITER磁体馈线系统由中国科学院合肥物质科学研究院等离子体物理研究所研制,被称为ITER磁体系...
张振丰调研温州学研究联合会 构建中国学视野下的温州学研究体系 - 天天要闻

张振丰调研温州学研究联合会 构建中国学视野下的温州学研究体系

4月13日,副省长、市委书记张振丰在温州学研究联合会调研时强调,要深入学习贯彻习近平文化思想和习近平总书记考察浙江重要讲话精神,坚持“立足温州、研究温州、服务温州”,深化时间维度、放大空间维度,贯通历史研究温州、跳出温州研究温州,努力打造温州建设高水平文化强市的重要窗口、具有全国影响力的地方学术研究的...
土拨鼠等动植物不得携带入境!关于国门生物安全,你要知道这些 - 天天要闻

土拨鼠等动植物不得携带入境!关于国门生物安全,你要知道这些

极目新闻记者 张秀娟通讯员 赵梦洁 黄晓彧 林敏“小朋友们,外来入侵物种包括哪些呢?”“在咱们出国旅游前,需注意哪些问题呢?”4月12日,在第十个全民国家安全教育日来临之际,武汉海关在武汉天河国际机场开展了一场别开生面的“海关开放日”活动。15名小学生化身“国门小卫士”,零距离体验、参与海关全民国家安全教育...
月球上跳一跳,轻松打破跳高世界纪录!这个展会,解密引力奥秘 - 天天要闻

月球上跳一跳,轻松打破跳高世界纪录!这个展会,解密引力奥秘

顶端新闻记者 杨逍 文 时硕 图如果你向往星辰宇宙,那你是否幻想过在其他星球上跳跃?在本次国防展的“星球重力”互动体验机前,你每次的纵身一跃,都会化身成屏幕中身穿宇航员服的小人,来到月球、金星、火星、火卫二、土卫一等星体上,屏幕的上方记录着你的跳跃高度。在月球,你轻轻一跃就能达到3米高度,轻松打破2.45米...
4月13日石家庄强风显著增强的原因 - 天天要闻

4月13日石家庄强风显著增强的原因

4月13日石家庄强风显著增强的原因,是多重气象条件和地理因素共同作用的结果。根据气象监测和专家分析,此次强风具有以下关键成因:一、极端天气系统的叠加效应1.
神十九乘组“太空出差”倒计时:各项空间科学实(试)验稳步推进 - 天天要闻

神十九乘组“太空出差”倒计时:各项空间科学实(试)验稳步推进

IT之家 4 月 13 日消息,据央视网报道,神舟十九号航天员乘组的“太空出差”之旅即将进入倒计时。上周,神十九乘组稳步推进各项空间科学实(试)验,在开展站内环境监测、设备检查维护等工作同时,积极开展健康维护。神十九乘组利用脑电设备开展了多项实验的测试工作,地面科研人员将利用获取的数据探究重力对视觉运动信息...
感受活力丨机器人正在进化中……这样的“生活搭子”,你喜欢吗? - 天天要闻

感受活力丨机器人正在进化中……这样的“生活搭子”,你喜欢吗?

模仿人类奔跑、跳跃、空翻,像人一样说话、思考甚至察言观色。这不是科幻电影对未来的虚构,而是2025中国机器人产业阔步向前的现实。小时候的你,是不是也曾畅想过:家里有一个机器人,能买菜、做饭、铺床、扫地,帮你干农活,还可以照顾家里老人……时至今日,这些“天马行空”的想象,正在变成现实。“12点了,您该吃药了...