DeepMind大模型再登Nature:8分钟预测15日天气,超顶尖物理模型

2024年12月05日15:14:03 科学 1942

克雷西 发自 凹非寺

量子位 | 公众号 QbitAI

DeepMind大模型再登上Nature——

气象预测大模型GenCast,8分钟内完成15天的预测,而且不管常规还是极端天气都能分析。

在97.2%的场景中,GenCast的表现都超过了全球顶尖的中期天气预报系统ENS。

DeepMind大模型再登Nature:8分钟预测15日天气,超顶尖物理模型 - 天天要闻

不同于DeepMind之前推出的GraphCast的确定性预测,GenCast关注的是各种天气情况的概率。

和GraphCast一样,GenCast也已经开源

它基于扩散模型实现,分辨率为0.25度经度/纬度(在赤道处约为28×28公里),相当于将地球表面分割成了超过100万个网格。

每个网格都涵盖80多个地表和大气变量,相当于每次预测都有数千万甚至上亿条数据生成。

测试结果表明,在1320种实验条件中,GenCast在97.2%的任务中,都比ENS更准确

DeepMind大模型再登Nature:8分钟预测15日天气,超顶尖物理模型 - 天天要闻

对于GenCast的表现,论文作者、DeepMind研究人员Ilan Price表示:

我们确实取得了巨大的进步,通过机器学习赶上了并超越了基于物理的模型。

准确率超最强传统方法

传统天气预报基于数值天气预报(NWP)算法实现,核心是对模拟大气动力学方程求近似解。

不过,相比于单一确定性的预测,气象机构越来越依赖集合预报,生成多个基于NWP的结果,对各种可能的情景进行建模。

GenCast做的也是集合式预报,当然基于的原理不是NWP而是AI。

DeepMind大模型再登Nature:8分钟预测15日天气,超顶尖物理模型 - 天天要闻

开头提到的ENS,就是目前最先进的集合预报系统,来自欧洲欧洲中期天气预报中心ECMWF,未来将被纳入其确定性预报系统HRES。

但即便是这种最强的传统方式,也无法战胜AI系统。

在常规预报当中,DeepMind团队利用训练数据中未涵盖的真实历史(2019年)数据,设置了1320种实验条件,涉及不同的物理变量、预报时长和垂直高度。

结果在97.2%的场景当中,GenCast的CRPS都显著优于ENS,如果只看对36小时之后的预测,GenCast在99.6%的条件下都能胜出。

(CRPS衡量了预报与观测值之间累积概率分布的差异,数值越小说明预报越准确)

DeepMind大模型再登Nature:8分钟预测15日天气,超顶尖物理模型 - 天天要闻

对于高温、大风等极端天气事件(实验中按发生概率分为1%/0.1%/0.01%三档),除了在个别场景下,GenCast的预报的相对经济价值(REV)显著优于ENS。

(2t代表距离海平面2米高处温度,10wind_speed代表10米处风速,msl代表平均海平面气压,蓝线代表GenCast)

DeepMind大模型再登Nature:8分钟预测15日天气,超顶尖物理模型 - 天天要闻

除了基础的预测,在下游应用上GenCast也表现出了更强的预测能力。

DeepMind团队测试了一款区域风电应用,使用全球发电厂数据库中的5344个风电场位置和装机容量信息,通过插值获得各风电场位置的10米风速预报,并通过功率曲线转换为风电功率。

在120公里、240公里、480公里三个空间聚合尺度上,GenCast的风电功率预报CRPS和REV在7天内都显著优于ENS。

DeepMind大模型再登Nature:8分钟预测15日天气,超顶尖物理模型 - 天天要闻

不仅精准性强,GenCast的预测速度也很快,完成一次15天的预测仅需约8分钟,而ENS需要几个小时。

用扩散模型预测天气

不同于DeepMind去年在Science上发表的GraphCast(基于图神经网络GNN),GenCast基于扩散模型实现

它以最近的X(t)和前一步天气状态X(t-1)的残差Z(t)为采样条件,经过去噪后得到预测结果,然后利用预测结果计算新的残差作为新的输入依据,将预测向更长时间延伸。

DeepMind大模型再登Nature:8分钟预测15日天气,超顶尖物理模型 - 天天要闻

而具体的去噪过程,DeepMind又选择了交给Transformer来完成。

Transformer编码器首先将物理状态场从经纬度网格表征映射到一个六次细化的二十面体网格上。

然后,在Transformer的自注意力机制中,网格上的每个节点都会关注其周围32跳邻域内的所有节点,从而有效捕捉局部和中等尺度的天气特征。

最后,解码器将结果映射回原始分辨率,得到去噪后的结果。

GenCast从公开的ERA5再分析数据集中,选取了1979至2018这40年的数据(间隔12小时,分辨率0.25°)对GenCast进行了训练。

为了提高预训练效率,数据首先被降采样到1°分辨率,使用5次细化的二十面体网格进行学习。

这个阶段需要200万步,在32个TPUv5实例上运行约3.5天。

完成预训练后,再用原始的0.25度分辨率数据和6次细化的二十面体网格,对模型进行高精度微调,共计64000步,需要约1.5天完成。

目前,像去年发布的确定性预测模型GraphCast一样,GenCast也已经开源,代码和模型权重均已发布。

DeepMind还表示,将会很快发布GenCast(和以前的模型)生成的实时和历史预报结果,为其他研究者提供更多的研究资源。

论文地址:
https://www.nature.com/articles/s41586-024-08252-9

参考链接:
[1]https://deepmind.google/discover/blog/gencast-predicts-weather-and-the-risks-of-extreme-conditions-with-sota-accuracy/

[2]https://www.nature.com/articles/d41586-024-03957-3

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

科学分类资讯推荐

在鸟儿的世界里,春天似乎更长一些 - 天天要闻

在鸟儿的世界里,春天似乎更长一些

北京的春天很短。这或许是在北京生活的人的共识。北京所在的地理位置相对靠北,立春时节,天气还异常寒冷,可以说丝毫感觉不到春天的气息。判定入春,在气温上倒是有一个科学的标准。依据《气候季节划分》,北京的入春时间通常在每年3月中下旬。此时,北京城内已是春暖花开,公园里的山桃、樱花、玉兰等争相开放,其他的植...
集成创新与原始创新 - 天天要闻

集成创新与原始创新

重读报告文学《赫赫而无名的人生》,心中的一个困惑得到解答。老一辈科学家靠什么方法,用不到一代人的时间就实现了“核潜艇,一万年也要搞出来”的誓言?文中记载,黄旭华有一个观点近乎口头禅:“在现代,尖端通常不过是常规的组合……综合就是创造。
天文学家警告:地球或遭“鸟翼”状太阳喷发冲击 - 天天要闻

天文学家警告:地球或遭“鸟翼”状太阳喷发冲击

周二,天文学家观测到太阳北半球出现巨大的“鸟翅膀”状喷发,过热等离子体波汹涌翻腾。 这股太阳物质细丝长度超过100万公里,是地球到月球距离的两倍还多。如今,科学家预测,此次细丝喷发的一部分....
潮声丨从化石到生命的“逆向”探索 1万年前灭绝的恐狼“复活” - 天天要闻

潮声丨从化石到生命的“逆向”探索 1万年前灭绝的恐狼“复活”

潮新闻客户端 执笔 谢丹颖 张苗恐狼是啥?如果你看过前些年大热的美剧《权力的游戏》,应该对冰原狼有印象吧?冰原狼的原型,正是恐狼,已在地球上消失万年之久。如今,它们“复活”了?恐狼曾在热门美剧《权力的游戏》中以斯塔克家族的伴侣而闻名,但它实
新毒株来袭了?专家提醒:囤药不如保护自己 - 天天要闻

新毒株来袭了?专家提醒:囤药不如保护自己

新冠病毒又来了?我们要做什么准备?近期,随着气温变化和人群流动增加,全球多地出现新冠病毒感染人数上升的趋势。根据最新数据显示,新冠新毒株正在突袭美国。自2023年10月以来,多国报告了新型变异株的传播,其中XBB.1.5和BA.2.86等亚
五亿年前三眼海怪现世:26节身躯改写进化认知 - 天天要闻

五亿年前三眼海怪现世:26节身躯改写进化认知

近日,加拿大考古团队在寒武纪岩层中发现了一具保存完好的古生物化石,这种被命名为”莫斯拉·芬托尼”的海洋生物不仅长有三只眼睛,其多达26节的躯体结构更颠覆了科学界对生物体节演化时间的认知。这项发现为研究现代节肢动物起源提供了关键线索,也重新定义了人类对五亿年前海洋生态系统的理解。2025年5月,由让-伯纳德·...
百万公里“鸟翼”太阳爆发,24小时内或冲击地球,地磁暴与极光预警 - 天天要闻

百万公里“鸟翼”太阳爆发,24小时内或冲击地球,地磁暴与极光预警

5月15日,天文学家观测到一场罕见的巨型太阳活动——一片跨度超96万公里的炽热等离子体带从太阳北半球喷发,形成壮观的“鸟翼”状结构。这场爆发可能在未来24小时内对地球产生轻微冲击,或引发地磁扰动及极光现象。根据美国宇航局(NASA)卫星记录,此次喷发的等离子体带长度达96万公里,是地月平均距离(约38.4万公里)的...
PEEK行业交流0515 - 天天要闻

PEEK行业交流0515

Q&AQ:当前 PEEK 材料的价格是否也是阻碍其在机器人领域大规模应用的原因之一?未来从成本角度来看,是否会有一些变化?各企业是否有大幅降低成本的可能性?A:PEEK 材料大幅降价的可能性不大。