AI算法可以预测下一次疫情大流行吗?

2022年11月01日18:52:15 科学 1829

2021年2月,据报告,7名俄罗斯家禽养殖场工人感染了H5N8禽流感。这种禽流感亚型以前从未感染过人类,病毒的基因序列很快上传到基因数据存储库GISAID。

AI算法可以预测下一次疫情大流行吗? - 天天要闻

对于华盛顿特区乔治城大学的生物学家科林·卡尔森(Colin Carlson)来说,这提供了一个机会。“我立刻想到,'我想通过FluLeap运行它',”他说。

FluLeap是一种机器学习算法,它使用序列数据将流感病毒分类为禽流感病毒或人类病毒。该模型已经在大量的流感基因组上进行了训练 , 以了解感染人类和感染鸟类的基因组之间的差异。

但是该模型从未见过被归类为人类的H5N8病毒,卡尔森很好奇它对这种新亚型的影响。

AI算法可以预测下一次疫情大流行吗? - 天天要闻

有点令人惊讶的是,该模型以99.7%的置信度将其识别为人类。该模型不是简单地在其训练数据中重申模式,例如H5N8病毒通常不会感染人的事实,而是似乎推断出与人类相容性的一些生物学特征。

“令人惊讶的是,这个模型奏效了,”卡尔森说。“但这是一个数据点;如果我能再做一千次,那就更令人惊叹了。

病毒从野生动物传播到人类的人畜共患过程导致了大多数流行病。随着气候变化和人类对动物栖息地的侵占增加了这些事件的频率,了解人畜共患病对于预防流行病的努力至关重要,或者至少对于做好更好的准备至关重要。

AI算法可以预测下一次疫情大流行吗? - 天天要闻

研究人员估计,地球上约有1%的哺乳动物病毒已被鉴定出来。因此一些科学家试图通过对野生动物进行采样来扩展我们对这种全球病毒组的了解。

这是一项艰巨的任务,但在过去十年左右的时间里,出现了一门新学科——研究人员使用统计模型和机器学习来预测疾病出现的各个方面,例如全球热点、可能的动物宿主或特定病毒感染人类的能力。

这种“人畜共患风险预测”技术的倡导者认为,它将使我们能够更好地将监测目标定位到正确的区域和情况,并指导最有可能需要的疫苗和治疗方法的开发。

AI算法可以预测下一次疫情大流行吗? - 天天要闻

然而,一些研究人员对预测技术应对病毒组的规模和不断变化的性质的能力持怀疑态度。改进模型及其所依赖的数据的努力正在进行中,但如果这些工具要减轻未来的流行病,它们将需要成为更广泛努力的一部分。

病毒搜寻

一些研究人员长期以来一直认为,扩大我们对病毒多样性的了解将有助于管理大流行威胁。PREDICT是一个由美国国际开发署USAID)资助的2亿美元项目,花了大约十年的时间寻找动物病毒。截至2020年底,它在34个国家的野生动物、牲畜和人的样本中发现了949种新病毒。

事后看来,PREDICT的一些发现似乎很有先见之明。2017年的一项研究估计,蝙蝠中有数千种未被发现的冠状病毒,并预测东南亚将是SARS-CoV-2所属家族中病毒数量最多的家园。它还将涉及高水平的人与野生动物接触的活动与冠状病毒的流行率联系起来。

AI算法可以预测下一次疫情大流行吗? - 天天要闻

2017年的另一项研究收集有关哪些病毒感染哪些哺乳动物的数据,创建病毒-宿主关联的数据库。“目标是了解哪些病毒能够感染人类,我们最常从哪些动物那里感染新病毒以及驱动这些模式的潜在因素,”纽约市生态健康联盟的生态学家和研究负责人Kevin Olival说,这是一个专注于生物监测和保护的非营利机构。

研究小组的分析表明,特定宿主物种中可以感染人类的病毒比例受到人类与该物种的密切关系以及影响人类与野生动物接触的因素的影响,例如人口密度和该物种地理范围内的城市化程度。

该团队使用统计模型来预测可能携带大量未被发现病毒的动物群体和地区 - 蝙蝠以及啮齿动物和灵长类动物在南美,非洲和东南亚等地区占有突出地位。研究人员还发现与病毒相关的特征是人畜共患的,例如它可以感染的物种范围。

AI算法可以预测下一次疫情大流行吗? - 天天要闻

该团队表示,这些信息可以帮助指导监视工作。“它使我们能够预测风险最大的地区,”加州大学戴维斯分校流行病学家Jonna Mazet说,他指导了PREDICT。

识别具体威胁还使当地研究人员和卫生保健工作者能够调整缓解和应对能力。“它允许社区说'我们有这个,这个和这个,我们可以通过这种方式降低风险',”Mazet说。

PREDICT只是一个试点项目。“它生成了大量数据,但这只是杯水车薪,”Olival说。“我们需要更大的东西。”因此,研究人员于2016年提出了全球病毒项目(GVP),该项目被视为政府机构,非政府组织和研究人员的全球伙伴关系,旨在发现哺乳动物和鸟类(大多数人畜共患病毒起源)中的大多数病毒。

AI算法可以预测下一次疫情大流行吗? - 天天要闻

然而,面对一些研究人员的批评,它从未获得资助。Mazet说,它今天作为一个非营利组织存在,旨在为各国提供开展自己的病毒调查所需的知识。美国国际开发署于 2021 年 10 月启动了一个规模较小、成本低得多的项目,名为“发现和探索新兴病原体——病毒性人畜共患病 (DEEP VZ)。

对GVP的一个批评是,任务的规模根本无法管理。预测研究人员估计4哺乳动物和鸟类中有167万种未知病毒,尽管这个数字存在争议,但毫无疑问,病毒组是巨大的。

它也在不断变化,因此一次性的发现工作是不够的。“RNA病毒以很高的速度进化,”澳大利亚悉尼大学的病毒学家爱德华·霍姆斯说。“所以你必须继续这样做。”

也有人怀疑该项目是否会发现潜在的流行病。“在理解病毒进化和生态学方面,我对它没有问题,”福尔摩斯说。“但作为了解接下来会发生什么的预测工具,它是不可能的。

AI算法可以预测下一次疫情大流行吗? - 天天要闻

一个问题是,一些宿主物种和病毒家族已经得到了深入研究,但其他物种和病毒家族几乎没有被触及。现有数据也偏向于已经溢出的病毒。因此,到目前为止,大多数预测都是基于“完全有偏见的数据”,新西兰奥塔哥大学的病毒学家Jemma Geoghegan说。

此外,即使发现了病毒并对其基因组进行了测序,许多可能影响其引发大流行潜力的因素,例如其感染人类和在人与人之间传播的能力,仍然不清楚。“然后你必须做所有这些实验,这将需要数年时间,花费一大笔钱,”福尔摩斯说。

AI算法可以预测下一次疫情大流行吗? - 天天要闻

这就是机器学习可能提供捷径的地方。与其试图完全表征每种新病毒,不如使用模型来标记高优先级目标以进行进一步调查。“我们需要的是下游的分类系统,这样我们就知道哪些病毒需要通过深入的病毒学研究来表征,”科罗拉多大学博尔德分校的病毒学家Sara Sawyer说。

模型内部

当一种病毒被发现时,除了它的基因序列之外,通常对它知之甚少。因此,仅使用病毒基因组对病毒进行分类的模型将特别有用。英国格拉斯哥大学的计算病毒学家Nardus Mollentze和他的同事开发了一个这样的模型,该模型部分通过使用病毒与人类基因组部分遗传相似性的测量来评估病毒。

病毒的进化压力可能导致与宿主基因组中的基因片段相似 - 逃避先天免疫系统或帮助复制。当在包含861种已知病毒的病毒库上进行测试时,该算法可以将它们分类为人畜共患病毒或非人畜共患病毒,准确率为70%。

AI算法可以预测下一次疫情大流行吗? - 天天要闻

此后,Mollentze加入了病毒出现研究计划(Verena),这是一个寻求开发和改进人畜共患预测模型的研究人员联盟。

Mollentze与Verena研究人员合作,将他的算法与利用哪些病毒感染哪些宿主的知识的技术相结合,包括推断未知宿主 - 病毒关联的方法。这种组合方法将绩效提高了大约 10 个百分点7.将来,可以纳入病毒如何在分子水平上与宿主相互作用的知识。

“这将是关于蛋白质生物化学的,”指导Verena的Carlson说。“这就是这个的未来。”

AI算法可以预测下一次疫情大流行吗? - 天天要闻

一个重要的目标是了解哪些模型运行良好,以及为什么。有些模型仅根据数据中的模式进行分类,有些模型可以推断这些模式的原因,但很难区分它们。“有一个问题:我们只是教机器重申他们已经知道的事情,还是在学习带入新空间的原则?”卡尔森说。

为了取得进展,验证模型的过程至关重要。例如,一些研究试图预测哪些物种宿主人畜共患病毒,结果好坏参半,但几乎没有系统比较,因此很难知道哪种方法有效。

为了解决这个问题,在2020年初,Verena研究人员使用预测哪些蝙蝠物种可能携带β冠状病毒作为案例研究。他们创建了八个统计模型,并使用它们生成可疑主机列表。在接下来的16个月里,发现了47个新的蝙蝠宿主。

AI算法可以预测下一次疫情大流行吗? - 天天要闻

当研究人员将这些与他们的预测进行比较时,他们发现一半的模型表现明显优于偶然性。这些模型包括物种的寿命或大小等特征。其他四个模型没有考虑到这些功能,表现不佳。

数据开发

任何人工智能(AI)算法都从根本上受到其输入数据的限制。“当算法在大量质量数据上进行训练时,人工智能就会起作用,”索耶说。“但每年只发生少量溢出效应,病毒数据往往很脏,有很多信息缺失。大多数研究人员都认为目前的数据不足。“我们没有足够的高质量数据来做好预测工作,”Mazet说。

在某种程度上,建模依赖于科学家收集新数据,但到目前为止,病毒发现工作都是出于诸如最高风险地点和情况等考虑因素。Carlson说,建模者真正需要的是旨在提高地理和分类覆盖率的抽样。

AI算法可以预测下一次疫情大流行吗? - 天天要闻

为模型提供更多此类数据会改变可以提出的问题的视野。“有了一百万个数据点,你可以展示森林砍伐如何增加蝙蝠的病毒流行率,”卡尔森说。“有了一万亿个点,你可以像天气一样预测溢出效应。

要接近这一点,需要全球合作,以开放数据共享为规范,每个人都遵守数据标准。这方面的障碍更多的是政治、文化和伦理,而不是科学。例如,围绕出版物的学术激励是快速数据共享的障碍。保证共享遗传数据的国家从中受益也至关重要。

“这是关键问题,处理它涉及建立信任,”奥利瓦尔说。“确保你不仅要用疫苗,还要通过培训、能力建设和论文合著来回馈社会。”

2014年生效的国际条约名古屋议定书》规定了各国对包括生物样本在内的自然资源的主权,并允许它们要求签订惠益分享协议以换取获取此类样本。

AI算法可以预测下一次疫情大流行吗? - 天天要闻

然而,一些实验室现在可以合成病原体或开始仅使用基因测序数据开发疫苗。“我们在国际法中没有任何涉及序列数据的规定,”卡尔森说。“名古屋不是为那个世界而生的。

”类似的问题有一天可能适用于人畜共患的风险预测。“我们正在使用全球南方研究人员收集的数据,”卡尔森说。“关于获取这些数据并制定技术意味着什么,存在合理的问题。

预测和准备

为了使建模产生实际影响,它必须导致可公开访问的工具,提供可操作的、与当地相关的信息。建模还需要更好地与实验工作相结合,以询问病原体的特征。

正如模型可能会标记候选病毒以供进一步研究一样,这些调查也可能产生可用于验证和优化模型的信息。然而,跨学科交流目前受到限制。“这些社区不怎么交谈,甚至不怎么阅读彼此的论文,”索耶说。

AI算法可以预测下一次疫情大流行吗? - 天天要闻

建模者还需要清楚地传达他们工作中固有的不确定性,以及他们所说的预测的含义,这样他们就不会过度夸大收益。“没有人说我们将拥有将导致下一次大流行的确切时间、地点和物种,”奥利瓦尔说。研究人员正在处理概率,意想不到的事情可能而且确实会发生。

即使在最好的情况下,预测工具也无法完全防止疫情爆发。“我绝对不认为我们应该将世界安全与这些模式挂钩,”卡尔森说。

但是,随着全球监测系统的改善、有针对性的疫苗开发以及在全球范围内建立卫生保健能力的努力,它们的价值是显而易见的。“他们让我们做两件事:了解我们周围发生的事情并确定优先级,”卡尔森说。最终,这可能有助于减少流行病的频率。“我们可以更好地预防其中的一些,”卡尔森说。“但这需要我们在我们正在做的事情上做得更好。

AI算法可以预测下一次疫情大流行吗? - 天天要闻

参考文献

1.Carlson, C. J. et al. Phil. Trans. R. Soc. Lond. B 376, 20200358 (2021).

2.Anthony, S. J. et al. Virus Evol. 3, vex012 (2017).

3.Olival, K. et al. Nature 546, 646–650 (2017).

4.Carroll, D. et al. Science 359, 872–874 (2018).

5.Wille, M., Geoghegan, J. L. & Holmes, E. C. PLoS Biol. 19, e3001135 (2021).

6.Mollentze, N., Babayan, S. A. & Streicker, D. G. PLoS Biol. 19, e3001390 (2021).

7.Poisot, T. et al. Preprint at https://arxiv.org/abs/2105.14973 (2022).

8.Becker, D. J. Lancet Microbe 3, E625–E637 (2022).

科学分类资讯推荐

非洲地下的深层地球脉冲正在撕裂非洲大陆 - 天天要闻

非洲地下的深层地球脉冲正在撕裂非洲大陆

地幔的垂直运动是导致地球表面发生大规模地质变化的驱动力之一。这些地幔上升流,有时被称为地幔柱,被认为在一些重大的地质转变(例如大陆漂移)中发挥着作用。目前,在非洲大陆地下发现了一种类似、微妙却意义重大的现象。
科学家首次目睹海底“慢滑”地震 - 天天要闻

科学家首次目睹海底“慢滑”地震

科学家首次直接观察到在主要水下断层带释放构造应力过程中发生的慢滑地震。此次渐进式地震事件在穿过日本海岸附近易引发海啸的断层段时被追踪,该断层段似乎起到了天然的缓冲作用,吸收了压力。德克萨斯大学奥斯汀分校的研究人员将这一现象比作一条断层线沿着
“倪四道院士预测广东将有8级地震”系谣言 - 天天要闻

“倪四道院士预测广东将有8级地震”系谣言

近日,一张“院士预测广东将发生8级以上大地震”的截图在网络上流传。截图显示,名称为“倪四道”的用户称,团队预测8个月内,将会在一经纬度位置(位于广东)出现八级以上地震。
“鸟中大熊猫”现身桂林! - 天天要闻

“鸟中大熊猫”现身桂林!

【来源:广西台新闻910】近期,阳朔县林业局工作人员通过桂林漓江站了解到,在海洋山自治区级自然保护区安装的监测系统,发现了国家一级保护动物白颈长尾雉的身影。白颈长尾雉不仅是国家一级重点保护野生动物,还是中国特有珍稀鸟类,被称为鸟类中的“大熊
世界第一头人工繁育长江江豚迎20岁生日 - 天天要闻

世界第一头人工繁育长江江豚迎20岁生日

长江日报大武汉客户端7月5日讯“淘淘”20 岁啦!7月5日,世界第一头人工环境下出生的长江江豚“淘淘”迎来20岁生日。从“淘淘”出生到家族发展至5头,在一代代科研人员努力下,长江江豚人工繁育保种,为这一濒危物种的未来带来希望。
飞机不死,它只是坠落 - 天天要闻

飞机不死,它只是坠落

献给003号坠机的白玫瑰,2024年11月16日。南方周末记者 王华震 摄山里的纪念仪式简简单单,从山下带上来的一束白玫瑰,分给王健、杨立群和其他队员,在曾经因飞机坠落而形成的巨坑前,他们手持玫瑰,默哀。玫瑰洁白,山林翠绿,经过80年的自然修复,那个“巨坑”已经宛如平地,难以辨认。巨坑近旁,山势陡然下陷,形成一道...
历史上从无记载!2006年平利首次出现,被抓8小时后放生 - 天天要闻

历史上从无记载!2006年平利首次出现,被抓8小时后放生

各位看官老爷,麻烦右上角点击一下“关注”,精彩内容不错过,方便随时查看。文|万象硬核编辑|万象硬核«——【·前言·】——»2006年6月15日,安康市人民政府发布消息,有人在平利县的交通局家属院中发现了一只不明身份的野生动物。
流言|注射端粒酶基因可逆转衰老,永葆青春? - 天天要闻

流言|注射端粒酶基因可逆转衰老,永葆青春?

流言:注射端粒酶基因可逆转衰老,永葆青春。真相:这种说法没有科学依据。端粒是染色体末端的“保护帽”,每次细胞分裂时它都会缩短,当端粒变得过短时,细胞会进入衰老或凋亡状态。端粒酶是一种可以延长端粒的酶,它在某些细胞(如干细胞、癌细胞)中活性较