机器学习模型量化COVID-19传播的隔离措施

麻省理工学院的研究人员开发的一种机器学习算法将COVID-19传播的数据与神经网络结合起来,以评估隔离措施的影响,并预测每个国家的感染速度何时会放缓。

通过玛丽·贝思·加拉格尔 2020年4月17日

过去几周的每一天,报纸和有线电视新闻上都充斥着预测COVID-19感染高峰的图表。这些模型中的许多都是使用以前SARS或中东呼吸综合征等疫情的研究数据构建的。麻省理工学院的一个工程师团队开发了一个模型,将COVID-19大流行的数据与神经网络结合使用,以确定隔离措施的有效性,并更好地预测病毒的传播。

“我们的模型是第一个使用冠状病毒本身的数据,并集成了两个领域:机器学习和标准流行病学,”研究土木与环境工程的博士候选人拉吉·丹德卡尔说。在过去的几个月里,丹德卡尔和机械工程教授乔治·巴巴斯塔斯一起开发了这个模型,这是2.168课“学习机器”的期末项目的一部分。

大多数用于预测疾病传播的模型都遵循所谓的SEIR模型,该模型将人群分为“易感人群”、“暴露人群”、“感染人群”和“康复人群”。Dandekar和Barbastathis通过训练神经网络来捕捉被隔离的感染者的数量,从而增强了SEIR模型,从而不再将感染传播给其他人。

该模型发现,在韩国等政府立即干预实施强隔离措施的地方,病毒的传播速度更快。在意大利和美国等实施政府干预较慢的地方,COVID-19的“有效繁殖数”仍大于1,这意味着病毒继续呈指数级传播。

机器学习算法显示,在目前的隔离措施到位的情况下,意大利和美国的疫情高峰将在4月15日之间的某个时候到来th4月20日th.这一预测与卫生计量与评估研究所等其他预测相似。

Barbastathis说:“我们的模型表明,隔离限制成功地将有效繁殖数量从大于1降到小于1。”“这相当于我们可以把曲线变平,开始看到更少的感染。”

量化隔离的影响

2月初,当病毒令人不安的感染率开始占据头条新闻时,芭芭丝塔西斯向2.168班的学生们提出了一个名为“学习机器”的项目。在每个学期结束时,学生的任务是为现实世界中的一个问题开发一个物理模型,并开发一个机器学习算法来解决它。他建议由一组学生绘制当时被简称为“冠状病毒”的传播地图。

巴巴斯塔西斯说:“学生们抓住了研究冠状病毒的机会,立即想以麻省理工学院的典型方式解决一个热门问题。”

丹德卡尔就是其中一名学生。他说:“这个项目真的让我很感兴趣,因为我可以把科学机器学习这个新领域应用到一个非常紧迫的问题上。”

随着COVID-19开始在全球蔓延,该项目的范围扩大了。最初,这个项目只研究中国武汉的传播情况,后来发展到意大利、韩国和美国的传播情况

在第500个病例被记录后,两人开始模拟病毒在这四个地区的传播。这一里程碑标志着各国政府如何执行隔离令的清晰划分。

研究小组掌握了来自这些国家的精确数据,采用了标准的SEIR模型,并通过神经网络对其进行了增强,该神经网络可以了解隔离下的感染者如何影响感染率。他们通过500次迭代训练神经网络,这样它就可以自学如何预测感染传播的模式。

利用这一模型,研究小组能够在隔离措施与病毒有效繁殖数量减少之间得出直接关联。

丹德卡尔说:“神经网络正在学习我们所说的‘检疫控制强度函数’。”在迅速采取强硬措施的韩国,检疫控制力量功能有效地减少了新感染人数。在美国,从3月中旬开始慢慢推出隔离措施,要阻止病毒的传播更加困难。

预测“平稳期”

随着特定国家病例数量的减少,预测模型从指数模式转变为线性模式。意大利在4月初开始进入这一线性制度,美国紧随其后。

丹德卡尔和巴巴斯塔西斯开发的机器学习算法预测,美国将在4月的第一周开始从指数模式转向线性模式,感染病例数可能在4月15日之间停滞不前th4月20日th.它还表明,在感染率开始停滞之前,美国的感染人数将达到60万人。

“这是一个非常关键的时刻。如果我们放松隔离措施,可能会导致灾难。”

巴巴斯塔西斯表示,人们只需看看新加坡,就能看到过快放松隔离措施可能带来的危险。虽然该团队在研究中没有研究新加坡的COVID-19病例,但该国目前正在经历的第二波感染反映了他们的模型关于隔离措施和感染率之间相关性的发现。

巴巴斯塔西斯说:“如果美国过早地采取同样的政策,放松隔离措施,我们预测后果将更加灾难性。”

该团队计划与其他研究人员分享该模型,希望它可以帮助制定COVID-19隔离策略,从而成功减缓感染率。

麻省理工学院

www.mit.edu

-副主编克里斯·瓦夫拉编辑,控制工程、CFE媒体与技术,cvavra@cfemedia.com.查看更多冠状病毒和COVID-19报道


作者简介:玛丽·贝思·加拉格尔,麻省理工学院机械工程系