曹然:新冠疫情中的“模型谜团”:距精准预判还有多远?
字号

在有关新冠病毒的科学、政策和公众讨论中,流行病学模型是穿梭其中的幽灵。政府依据模型制定防疫政策,预判疫情走向;学者们通过模型分析病毒的传播能力,评估防疫体系的得失;社会舆论常被模型指向的庞大感染和死亡数据震惊,又在不同模型得出的不同结论前不知所措。

2020年4月,联合国非洲经济委员会在报告中援引英国帝国理工学院的模型称,非洲最多可能有300万人死于新冠病毒,一百多位非洲知识分子随后联署呼吁更有效的防疫政策。

事实上,英国帝国理工模型预设的是非洲没有采取有效社交隔离等防疫措施情况下的疫情走势,其估算的死亡数据最高值是300万,最低值则是30万。但在数据发布时,非洲已有二十多个国家实施了全国性的封锁隔离措施。

“采取了积极的防疫措施后,结果其实会很不一样。”南非金山大学医学院公卫专家莎拉·尼沃德对《中国新闻周刊》表示。伦敦卫生和热带病医学院当月中旬发布的另一个模型指出,非洲国家的积极防疫措施最多可以将死亡率降低75%。

对于流行病学、生物统计等领域的专业人士而言,模型数据背后的研究目的、建模方式、参数设定及完整结论要比看上去让人震惊的单个数字更值得关注。但政府和公众对于这些模型的数据却时而过度轻信,时而又弃之如敝履。

一直追踪非洲防疫的尼沃德说,现在她已经不再关注任何模型数据了。哈佛大学流行病学助理教授约纳塔·格拉德则对《中国新闻周刊》强调:“我们要一直记住一点,模型从来不是像天气预报那样用来准确预测疫情的,它的价值在于提供决策参考。”

哪种模型更有效?

新冠疫情在武汉蔓延之初,那不勒斯腓特烈二世大学数学教授西亚图斯等一批欧洲学者就开始通过流行病学模型着手研究这个全新的传染病,并在SCI期刊发表了多篇同行评议论文。对他们来说,这只是日常的科研工作,就像之前建立关于埃博拉疫情和MERS疫情的流行病学模型一样。

得益于流行病学模型最近一百余年的发展,在新冠病毒刚出现且人们对其生物学特征一无所知时,相关的流行病学模型就可以建立了。这是因为流行病的自然史密码已经被破解,即健康的人(易感人群)感染病毒,出现临床症状,最终康复或死亡的过程。

健康、感染、康复人群的此消彼长,决定着病毒周期性的流行和消退。基于这一规律,“在疫情发生之初建立的模型,虽然在数据预测上难以准确,但却能提供可靠的趋势性分析。”西亚图斯对《中国新闻周刊》说。

西亚图斯采用的是最经典的SIR系列模型。这种模型将人群分为易感人群S、感染者I和康复者R,将对病毒传播能力和防疫政策的假设体现于人群从一个组别向另一个组别转移的数学规则中,从而计算病毒的感染率和峰值区间。目前,在与美国疾病控制与预防中心(CDC)合作监测新冠疫情的12个模型中,5个都采用了SIR系列模型。

“SIR系列模型比较简单,被证明能够在短期内充分模拟病毒在一般人群中的流行动态。”西亚图斯介绍,相比于其他类型的模型,这类模型最大的优势是基本变量只有三到四个,“需要校准的参数数量最少,这一点,在数据不多的疫情第一阶段非常重要。”

西亚图斯提到的其他模型主要是统计学模型。其中,曾被白宫援引的西雅图华盛顿大学卫生计量和评估研究所(IHME)的模型最为有名,也最受争议。该团队研究了新冠病毒在世界各地暴发的数据,以世界各地的既有数据和美国人口、疾病传播及防疫政策的假设为基础,推断美国及各州疫情可能的曲线。

IHME认为,这样的统计学模型更为准确,因为它“主要依赖于真实世界的数据,而不是关于疾病如何传播的假设”。SIR模型的使用者确实因对新冠病毒特性的假设而做出过误判。被英国政府援引“60%的人可能感染”的帝国理工学院模型,就将新冠病毒放进了一个为流感设计的SIR模型中。

美国疫情在4月进入暴发期后,IHME对各州峰值和病床压力的预估也多次出现失误。IHME团队承认难以预估“模型的不确定性”,且这种不确定性时而是高估,时而是低估。

一些专家指出,这与统计学模型对“真实数据”的依赖有关。疫情暴发之初,各大模型的数据主要来自中国,但当时中国的数据并未统计无症状感染者,因此关于确诊病例数和其他数据的比例不一定能反映病毒的真实传播能力。

“新冠病毒流行初期,感染、死亡等数据常常受到检测不足、检测不一致、报告延误、记录不全等因素的限制。”伦敦卫生和热带病医学院医疗数据专家尼古拉斯·朱厄尔在一篇分析新冠模型得失的论文指出。相比于有自己的逻辑、基础变量较少的流行病学模型,统计学模型受前期数据不足的影响更为严重。

2020年5月4日,在进行了大规模修正后,IHME模型重新上线。新模型采用了混合模式,结合了统计建模方法和疾病传播方法,利用两类模型的优势,将疾病传播模型的结果与统计模型的结果进行对照。

在IHME调整其统计学模型的同时,SIR模型的建模者之间也出现了争论。因为最基础的SIR模型仅设有易感人群、感染者和康复者三个基本变量,难以反映新冠病毒潜伏期的传播,也拙于应付学者对病死率的关切,有学者提出加入处于潜伏期的暴露者E,采用SEIR模型。西亚图斯等学者则将病亡者D作为基本变量,发展出SIRD模型。对此,朱厄尔评论称,增加一些从流行病学角度观察到的、反映传染病传播特点的基本变量,有助于更好地分析新冠疫情。

不过,《自然》杂志子刊《自然医学》4月22日刊登的意大利特伦托大学教授朱利亚·乔亚努团队的论文,却将SIR模型的复杂化推向了高峰。该论文基于新冠病毒前期研究的成果,将代表病毒传播不同阶段的八种人群全部列为基本变量,建立SIDARTHE模型。这八个基本变量分别是易感人群(S)、无症状感染者(I)、无症状确诊者(D)、有症状感染者(A)、有症状确诊者(R)、重症者(T)和已治愈者(H)和病亡者(E)。

“SIDARTHE模型确实比其他模型更复杂、更全面,因为它的目标不仅仅是预测疫情走向。”乔亚努对《中国新闻周刊》解释称,这一模型的主要目的是为决策者提供一个有用的工具,有助于比较不同的防疫措施及它们的组合使用对疫情走向的不同影响。

但在很多学者看来,这却不是一个好的模型。西亚图斯对《中国新闻周刊》表示,过于复杂的模型会遭遇“维度诅咒”,即难以在一个模型中校准太多的参数。朱厄尔也指出,如果复杂的模型在运算中遗漏关键数据,那么它们可能比简单的模型更不可靠,“微小的错误将导致更大的灾难”。

朱厄尔还指出,“复杂的模型也会让人产生错觉,更难发现关键的疏漏。”

面对质疑,乔亚努对《中国新闻周刊》承认,过多的基本参数确实使得校准模型更具挑战性。但他认为,“一旦数据合适,复杂的模型可以提供更准确的趋势预测。”

在约翰·霍普金斯大学的流行病学家里弗斯看来,围绕流行病学模型的建模方式的争议,很大程度上缘于人们在疫情暴发之初并不知道怎样的流行病学或统计学模型可能是更有效的,也不知道应当如何改进SIR这样的经典模型。

最难假设的是人类行为

2020年4月,牛津大学教授古塔普团队用血清调查数据推翻了自己此前的模型结论。

3月24日,该团队曾以假设新冠病毒感染者中只有0.1%到1%的人需要入院治疗为前提,运用SIR模型分析英国和意大利两国的重症和死亡病例数。当时的模型还预测称,截至3月19日,英国可能有36%到68%的民众感染新冠病毒,而意大利到3月6日可能有60%到80%的民众感染。一个月后的血清调查结果则显示,英国和意大利的新冠病毒整体感染比例或都低于10%。

莎拉·尼沃德对《中国新闻周刊》说,古塔普团队出现的问题具有一定的典型性。“在急于发表预测结果的背景下,许多模型对关键数据的假设都缺乏严谨性。”和古塔普团队发布的论文一样,研究者们很少说明采取这些假设的原因。

模型本质上是一组数学公式,任何一个关键项的输入值稍有变化,就会得出非常不同的结果。而有关新冠病毒的模型,最初几乎所有数值都是不确定的。从病毒本身的生物学特征,到免疫等人类生物学特征,再到人群接触等社会运作方式,以及医疗体系的承载能力等,都存在很多变量。

“对病毒大流行的研究,其实是人类曾经尝试研究的一些最复杂和最混乱的东西的混合,从人类行为学,到病毒学,再到免疫学。”里弗斯由此感慨道,预测新冠疫情是一个巨大的挑战,即使是最聪明的头脑也不知道这一切将如何结束。

以帝国理工学院模型对英国疫情的估算为例,如果模型中的基本传染数值(R0)为2,社会疏离措施设置为最强,则疫情仅造成数千人死亡;假设R0值为2.6且没有社会疏离措施,则疫情能造成55万人死亡。这两个结果相差悬殊,后者是前者的百倍还多。

伦敦卫生和热带病医学院的朱厄尔将这种对重要参数的推测称为“关键假设”。病死率和感染率是两项最困难的“关键假设”,前者缺乏真实数据的支撑,后者则需面对捉摸不定的人类行为。

日内瓦大学全球公卫研究所所长安托万·弗拉奥曾对《中国新闻周刊》预测过非洲新冠疫情的一个特征:非洲的人口结构相对年轻,但并不是说中青年人就不会成为新冠重症患者。考虑到非洲重症救治的医疗条件比较薄弱,理论上非洲中青年人新冠病死率会远高于欧美。

比病死率更难以捉摸的变量是R0值。R0值是指在没有外力介入且所有人都没有免疫力的情况下,一个感染者将病毒传染给其他人的平均数。R0值越低,意味着病毒传播能力越弱。R0值会随疫情的周期性变化而改变,研究者则需要通过计算接触率、传播率、接触量、传播时间等因素,确定新冠病毒的R0值。

平均接触率是指每个感染者在一段时间内平均与多少人接触,而这取决于他们的生活环境与社交习惯;每次接触的传播率则被专家看作是“在不均衡的变化中”。但新冠病毒并不以“每人几例”的方式有序传播,超级传播者的出现足以打乱模型的预测,比如发生在意大利伦巴第大区医院、韩国“新天地教会”教堂、美国马萨诸塞州生物学会议上的聚集性传播事件。

像帝国理工和古塔普团队这样的模型,都预设病毒以固定的速率在整个样本人群中均质地传播,不同症状的感染者的传播能力没有差异,不同群体被感染的几率也没有差异。

此外,当一些学者试图计算每次接触的传播量和传播的持续时间时,他们还需要病毒生物学和免疫学领域研究的支撑。而病毒在传播者身上存活的时间、在潜伏期内产生传染性的时间,很长一段时间内都众说纷纭。

在估算模型参数时,最难预测的还是人类行为。北卡罗来纳大学副教授图费克奇指出,一些模型未必是高估了感染比例,而是模型的结论吓住了社会公众,并引发了严厉的封锁隔离措施,直接阻断了病毒传播的可能。

对于专业人士,模型并不是他们判断疫情的唯一标准。但对于政府而言,模型是疫情之初极少数有科学依据的政策参考之一。对公众来说,模型则更是最好的警示。

乔亚努对《中国新闻周刊》表示,所有模型都需要基于本地数据进行适当校准,与传染率和测试率相关的一些关键参数甚至要在适当的时间“瞬间改变”,以反映防疫政策的变化。

如今,美国北卡罗来纳、伊利诺伊、加利福尼亚等州已经开始使用多个不同的模型作为决策依据,且在防疫政策变动后会确定新的参考模型。一些专家则呼吁建立“新一代模型”,不再只是对疫情做长期的、概要性的预测,而是可以为地方政府的具体防疫措施提供更细致的参考。

美国哥伦比亚大学推出了一个带有直观的交互式地图的模型,专门预测在不同的社会隔离政策下,美国哪些县的医疗体系在何时会不堪重负。不过,该项目也饱受数据缺乏、很多变量难以假设的困扰。

针对亚非拉地区的模型,能获得的数据比欧美国家要少得多。尼沃德对《中国新闻周刊》指出,为保证有关非洲的模型结论有效,目前至少需要四个方面的真实材料:年龄分布和健康状况的人口学统计资料,国家的检测追踪能力,医疗卫生资源的基本数据,以及政府采取的社会干预政策。

来源:中国新闻周刊,https://mp.weixin.qq.com/s/0KubnUrhSB2oYdd0lbDmTQ 发表时间:2020年6月4日

中国民生调查2022
协办单位更多
V
海关总署研究中心
V
中国石油集团国家高端智库研究中心
V
贵州省人民政府发展研究中心
V
成都高质量发展研究院
V
中国东北振兴研究院
访问学者招聘公告
关于我们
意见建议
欢迎对中国智库网提出宝贵的意见和建议!