特朗普推文里藏着哪些统计陷阱?
澎湃新闻
原标题:特朗普推文里藏着哪些统计陷阱?
在美国移民局出台新规要求在美留学生若只上网课或被要求离境、美国政府向国会递交退出世卫组织通知的同时,特朗普连发多条推文,用他的统计数据展示他“非凡”的抗疫成果。
陷阱一、相关不等于因果
特朗普推文中说:因为大量检测,所以美国最近的新冠病毒确诊数才上升到5万多的。
咋一听好像很有道理,检测的人数越多,当然确诊的人数就越多呀,要是检测量少的话,确实也没有那么多确诊病例嘛。殊不知这正是一个常见的统计陷阱:相关不等于因果。
检测人数与确诊人数具有明显的正相关,但并不能认为检测数上升是确诊数上升的原因。就像不能因为城市里的警察数量跟犯罪案件发生数是正相关,就说是因为警察越多导致了犯罪案件数量越多一样。也不能因为消防出勤数跟火灾发生数是正相关,就说是因为出勤数越多导致了火灾发生数越多一样。
▲ 2. 存在混杂因素:蝉叫得越响,屋子里越觉得热。并不是蝉的叫声大导致屋子里气温升高;
▲ 3. 反向因果关系:正如警察数量跟犯罪案件发生数一样,并非是因为警察数量多导致犯罪案件发生数升高,而是犯罪案件发生数升高所以需要更多的警察。
即使6月下旬后仍然保持5月21日到6月20日的每日平均452922检测数不变,如果按照7月7日的移动平均确诊率8%计算,6月下旬之后的每日确诊数仍然会上升到36233例。比起原先平均每日22246例来说,仍是大幅上升。
因此,特朗普说的因为检测数更多所以确诊数更多,把相关关系说成因果关系,正是利用了这个统计陷阱来试图掩人耳目。
陷阱二、确诊数上升,死亡数反倒下降
特朗普的多篇推文都在重复一个点:虽然你们看现在每日的确诊数突破5万,但是死亡数一直都在下降啊,比起最高峰时一日死亡2749人(4月21日)来说,现在每日死亡人数都下降“十倍”了,假新闻媒体为什么不报道呢!
因此,当前的死亡病例数并非是当前的确诊病例数导致的,而是2-3周甚至更长时间之前的确诊病例数导致的。6月下旬新增的确诊病例,需要2-3周甚至更长的时间才能看见结果。
陷阱三、部分取代总体
或许特朗普心中也默默觉得单说现在的死亡人数下降数据并不具太大的说服力,于是他进一步拿病死率说事儿:美国新冠病毒病死率世界最低!
仔细一想不对,世界除了西欧和美国之外,就没有其它国家了吗?难道美国人的眼中的世界就是美国和西欧吗?
陷阱四、辛普森悖论
除了并不是世界最低的之外,特朗普一直吹嘘的美国新冠病毒病死率其实还有其它的问题:每个国家的内部情况不同,并不能单纯对比病死率来看抗疫的情况。
为什么这么说呢?我们先举个例子。
假设1: 现在有两个国家分别为国家A和国家B,这两个国家新冠病毒确诊人数都为1000人,国家A因新冠病毒死亡人数为100人(病死率10%),国家B因新冠病毒死亡人数为200人(病死率20%)。
问你觉得哪个国家抗疫更为成功?
这也是为什么统计学要求在比较两组数据时,首先要检查数据内部构成的原因。
因此,单纯拿美国新冠病毒病死率和其它病死率高的国家比,是不厚道的。
比如意大利截止到7月7日的新冠病毒病死率为14.4%,而美国为4.3%,是否可以单纯地说美国抗疫比意大利更为成功呢?我们分别从意大利高级卫生研究所和美国疾病控制与预防中心获取到意大利和美国的新冠病毒各年龄段确诊人数和病死人数的数据。[4] [5]
五、特朗普聪明着呢!
纵观特朗普在推特上发表的这些统计数据,看似一点都不懂统计学,比如经常用“十倍”来形容下降,但却是一个非常善于利用统计数据和统计陷阱来说服选民的鬼才。
很多人看了特朗普这几个月的骚操作之后,总以为特朗普不会是个傻子吧。特朗普才不傻,人家聪明着呢!
傻的是没有判断力的选民。
引用:
[1] Daily New Cases in the United States. https://www.worldometers.info/coronavirus/country/us/.
[2] 中室牧子, 津川友介. 原因与结果的经济学. 后浪丨民主与建设出版社, 2019-06.
[3] Rate of Positive Tests in the US and States Over Time. https://coronavirus.jhu.edu/testing/individual-states.
[4] Istituto Superiore di Sanità. Sorveglianza Integrata COVID-19 in Italia. 2020-06-22.https://www.epicentro.iss.it/coronavirus/sars-cov-2-sorveglianza-dati.
[5] Stokes EK, Zambrano LD, Anderson KN, et al. Coronavirus Disease 2019 Case Surveillance — United States, January 22–May 30, 2020. MMWR Morb Mortal Wkly Rep 2020;69:759–765. DOI: http://dx.doi.org/10.15585/mmwr.mm6924e2external.
本文首发于微信公众号“Alfred数据室”,转载请联系原作者!