LOADING...
LOADING...
LOADING...
当前位置: 玩币族首页 > 区块链资产 > 微观科技CTO高翔:从统计学与数据治理角度解析疫情数据的激增

微观科技CTO高翔:从统计学与数据治理角度解析疫情数据的激增

2020-02-14 微观科技 来源:区块链网络

只看数字不探究数据剧变背后的原因,只会助长恐慌和猜疑。需要用数字思维来探明真相。

——微观科技联合创始人、CTO 高翔

今天上午出现这个扎眼的“较昨日+15111”,一定会有很多不明真相群众,被惊到。作为一个多年在数据技术领域探索的老兵也不例外。处于理性思维逻辑,和对数据刨根问底的习惯,就这个扎眼的“较昨日+15111”提出了两个问题:

问题1:为什么会有这么大的数据增幅,导致各大统计应用出现“混乱”?

问题2:出现这么大的确诊数字增幅,对疫情、对整个社会统计有什么样的影响?

先看问题1:

案例一:某新闻网站的统计应用显示,截至2020年2月13日9点22分(24小时记时制),全国汇总统计已经得到“较昨日+15111”的数据(如下图1),但在“全国疫情地图”中缺迟迟没体现曲线图(如下图2)?

图1

图2

案例二:另一个国内知名的数据(金融证券级别)机构,在2020年2月13日10点(24小时记时制),湖北明细统计已经明确“较昨日+14840”(如图3),但在全国统计中,迟迟没有更新数字“较昨日-0”(如图4)?

图3

图4

说明:以下分析仅从公开数据及新闻中获取到的数据或信息,旨在说明在“数字”时代应有的理性思维模式,不代表任何学术及专业研判。

首先,分析数据来源。

通过新闻提示(如图5所示),获知,“湖北新增14840例新冠肺炎,含临床诊断病例13332例”。

图5

我们知道了,原来这么大的数据基数大部分出自于湖北。

但为什么突然激增这么大的比例?

不要被数字吓到,细心的我们看到了一个词——“临床诊断病例”,这是什么意思?

由这个问题,我们开始了第二步分析。

第二步:掌握数据统计指标概念及维度。

这里需要先了解几个指标的区别,“确诊病例”、“疑似病例”以及今天才注意到的“临床诊断病例”。官方解释非常多,大家可以百度。这里我们用简单的方式对比。

确诊病例:经过严格的“核酸检测”显示呈阳性的病例。

疑似病例:有新冠肺炎症状,但“核酸检测”阴性的病例。

(PS以上重点:这是2月12日之前,全国统一的指标)

临床诊断病例”:简单说可以理解为有新冠肺炎症状,但通过目前的各种检测手段、无法明确承“阳性”的病例。

这样大家就了解:原来在2月12日的“确诊”病例里增加了来自“湖北”与“临床诊断病例”。

这样从2月12日起,指标就变化了。我们对比着看

2月12日前,确诊病例:经过严格的“核酸检测”显示呈阳性的病例。

2月12日起,确诊病例:经过严格的“核酸检测”显示呈阳性的病例+“临床诊断病例”(有新冠肺炎症状,但目前检测非 “阳性”的病例)。

同时,这个指标需要加地域范围:湖北,截至目前全国只有湖北地区采用了这样的逻辑统计。为什么?我们稍后分析。

2月12日前,疑似病例:有新冠肺炎症状,但“核酸检测”阴性的病例。由于疫情爆发速度快,作为最严重地区的湖北初期防控医疗力量严重不足,湖北地区一直缺少准确“疑似”病例数据统计。

2月12日起,疑似病例除湖北外,有新冠肺炎症状,但“核酸检测”阴性的病例。在2月10日左右,我国医疗界的精英共同奔赴重灾区湖北后,湖北地区的“疑似”病例经过临床诊断后,纳入“确诊”,作为确诊病例的子指标:“临床诊断病例”

这样我们第一个谜团基本解答了。

在2月12日统计指标和口径发生了变化,因此,在2月13日,大家从各个数据应用看到的一时间“混乱”其实可以理解的。这一点,充分的体现了各数据统计应用本次疫情数据播报的及时性和真实性。

做过数据业务的人都知道,作为全国性的数据统计应用,实现“T+1”日数据更新频率是多么难的一件事情,尤其是涉及这种突然性的、无参考性的指标变化情况。

再看问题2:

出现这个这么大的确诊数字增幅,对疫情、对整个社会统计有什么样的影响?

疫情就是命令。这是目前阶段最重要的事情。这个统计的直接结果对疫情有什么影响吗?

个人认为:对疫情防控以及病患的及时治疗一定是有好处的。

因为,对于“确诊”和“疑似”病例,从医疗救治看,确诊后的病人一定可以得到医疗资源的重点关注和救治,帮助他们恢复健康;从防控隔离看,提升防控级别,有利与抑制疫情的扩大,降低目前在一线战斗人员的“感染”机率。

其次,对于我国社会数据统计体系的优化也有推动作用

本次疫情的“T+1”数据更新频率,以及面对疫情及防控要求指标调整现状。我们看到在数据及时性上进步经专业部门确认的数据及时发布,不必过分担心大家对数据的理解偏差(数据质量不可能一蹴而就的“完美”,需要不断的发现、修正、监督、完善的去提升,这一客观规律需要全社会对于数据认知的共同进步)。这是一种自信的表现

这次动员全国力量的抗“疫”战斗,一定程度上助推了我国国家级“应急响应”平台的完善,必定会提升全社会对于数据真实和准确性要求,会更加重视在数据治理领域的投入,会完善和优化综合数据治理能力。具体体现在数据治理中三个领域的建设:

治理保障角度,加强治理保障职能作用,强化进行数据统计制度、统计整合流程规范等的职责和作用。

治理职能角度,综合数据治理的数据质量、元数据、数据模型、数据权责、数据安全等数据治理职能都迎来了重大的完善和提升机遇。

治理科技角度,面信息爆炸的时代下,对传统的数据统计、应用等技术平台形成了巨大挑战。通过区块链、物联网、大数据、人工智能等新一代技术,提升综合数据治理能力成为必然之路。

任何繁杂数据讯息,如果没有完善的数据治理方式,都会导致各种繁杂信息在移动互联网上肆意传播,难证“真假”、难辨“可信”。区块链通过分布式记录存证优化数据治理体系,从一定层面上具备形成不可篡改、可溯源、可确权(可追责)的数据优势特征。

—-

编译者/作者:微观科技

玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。

LOADING...
LOADING...