查看原文
其他

疫情之下,数据的 100 种表达 | 有数

有数工作室 湃客工坊 2021-07-30


2020年,一场新冠肺炎的暴发抢过了庚子春节的主调,身处其中,我们亲自为这场抗疫写下注脚。疫情实时地图、扩散路径还原、感染人数建模、问卷信息收集……有数编辑部整理了一批优质数据项目,来看数据的100种表达方式,重温数据创作者们在这次疫情中贡献的力量。
本文分两大部分,一是从病例数据、人口流动、知识科普、应对措施、疫情影响五大角度出发的作品汇总,二是观察了上百个疫情数据作品后我们的一些思考    
1 实时地图
眼看着疫情从最初的一张静态长图到各家媒体标配的动态地图,并随疫情发展不断完善。如丁香园除地图外,后期还开辟了辟谣与防护、疾病知识、最新信息实时播报栏口,便于读者一站式查询,澎湃新闻·美数课则在国内确诊数据放缓时及时上线「治愈地图」,国外疫情加重时,呈现细分的国际疫情数据。地图成为人们了解疫情动态的第一窗口。
但保证地图数据真实、准确、及时,并非易事。各家实时地图也会出现数据不一致的情况,同样来自官方数据,为何差异巨大?镝数团队对此做了分析。镝数新冠肺炎病毒肆虐,疫情数据如何辨真伪?
 
2 时空追踪

一个贯穿整个疫情期间的数据操作。从最初几百例到7万多例,从国内到国外,从群像到细分的死亡病例、无症状感染人群、确诊儿童,从输入性到家庭聚集性病例……观察每一个或大或小的切口,都让我们对病毒的了解增加一分。
对上述内容分析的详尽程度,取决于政府信息公开程度。对此,一些机构做了有趣的记录:

后期备受关注的国外疫情: 
数字背后,是一个个鲜活的生命。他们的每一次发声,都值得被记录。比如,他们曾经在社交媒体上发出的「求助」。RUC新闻坊1183位求助者的数据画像:不是弱者,而是你我
  

3 疫情预测

病毒什么时候爆发,最终会感染多少人,疫情拐点何时来临,我们什么时候能摘口罩。一切或好或坏的预测,乃至决策,都建立在病例数据的基础上。如前DHS生物监管总监接受大数据文摘采访时所言:疫情中数据的作用无法忽视,但也不能盲信模型。
过程中,我们经历了由于统计口径更改带来的数据大幅变化。2月13日,湖北新增14840例新冠肺炎确诊病例,随后,接连两天下降,2月15日早上,这个数字又降到了2420。DT财经湖北数据大幅波动意味着什么
        


1 离开武汉的人去哪了?

23日,武汉宣布封城。26日,武汉市长周先旺表示,「目前有500多万人离开武汉,还有900万人留在城里」。有多少人离开武汉?我在的城市安全吗?是春节时人们最关心的话题。毕竟,碰上九省通衢的武汉和春节这个特殊节点,没有谁能置身其外。
地球知识局我们研究了一下如何避开武汉,几乎不可能 来自地理角度的分析。
基于 百度慧眼 的人口迁徙数据分析:

2 关注武汉之外

人口迁徙导致了病毒向全国扩散的必然性,但当武汉成为全部焦点时,「灯下黑」的问题在前期被忽视了。
 

3 国际人口流动

时间来到3月,中国大部分地区新增确诊开始收窄,疫情得到控制。此时国外疫情日趋严重,外防输入成为二次防控的重中之重。了解国际间人口流动情况,航班数据是可供参考的指标。
 
4 复学复工

一延再延的假期过后,生活总要继续,复学复工迫在眉睫。面对依然严峻的疫情,大城市做好应对了吗?返程复工进度如何?百度慧眼迁徙地图数据再次派上用场。机场、高铁站、普铁站、汽车站等交通枢纽人流量、迁入迁出人口指数、城市内部出行强度是常见的数据指标。 
作业帮APP一周下载量突破46万次,钉钉收获超82万条1星差评,喧嚣舆情背后,学生、老师、家长们的真实看法是什么?在线教育果真逆势翻盘了? 


1 传染病
新冠肺炎和 SARS 到底是什么关系?哪类口罩防护最有效?相比其它传染病,新冠肺炎的严重性如何?历史上人类和传染病经历了怎样的纠缠史……突然间,科普遇上了它最好的时代。
搜狐四象工作室《病菌与人类》专题则以图绘形式做了系列科普,包括免疫系统如何工作、冠状病毒的分类、传染病潜伏期等等。

2 野生动物

如今我们经历的一切,都要从一只蝙蝠说起?未来,我们又该如何与野生动物相处。


3 药物治疗

截至2月7日所有的临床试验,已有50项与新冠肺炎有关的临床试验已登记在案,其中既有洛匹那韦/利托那韦(克力芝)等西药,也有双黄连口服液,还包括太极拳。至于新冠肺炎为何迟迟没有特效药,需知新药研发本就有一套复杂的流程,遑论面对的是新型病毒。


1 关键节点

事后回顾关键性事件的时间节点,总能发现一些端倪。而与人们情绪密切相关的微博热搜,也部分见证了疫情发展的高低起伏。 

2 救助力量


3 抗疫现场

  
1 对普通人

身处暴风眼的湖北人民,封城对他们来说意味着什么;远离风暴中心,被困在家的你我如何度过这段特殊时期;生活又发生了哪些突如其来的变化。
从没哪个时刻如当下,接收铺天盖地的信息,有真知,就有谣言。 

2 对行业/经济/社会

2003年的非典,给了我们警醒和经验,但新冠 ≠ 非典,且看时间会将我们带去哪?


趋势观察

数据,在疫情发展的每一个重要节点都留下了足迹,或答疑解惑,或记录现场,或探寻真相。观察了近200个数据作品后,在此将我们的观察分享给大家。
发挥优势,人人可以数据创作。我们曾在2019数据创作者大会上指出:数据创作者的身份日趋多元化,记者、设计师、程序员,还有“八卦”的人口学家、有趣的城市规划师、严谨的经济学家正参与其中……他们做事实核查,关注小众领域,发挥专业优势,不断拓宽着数据新闻的版图。
      
在这次疫情中,有民间自然保护机构-山水自然保护中心集结志愿者力量,分析野生动物非法贸易乱象,在#韩国人来青岛躲避疫情#的消息在网络上疯传时,关注航空领域的航旅圈第一时间以数据呈现事实,从不缺席的程序员Ele实验室模拟程序告诫大家不要出门,微博用户@江南剑心2组织网友自发绘制城市内部传播图,还有专注人口、城市、舆情、地理等创作者基于自身在专业领域的积累,不约而同展开数据叙事。
      图源:@江南剑心2
数据共享,开源力量在行动。和蔓延的疫情相伴而生的,还有各类开源力量。确诊患者相同行程查询 新冠肺炎小区查询等项目被广泛传播及使用,「本站数据接口和页面接受转发、嵌入、调用、下载」的说明又促进了项目的二次使用。又如澎湃新闻·美数课在疫情期间共享实时地图数据库疫情明细数据,方便各界研究和报道。北京大学的疫情可视化工具也无偿开放给社会使用。
数据时代,多一些开源分享,或许就有多一些各学科、领域、人才间的碰撞创新。尤其期待未来看到更多机器学习、图像识别等计算机技术在新闻领域的使用。
共创时代,数据可以从哪里来?除了公开的政府数据、开源数据,商业力量也是数据生态中重要的一环。在这次疫情中,百度人口迁徙数据在分析人口流动路径时起到很大作用。外卖数据、电商销售量、APP下载数等商业数据,也间接展现了消费者在疫情之下生活状态的变化。此外,你的每一次在线操作,都在互联网上留下了足迹,社交媒体的数据当然不能错过。在这些作品中,我们还发现了不少来自问卷数据的新探索。当面向人群达到一定数量,保证样本科学的条件下,问卷调研可以弥补当疫情这类突发情况出现时,新数据的缺失。
可视化,为有精度地观察疫情而设计。在本次疫情传播中,首次与图表大家族会面。我们发现,疫情稿件中的可视化涵盖了95%以上的图表类型。除了常规条形图、折线图、气泡图等基本图形,网络关系图、日历图、南丁格尔玫瑰图等小众图表也被大众所熟知。更重要的是,好看之外,可视化高效准确地信息传达功能得到重视,如向帆融合数字技术与艺术设计,以时间和空间为重点探寻疫情表达方式,还有指数坐标等高阶玩法被应用,作者和读者间出现了更多专业性的讨论。
冷冷的数字背后,亦不缺人文关怀。相比文本、影像,数据似乎总给人冷冰冰的感觉,这也赋予了其理性、客观的特质。但当视角定格在《图释两千年传染病史:若瘟疫无法被根除,该如何与之相处?》一文时,人类与几千年的传染病纠缠史娓娓道来,不由让人感慨人类的渺小。我们用一片片花瓣表征一个个逝去的生命,为的是不忘却这场灾难中的每一个普通个体。数据说话,不仅是摆事实、讲道理,最终是为了讲述一个值得记录的「故事」。
抗「疫」尚未结束,数据的记录也在继续。


▍ 关于有数
「湃客」是澎湃新闻旗下的专业创作者平台,「有数」作为湃客频道下设的子栏目,致力于连接和扶持具备数据挖掘与可视化能力的创作个体或团体,共同挖掘公共话题中的数据力量。 

如果疫病无法被根除,我们该如何与它们相处?| 有数
新冠疫情下,如何分辨谣言和有效信息?| 有数
新冠肺炎,对普通人的影响是什么?| 有数

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存