新浪新闻

新浪新闻未来讲堂第二期:数据新闻实践

新浪新闻

关注

财新数据可视化实验室主任黄晨:

今天我担心讲财经的东西可能会有点晦涩和枯燥,所以选了一些案例是偏向社会化的一些话题,大家认为的社会热点,或是泛财经的话题。

什么叫数据新闻?数据新闻这个话题大家一听,会问数据是不是财新?财经新闻就是天然应该做数据的?其实数据不是狭义的阿拉伯数字。比如大家会认为,我们经常采用最广泛的这个题材:财报,是数据新闻。财报,天然带有很多数字,大家一定会认为它是一个数据新闻素材。但是这个数据新闻所说的数据,其实并不是局限于阿拉伯这个数值的数字,具有很广泛的意义,比如说现在最常见形式,不管是视频、音频还有图片图像,都是数据。

今天是大数据时代,新浪本身就是一个大数据集成商,有微博,每天用户在上面的行为都是大数据。舆情分析其实很多是来自微博转发、语义分析、大V观点等,这些其实都是数据。数据新闻的数据,就是涵盖于这个大的数据概念之下。所以当我讲完之后,你们发现其实很多事情都是过去做过的,原来这个就叫“数据新闻”。最早可能称得上数据可视化的东西,就是这张霍乱地图。这个是在将近200年前在农村发生了一次霍乱,当时人们认知比较有限,认为霍乱就是人传人。大家不要见面,不然一说话一握手人就会死掉。大家索性全都关在家里不见面,以隔断霍乱的传播。但是发现其实还是不断有人死去。有一个医生,斯诺博士,做了一个柱形图,每当一个人死去,就会在这地方做一个标记。后来发现这些标记都是在水井附近,后来进一步推导,这是水的传播。

这个其实是数据跟地理信息结合在一起。今天我们可以在地图上加载很多数据,但是在那个时代,这是非常有开创性的思维。下面这个是拿破仑东征图,史上非常有名数据可视化。褐色的一条宽度是拿破仑出发去远东时候的军队的数量,黑色代表回来的时候。那我们就可以很明显的看到就是出发都有这么多人,但是回来后变成一点点。这张图呢加载一部分地理信息,有行进的方向,下面还有折线的坐标,搭载了当时行军到这个地方的一个温度。我们会看到,每经过一个低温的时候这个军队的数量会锐减一次。军队减员不是战死,而是严寒气候下,冻伤而致死。

所谓数据新闻,首先手段是数据可视化。什么是数据可视化?我知道新浪也有这样栏目,信息图栏目。比如叫“一图看懂……”。但这个标题现在烂大街了,而且很多的案例其实一图看不懂的。其本质是把一篇文本用美美术设计的手段进行美化,比如说文字排版设计、数字美化处理,密密麻麻排布很多信息。很遗憾告诉大家,这个其实不是数据可视化。

什么叫数据可视化?在远古的时代,人们没有数字没有罗马数字、阿拉伯数字,就用结绳记事。一眼看上去就会知道今天打了多少猎物。其实这个就是最原始的数据可视化,把数据量用图形图像的方式投射在人的大脑。今天我们做网站的都知道,咱们每个频道其实流量最大都是图片,因为图片会优先抓取人的吸引力。用眼动仪去捕捉大家视觉焦点,发现人类的大脑会优先处理图片,其次才去处理抽象的文字和数字。

数据可视化就是用看得见的,可以用大脑感知的视觉方式去处理数据。我们实验室主要做新闻的载体,采集数据,成立有有四年的时间。

数据可视化实验室经历了几轮成长。2013年,大家知道那个时候其实是PC时代,我们早期的很多作品都是基于PC的。今天来说,如果一个作品只是在PC端没有移动端,基本上它的传播率几乎是0。财新现在传播大多是来自于移动端。2013年以后,数据新闻突然有一波移动浪潮扑面而来,马上要解决数据可视化,一个图形图像怎么样搭载到移动端这么狭小的一个屏幕上,对我们来说挑战很大。怎么样去搭载,其实很难。有的作品是比较成功,但是有作品不成功,其实是一个摸索的过程。如果大家想去了解这个领域这个做得最好的,还是要去向国外多学习。

我们实验室在2013年10月份成立,11月份就发生了青岛中石化管道爆炸。11月22号发生了爆炸,我们的作品11月24号上线。,我们知道,当有一个突发事件发生,肯定会有现场记者发回现场图片报道。当然图集也是非常带流量。但是我们财经优势是原创,我们有记者到现场工作,条件比较艰苦,只能蹲在路边,拿纸画图给我们比较,拍微信发过来,我们拿这张图呢,去google地图上找到这个位置,然后还原到这张图上,后来用这张图的目的是展示哪出问题了。对于读者来说有身临其境的感觉,不去现场也知道在哪里发生什么事,而且有地理信息的配合之后这种感觉会更加强烈。这个应该是新闻媒体要带给读者的,是我们天然的使命。

数据新闻的整个制作周期比较长,不太适合去做突发性新闻。特别有时效性的东西其实不太适合数据新闻来去做,长效性的话题,任何时候拿出来说都不过时,更适合做数据新闻。包括学区房这种,比较适合数据新闻的选题。数据可视化是有套路可循的,很多图不是凭空想出来的,大概二十几种图就可以穷尽。基本上能够用到的主要是柱状图、饼图、折线图。所以都是比较套路化的东西,你需要储备这些方面的知识,知道呈现数据可以用什么样的形式。

数据素养问题,数据来源要找政府官方的数据,比如说国家统计局的数据,国家海关的数据,环保部的数据,这些官方的数据都是最可靠的。还有就是研究机构的数据,比如大一些咨询公司,麦肯锡、普华永道、毕马威等。这个等级会低于政府,那再往下就是企业,现在BAT的数据比较全,基本上就是大数据。我们去年做过一个选题挺有意思,去年大概10月份,上海突然出了一个传言说假离婚之后一年不能买房子。大家听了都想马上去离婚。可以派记者到现场去婚姻登记处拍人满为患人山人海的样子,但这是图片记者应该干的。我们就找滴滴帮我们查数据,我们给他提供了整个上海的婚姻登记处地理位置数据,滴滴根据这个地址来筛选以这些婚姻登记处为出行目的地的订单数,当然,数量绝对值是不会告诉我们,但是可以做一个变化曲线。那个谣言是下午出来的,第二天有一个激增。后来谣言被证伪,被市场消化了。用数据来发现,去呈现,是很有意思的。

数据新闻实验室的组织结构,内部已经整合了记者、设计师和工程师这三个岗位的人员在一起,工作效率最高。但是财经这样的传统媒体,记者是不坐班的,不像互联网公司大家肯定都要来上班,记者经常是在外面跑会啊或者写稿,然后就跟编辑联系,用微信或者邮件发给编辑,每周来公司开一次选题会。

做数据新闻,其实基本上算是做品牌,起到锦上添花的作用。

加载中...