沈浩:数据新闻正聚焦改变的能量

在3月14日中国人民大学的一次讲座中,主讲人是中国传媒大学教授、数据挖掘研发中心主任、调查统计研究所所长、中国市场研究行业协会会长沈浩,他分享了《大数据时代的数据挖掘与可视化传播》这一命题的精彩内容。数据新闻,又叫数据驱动新闻,是基于数据的抓取、挖掘、统计、分析和可视化呈现的新型新闻报道方式,目前我们对于数据新闻的研究仍然处于探索阶段,为此小编特意对沈浩教授进行了一次专访,从他的耐心解答中,我们可以看到大数据时代,新闻界更多的改变正蓄势待发。
R=RUC新闻坊
S=沈浩(中国传媒大学教授、数据挖掘研发中心主任、调查统计研究所所长、中国市场研究行业协会会长)
数据:可预知性
R:您在上次中国人民大学的讲座中提到,通过大数据的挖掘,人类行为的93%是可以预知的,那么这种可预知性会不会对新闻领域产生什么比较大的影响呢?
S:是有影响的。首先,在以前我们的新闻领域面对的是大众,很难具体到某一个实体的消费者或者受众上,但是进入到大数据时代以后,“人类”就可以指名道姓,曾经IBM做过一个研究,说如果可以获得你的200条微博或者Twitter,那么就可以知道这个人的性格,等等,这是一方面。
可预知性对新闻领域的影响来自于比如个性化推荐,通过社交媒体或经过媒体融合之后,新闻工作者可以直接触达受众。第二个就是我们过去的大众传播现在落地了人际传播,所以我们能够感知到我们传播的效果,比如在微博上我们可以感知到受众在社会上的影响,那么从研究的角度来讲呢,就意味着可以在社会这个层面上去研究原子论,通过个体的行为特征来感知他。新闻媒体现在已经发展到了多对多这样的传播模式了,大数据的挖掘显然对新闻媒体以后的影响是巨大的。
大数据时代:自动化新闻
R:“您在讲座中提到了计算机新闻,它又叫自动化新闻,它跟传统的新闻创作方式不同,是基于后台数据的挖掘和分析进行新闻创作,而且可以针对不同的受众产生不同版本的新闻,那么这是否说明新闻的定制化程度将会大大提高?”
S:“关于这个问题,首先我们要考虑的是,计算机新闻是否能够替代我们传统的新闻生产方式,这个显然在某些领域已经出现,第一个就是在我们的地震预报,或者是财经类新闻、体育赛事等等,也就是先写好新闻的大体框架,只不过随着数据的增加可以把新闻发出去,我认为这是机器人或者计算机写作的第一个阶段。
第二个阶段就是,机器可以通过大量的策划,包括对文本、语言等等进行分析,然后自动加工成为一份完整的新闻报道,这比刚才所说的填表式的新闻更加先进,它已经具有了组织语言的能力。
第三个阶段才是我最想说的,就是计算机可以基于你的个性、你的偏好写出适合“你”的新闻报道题材,突出你更加关心的新闻要素。机器人写作跟个性化推送不一样,机器人写作指的是内容的生成,而不是推送目标受众的问题。计算机可以成为专家,但是计算机很难成为杂家,很难涵盖所有的领域。”
1459003269-3146-0326
数据or直觉
R:“您提到在大数据时代,大数据挖掘出来的很多是不能靠直觉发现的东西,甚至有时候违背人的直觉,这是它与以往传统的调查性报告比较大的差别吗?这是否说明,在大数据时代我们更有可能出独家新闻,新闻的时新性也会有所提高?”
S:“这个问题很多人不好理解,实际上我们之所以说大数据挖掘会变成新闻,是因为我们挖掘出来的东西很多是事先不知道的,如果说不知道而且挖出来的东西往往新奇有趣,这时候它就具有了新闻的时新性。
相比于以往的调查报告,在过去,做一个时政研究,一个调查报告,你可能很长时间才能出报告,而且可能做出来的结果也是你事先就想好的,相比之下这些东西都不具有新鲜性,而数据挖掘最大的特点就是挖出来你事先不知道的东西,比如说女性爱看韩剧这样的信息,是不用我们去挖掘的。
我们每个人的知识有限,而数据发现的知识是你所不知道的。独家新闻在传统的新闻视角上,是具有特殊意义的,数据新闻的报道自然也是有特殊的意义的,数据新闻目前来说还是一个比较新鲜的事物,我们很难说新闻媒体是不是为了独家去采用大数据挖掘。”
1459003268-9835-0326
数据新闻VS深度报道
R:数据新闻其本身就是深度报道吗?如果说是,那么它与我们传统的深度报道有没有什么比较大的不同呢?
S:深度报道是新闻报道的一种主要形式,过去的深度报道指的是我们的记者深入追查、实地调查事件的发展,相对于传统的新闻消息,深度报道不是把一条消息播发出去,而是追踪事物发展的内在逻辑。
那么今天数据新闻它本身就具有从数据中深度发掘内在规律的模式,这种模式本身也是属于深度报道。另外,我们有可能不一定只是从数据,而是从大量的资料,比如大量的文本、语言中去寻找内在逻辑,这个也是非常重要的一个方面,基于大数据的挖掘能力、对繁杂数据的分析,包括多元数据、异元数据、异构数据的分析。
另一个方面,跟传统深度报道不同的是,我们的内容大多来自于互联网上、全球数据库中、还有从搜集到的数据中去深入地挖掘,一个事件,比如说天津大爆炸事件,可能有人去深入在现场持续报道、追究原因,也有人从大量的报纸去寻找线索,这些都是深度报道的形式。
受众角度:“信息偏食”?
R:“数据新闻的兴起是一种必然的趋势,那么随着定制化新闻的增加,会不会加深受众的“信息偏食”?比如说越来越关心自己感兴趣的信息,而相对忽略可能重要但自己不感兴趣的信息?”
S:“任何事物都是要一分为二地看的,就像我们说的,没有报道出来的新闻也是新闻,但是对于受众来讲,他的信息量可能过载,或者说在信息碎片化时代,用于有效的决策或者说对受众有用的信息又往往淹没在数据中,所以本身数据新闻就是在帮助受众去解读,但是不同的受众都具有其个性,而我们的个性化推荐随着技术的改进也会越来越好。
但是关于“信息偏食”这个问题很难说,换句话说有可能你也不知道你自己喜欢什么,想要什么样的信息。打个比方,你喜欢吃糖,家长就会给你吃很多糖,但你从没吃过辣,你自己也不知道辣的美味,等从此以后有个人带你吃辣的,你就开始喜欢辣,所以我们要具体情况具体分析。”
大数据时代:把关
R:“在信息碎片化时代,人们更多地接触到新媒体,那么数据新闻的把关是不是显得尤其重要呢?”
S:“首先呢,在大数据时代,数据新闻的把关需要更加专业的机构或者更加专业的人士来进行,第二,在我们国内的数据新闻依然需要非常严格的把关,要有新闻敏感。
所以说作为把关人来说,在数据新闻领域依旧要坚守一个原则,包括我们坚守国内的话语权问题,这个把关也能够帮助我们更好地去理解数据背后的意涵,因为数据具有天生的说谎能力,我们不能盲目地去迷信数据,正是因为相信,所以它才会容易变成谎言。”
数据时代的新闻人:媒介素养
R:“数据新闻学其实是一门交叉学科,数据新闻的兴起也给传统的新闻工作者提出了挑战,您认为在这样的背景下,新闻工作者的哪些媒介素养是最有待提高的呢?”
S:“这个事情其实在国内外都有争论,特别是在国外其实很早就流行了。对于现在的记者要不要去学编程,我曾经写过一篇文章,叫做《谈媒体人的数据素养》,有人说未来的新闻是数据分析,当我们面对着这么大的信息,要帮助受众去挑选的时候,我们所说的数据素养,这个数据不光是我们看到的数据,还包括文本、图像、语音、视频等等的分析能力,因为现在一切都是数据,所以随着新媒体的融合以后,我们对记者在这些方面的要求应该说是越来越高。
现在的新闻记者很多人,一问就是文科出身,觉得只要掌握文笔就好了,但实际上现在的新闻人越来越多地被技术、工科人才代替,比如说《今日头条》如果有100个员工,99个都是在做计算的功夫。我们要求记者在未来增强这方面的能力,这是第一。
第二,如果记者的能力不增强,那么就需要有一个团队的合作能力,新闻团队既要有技术的工匠,也需要有数据挖掘的专家和会讲故事的新闻人,这是一个合作的过程。未来会不会有这样具备多种良好媒介素养的人把这些活儿都做了呢,我们期待有。
所以我们现在成立了数据新闻报道的实验班或者专业,其实在国外这类人才的培养并没有那么严格,国外的综合性人才比较多,国内由于文理科分科比较明显,这种转变还是需要时间。相比于学界,业界总是走在我们前面的,很多的电视台、新媒体都已经意识到这个问题,学界也要更多地向业界学习。”
数据新闻创作来源:社交媒体?
R:在大数据时代,数据新闻的创作会不会更多地从微博、微信这样的连接强弱关系的社交媒体平台中去获取有意义的数据?如果会,用户的信息安全问题是不是更难处理?
S:关于新闻来源,在我们国家,稳定的新闻来源一般不会来自于社交媒体,比如说你提到的微信、微博。但是新闻的线索来自于社交媒体平台,这个却已经是不争的事实。比如我们大量的新闻线索来自于微信、微博的爆料或者热点,然后我们的记者再去深入地追踪,这是第一点。
第二方面,如果打破了传统的官办形态的话,那么我们许多人获取的信息都会主要来自己于微信、微博这样的社交媒体,特别是微博,它成为了一个信息的入口,目前来说,很多的舆情都来自于此,但是新闻不会直接来自于此。
对于用户的信息安全问题不好说,首先在信息时代,为了获得更好的服务,用户需要让渡一些个人隐私,这些个人隐私其实是非常个性化的东西,在这方面,有的人可能就希望直播了,有的人希望别人什么都不知道,所以对于我们来说制定这样的一个底线,比如企业和媒体要有社会责任,社会责任决定了保护用户隐私的底线,而这种底线又要靠技术实现。
所以大数据既是定义了什么是隐私,同时也是暴露隐私和保护隐私的重要手段。在这个背景下,每个消费者会更加注重个人隐私,也会有更好的技术手段去保护自己的个人隐私,这是一个不断博弈的过程。
结语
数据新闻的涌现已经成为新闻传播领域的一个趋势,在大数据时代,进行数据新闻的尝试与探索已经成为新闻领域必须呼应的诉求,目前我国数据新闻的实践仍然处于较低的阶段,我们期待更加优质的数据新闻的出现。

感谢支持199IT
我们致力为中国互联网研究和咨询及IT行业数据专业人员和决策者提供一个数据共享平台。

要继续访问我们的网站,只需关闭您的广告拦截器并刷新页面。
滚动到顶部