数据新闻的挖掘与可视化处理

edito

       随着计算机技术和数据挖掘技术的发展,海量数据的采集和分析成为可能,再加之政府部门信息披露的范围和频度不断扩大和增加,数据遂成为今天媒体不可或缺的重要信息来源。能不能用好这些数据资源,成为各媒体较量的又一战场。

    近年来,数据新闻异军突起,不仅在作为新媒体代表的网络及移动互联网上处处可见其踪影,即使在电视和纸媒等传统媒体上也有颇多应用的范例。数据新闻的流行,既为受众提供了精准新闻,也成为开启“悦读”时代的重要组成部分。研究数据新闻的挖掘及其可视化处理,对推动媒体进一步探索新形势下的改革路径大有裨益。

    纽带:连接传统媒体与新媒体

    数据新闻,是指在新闻实践中引入社会科学的研究方法,通过对数据进行分析过滤来创作新闻的方式,又称数据驱动新闻。上世纪90年代,计算机辅助新闻出现在西方新闻界,新闻2.0、数据库新闻等概念也纷纷出炉。2002年,美国梅耶在《精确新闻》和《新精确新闻》中,最早提出了数据新闻的概念。在2010年维基解密事件中,英国《卫报》等媒体把数据新闻产品推向了新的高度,也在全球新闻界掀起了数据新闻的高潮。

    新闻报道的是事实,而数据经常是最重要的事实,在相当比例的新闻作品中,数据就是新闻本身,使用数据是记者对读者突出强调新闻真实性的手段,有时甚至是刻意的。数据的本质是真实、客观,与新闻有着天然同质的属性。所以,新闻作品从来都把数据当作重要支撑,权威的数据可以增强新闻的公信力和精准度。

    过去,由于数据采集和数据处理条件的限制,以及数据资料不易获得等原因,数据只能起到对新闻补充说明的作用,还经常因为数字的枯燥陈列而成为新闻的败笔。随着计算机技术和数据挖掘技术的发展,海量数据的采集和分析成为可能,再加之政府部门信息披露的范围和频度不断扩大和增加,数据遂成为今天媒体不可或缺的重要信息来源。能不能用好这些数据资源,成为各媒体较量的又一战场。来自数据的革命性变化,最终成就了数据新闻的繁荣。

    在全媒体时代,数据新闻可以成为传统媒体和新媒体连接的纽带。对数据的理解,我们一般是指狭义的数字本身,但在西方媒体的应用中,它有时等同于数字化,系指电子化的所有信息资源,比如,互联网上的文章、数据、图片、视频以及各种评论等。这样,西方国家谈及的数据新闻有时比我们所说的内涵和外延要大。

    因为与信息技术的关系密切,数据新闻往往成为打通传统媒体和新媒体的通道,借此实现最大程度的信息共享。比如,通过传统媒体新闻渠道获取的数据资料,在传统纸媒上总会受到篇幅和容量的限制,静态的数字照搬也难免有枯燥之嫌,而借助新媒体不仅可以不计容量地充分展现,而且网络媒体交互性强的特点还可使数据新闻更加生动亲切、通俗易懂。同样,来自网络新媒体的数字化资源,也可丰富传统纸媒的内容。

    优势:更利于深度新闻表达

    数据新闻的作用就在于从数据中发现故事,将某些数据与其他数据相结合,寻找出对公众、对社会有意义、有价值的新闻。数据挖掘是一种专门技术,经常采用统计、在线分析处理、情报检索、机器学习、专家系统和模式识别等技术手段。通过数据挖掘手段的介入,媒体可以获得更加全面、客观、直观,并且有深度的新闻表达。

    美国新闻学家麦尔文·曼切尔曾说过:“消息来源是记者生命的血液。”线索是新闻制作的起点,也是新闻竞争中的一个重要回合,“拼线索”其实就是拼新闻源。寻找新闻线索,媒体多采用记者跑口跑会、开设新闻热线、建立通联队伍等办法。近年来,很多媒体从挖掘数字资源中获得新闻报道的切入点。例如,人力资源和社会保障部在前不久举办的例行新闻发布会上,公开披露了近期社会保险的运行数据。大多数媒体在报道时只是简单罗列了几个重要数据,但也有媒体记者认真比对分析公开数据后,发现“医保基金结余较多”,并以此为线索,经补充采访后写出了有自己媒体观点的新闻。

    挖掘数据背后的新闻故事。研究数据,是由表及里的过程,往往可以触及不为人知的真相,而这些真相就构成了新闻故事的本源。比如,美国的超市通过分析顾客结账单发现,购买微波炉的顾客一般也会买餐具,于是他们在摆放物品时就将微波炉和餐具摆放在一起,取得了很好的销售业绩。这是多么吸引眼球的经营故事。

    挖掘数据背后的新闻观点。在新闻日趋同质化的今天,媒体的差异化往往体现在对相同新闻事件的不同解读上,提炼观点、展现观点、传播观点成为媒体竞争的又一领域。在浩繁的数据背后,有新闻的真相,也有可提炼成论题的新闻观点。比如,对养老金缺口问题一直众说纷纭,《中国社会保障》杂志通过对全国养老保险运行数据的分析,得出养老金当期没有缺口的结论,起到了定纷止争、有效引导舆论的作用。

    作用:提高“悦读”指数

    对非专业读者而言,数据本身是单调的、枯燥的,不“悦读”的;而当数据成为新闻的要素,就必须考虑它的可读性,再好的新闻不可读也行之不远。让数据转化成可读、可“悦读”且具有新闻特质的表现形式,即是数据新闻的可视化处理。总结各媒体在数据可视化上的应用实践,大致有以下几种类型:

    统计图表。这是数据应用最传统的表现形式,一般采用折线图、数据表格等方式,让数据展现得脉络清晰。

    时间线。以时间为线索,展现相关信息,使人一目了然,一图胜过千言。比如,《中国社会保障》杂志2014年第6期上对“双轨制”由来的展现,即以时间线的方式,从1949年到2014年追踪了制度的变迁。

    信息图。信息图表或信息图形是指信息、数据、知识等的视觉化表达,它利用人脑对于图形的接受能力从而更高效、直观、清晰地传递信息,是对信息传递的优化。这是媒体数据新闻目前采用最多的方式,它可以用图片、漫画等形式包装数据信息,使之更加亲切;也可以图解的方式表现一个事物的流程或构成,变大量的文字说明为直观的图形表达;还可以表现新闻事件,用图示的方法提要新闻事件的关键信息点,变读文为读图。

    数据地图。应用地图来分析和展示与位置相关的数据,将数据和地图结合起来,表现一个新闻点在不同地区的分布。比如,报道全国的养老保险参保状况,就可将参保人数、基金积累、待遇水平等数据信息分省标记在地图上。数据地图在新媒体上有更广泛的应用,网络上的地图可以是动态的,它可以链接更多、更实时的信息。比如,英国《卫报》在报道一场战争时,其网站上就有实时更新的战地地图,读者点击某一地,这里的伤亡人数等信息都可出现,新闻的互动性大大增强。

 

感谢支持199IT
我们致力为中国互联网研究和咨询及IT行业数据专业人员和决策者提供一个数据共享平台。

要继续访问我们的网站,只需关闭您的广告拦截器并刷新页面。
滚动到顶部