数据可视化2.0

         许多技术和沟通方式都经历过痛不欲生却无法跨越的阶段,从音乐合成器到互联网,概莫能外。今天,数据可视化技术已经达到了上图中左侧图表的水平,该图表来自一家叫做JobVine的网站。

  该图表色彩鲜艳,虽然看上去像一张信息图,却让人有些费解。如今每个人都能利用特定的工具创作出音乐、网站、可视化数据等内容。在这种情况下,图表的泛滥并不奇怪。但凡事都有一个过程。20世纪初人类就发明了电音合成器,但在合成器变得物美价廉之前,并没有被广泛用于流行乐。UNIX操作系统高手统治了互联网30年,直到首个浏览器问世,出现了一种普通人就能学会的标记语言,这一格局才被打破。而数据可视化的历史和地图一样久远,过去它一直拥有特定的用户群,且制图过程非常耗时。

  今天,是数据可视化最好的时代,也是最坏的时代。现在,普通人可以利用诸如IBM公司的Many Eyes等网站以及Tableau Public等软件,轻松上传海量数据,定制自己的可视化图表。而相对廉价的编码工具,如JavaScript和HTML,让业余的编程人员都能做出复杂甚至具备互动功能的图表。但这种“民主化”也炮制出很多次货。所幸,根据以往经验,未来应该是光明的。

  让我们先来回顾一下事情的经过。起初,世界各地的爱好者掌握了不断更新的技术,并强迫世界接受他们所谓的创造力。比如,20世纪80年代,桌面出版系统(desktop publishing)问世后,新闻业开始在出版品上广泛使用20种颜色及31种字体。

  接着,大家开始滥用新工具,全然不顾是否实用和合理,就盲目跟风。(比如用Twitter来直播婚礼?开玩笑吧!)这种滥用的表现形式之一就是“高大上”的图表。《纽约时报》就是这一做法的先驱,它曾根据地区分布,发布过一个“超级碗”比赛期间,Twitter高频词的可视化结果。结果显示,匹兹堡最高频的词是“钢人队”,亚利桑那州最高频的词是“红雀队”,而中场休息时,高频词则是“斯普林斯汀”,因为当时他正在做表演。《纽约时报》此举无异于下血本让人飞上太空,只为确定地球上每个大洲的形状。

  然而,人们终将更加娴熟地使用这些技术,并在相关领域取得突破性成果,带来良性发展。数据可视化服务的青春期也许有些尴尬,但它正在走向成熟。例如,在上方的另一个图,是由JunkCharts重新设计的谷歌薪资情况的图表。JunkCharts是一家网站,在某种程度上它也是数据可视化发烧友最常光顾的社区,发烧友们制作出堪称范例的图表,并对其优点展开讨论。

  与JobVine提供的图表相比,JunkCharts图表标记更为精准,也更简明易懂。它没有无关的图解或颜色。无疑,网站创始人冯启思(Kaiser Fung)是视觉化大师爱德华·塔夫特(Edward Tufte)的门徒。塔夫特在他的权威著作《定量信息的视觉显示》(The Visual Display of Quantitative Information)、《视觉解释》(Visual Explanations)和《构想信息》(Envisioning Information),以及“一日课”项目中反复强调了克制、简洁、公平和精确这几项原则。

  但是,如今塔夫特的原则亟待补充。毕竟,《定量信息的视觉展示》首次出版于1983年,当时是PC时代的开端,只有简单的数字图表工具、电子制表软件,连彩印技术都还在萌芽中。该书没有预见到社会化分享造成的数据可视化大爆炸。更重要的是,他也没能预言到,究竟有多少信息图表只是哗众取宠而已?因此,即使塔夫特的学生用各种方法证明上面右侧图表更胜一筹,普通读者还是会觉得这张表无聊透顶。如果要发一张图表到Twitter和Facebook上,你觉得他们会选哪一张?

  因此,今天顶尖的数据可视化工作者正在努力超越塔夫特,试图在信息与设计、精准与精彩、知识点与卖点之间找到平衡。以凯瑟琳·穆尔布兰登(Catherine Mulbrandon)为例,她既是一位经济学家,也是一位交互设计师,在她的网站(VisualizingEconomics.com)和最近自行出版的新书《美国收入图解指南》(An Illustrated Guide to Income in the United States)中,她向读者呈现了数百种制作精良的信息图表,其精简性与它们所代表的数百万数据形成鲜明对比。书中最受欢迎的例子是一个树状图,该图展示了美国劳动统计局10年间跟踪的各行各业的变化。蓝色代表收入增长,收益越多,颜色越深,反之亦然,只是用粉色代表。其中最粉的部分就是制造业及信息业,后者令人意想不到。它给读者带来深远的冲击力,这也是所有伟大图像的魔力所在。另一位才华横溢的大师柯克·戈尔兹伯里将此称为极乐点——它能让读者眼前一亮,想做深入研究。

  大卫·麦坎德利斯(David McCandless)在他的网站,以及著作《异想世界》(The Visual Miscellaneum)和《信息之美》(Information is Beautiful)中做着同样的事。麦坎德利斯是一名数据记者,常常在《连线》或《卫报》等国际出版物上发表文章。有时他会选择一些好玩的题材——比如同时做两个可视化图表,一个是关于如何调制出受欢迎的鸡尾酒,一个是关于如何缓解宿醉。但同时他也擅长处理严肃信息。他曾做过一个很清晰的图表,内容是一个人可以通过改变日常的19种习惯,在一年内减少8吨碳排放。他还有一个关于直接和间接用水的图表,证明将农耕用水也算进来的话,日常活动中用水量最大的并非洗澡或洗衣服,而是煮鸡蛋。

  在数据可视化这条道路上,并非只有穆尔布兰登和麦坎德利斯两人,还有马丁·瓦滕伯格(Martin Wattenberg)、费尔南达·维埃加斯(Fernanda Viégas)、杰·索普(Jer Thorp)、内森·姚(Nathan Yau)和杰里米·霍华德(Jeremy Howard)等。但在未来,我们需要更多这样的人才,以及更成熟的创作工具。

  人类正在以空前的速度制造数据。如果没有可视化,数据的理解将越发困难。懂得更好地将数据可视化的人会赢得竞争优势,因为他们具备独特的洞察力。因此,复杂的信息图成为董事会议标配不过是时间问题。每个管理团队都希望公司的产品销售情况能做可视化处理,并有互动功能,包括谁买的,花多少钱买的,什么时间买的,当时天气如何,他们还买了什么等细节。承载这些信息的表格几乎无法分析,但有了数据可视化,对大数据做有意义的分析也会成为可能。

  优秀的可视化数据也能将复杂的想法具象化。其原形是病毒视频“美国财富的不均等”,这一视频戏剧性地将美国人的收入差距形象化地呈现在观众面前。其他例子还包括美国无人机轰炸事件及其死亡人数的可视化,或是财富500强企业的实际税率可视化,以及地球到火星距离的可视化。

  大卫·麦坎德利斯的新书名为《知识之美》(Knowledge is Beautiful,Harper Design出版社预计2014年出版)。我认为麦坎德利斯的书名以及内容的演变,很好地概括了这一学科发生的蜕变——从混杂到信息,再到知识。

  这是数据可视化的走向和必经之路。未来,数据可视化或将成为人类弄懂海量数据的惟一方法。而站在未来回顾今天,应该就像今天我们对上世纪90年代末网站和新浪潮时期合成器的看法一样吧。(译/牛文静 校/王晨)

作者:斯科特·贝里纳托

感谢支持199IT
我们致力为中国互联网研究和咨询及IT行业数据专业人员和决策者提供一个数据共享平台。

要继续访问我们的网站,只需关闭您的广告拦截器并刷新页面。
滚动到顶部