Twitter数据流可用于预测流感爆发

1

谷歌早在2008年推出了“流感趋势”网站。它建立的假设基础是:人们在遭受疾病困扰时,会比在身体健康时,花更多的时间搜索疾病相关内容。因此,通过分析一个国家,在特定时期的流感相关搜索量,便可以推算出病毒的传播情况。

这个预测非常靠谱,通常与美国疾病控制和预防中心(CDC)的数据相差无几。事实上,有几次传染病初期的预测,甚至比CDC早了一周之久。众所周知,疾病初期预测将为政府及时采取部署,提供了有利的时机。

那么其他的在线服务,尤其是社交网络,能否做到相同甚至更好的预测呢?如今,问题有了答案。卡耐基梅隆大学的Jiwei Li和康乃尔大学的Claire Cardie,成功利用Twitter预测了早期流感爆发。

2

他们的方式与谷歌十分类似。首先,他们从Twitter数据流中过滤包含与“流感”相关,并带有位置标签的tweet;然后,在地图上标注这些tweet的位置分布,以及随时间产生的变化。同时,他们还制作了流感的动态变化模型。新模型中,流感包括 4 个阶段:无传染阶段、爆发阶段、稳定阶段以及衰退阶段。

此外,他们采用全新的算法,试图尽快发现不同时期的转换节点。实际上,Li和Cardie在2008年6月至2010年6月间,已经利用100万美国人的360万条tweet,验证了该方法的有效性。 为了检验他们的预测是否成真,Li和Cardie将他们的分析与CDC进行对比。他们说,“我们确信,流感相关tweet与CDC提供的流感疾病案例数目,呈显著相关。”

这看上去是向流感疾病宣战强有力的武器。它不仅为疾病早期预测提供了新方式,同时,挑战了CDC,以及谷歌的流感趋势网站。每年,全球约10-15%的人感染流感,引发5000万流感病例,造成近50万人死亡。这是一个不容忽视的庞大数字。如今,政府和医疗机构可以借用Twitter,更早、更实惠、更便捷得预测疫情,挽救更多的生命。

感谢支持199IT
我们致力为中国互联网研究和咨询及IT行业数据专业人员和决策者提供一个数据共享平台。

要继续访问我们的网站,只需关闭您的广告拦截器并刷新页面。
滚动到顶部