到底社交媒体曲线与股市曲线有没有、有多少相关度?

看看到底社会媒体的曲线与股市曲线有没有、有多少相关度,我正好有 HTC 过去一年的中文社媒数据

这是我们系统的关于 HTC 的中文媒体热议度(mentions)和褒贬度(net sentiment)的过去一年的曲线。

这是纯粹的社媒热议度(mentions)曲线。

 

这张图似乎更清晰一些:下面的曲线是热议度,上面的曲线是褒贬度(社媒舆情)。

路透社的HTC过去一年股市曲线图

雅虎的HTC过去一年股市曲线图

 


热议度与股市表现曲线图的对比(谢谢老友帮助制图)

褒贬度与股市表现曲线图的对比(谢谢老友帮助制图)

 

daily data 太稀疏和起伏,可上述 weekly data 似乎又间隔太长(颗粒度太粗)了,不好做吻合度滞后性的观察。也许最好是每隔三四天的数据来做,既让曲线 smooth,也不失时间的精度。以后做吧。

 

似乎 媒体褒贬度(net sentiment)的曲线比较热议度(mentions)的曲线与股市曲线吻合度更好?这也是合理的。

 

从这个例子看,似乎net sentiment略领先于market.
如果过去的历史有相关度,那么因为我们可以实时监测,对未来的走向的预示也就有搞头。历史是未来之母。

真要做股市预测,应该多做实验比较,精心挑选资料来源,排除来自不可靠资料源(包括更新不及时)的干扰或副作用,也许才更可靠一些?

 

对于英文社媒,除了 Twitter 和 Facebook 的实时(real time)性可以指靠,其他论坛应该只选专门议论股票的 BBS 吧?

当然,影响股市的有其他不可测因素,但社媒应该是很重要的一个指标,它反映的是股民的情绪和市场的冷暖。

好玩,好玩。

做这个比较是由于有王宁博士说,用最简单的关键词社媒大数据指导股市投资,有非常高的回报率(七年300%,年化之后大概17%,还是远高于绝大多数专家投资的回报率)。
Quote

信息会影响股市的走向 。波士顿大学的一个研究团队分析了从2004年到2011年道琼斯指数走势跟谷歌趋势的相关性,每次股市剧烈的变化伴随而来的都是搜索量急剧的增加。

利用这个策略,他们设计了一个基于谷歌搜索引擎的交易策略,这个策略使用的一个关键词就是“负债”。这个交易策略很简单,当搜索引擎的数据量减少的时候,我们就可以买进下一个星期的道琼斯指数,当搜索量增加的时候,我们卖出下一星期的道琼斯指数。

我们可以很明显地看到蓝色的线是谷歌的交易模型创造的,如果套用这个交易模型,最终它的投资收益率是300%,你投资一块钱,最后能够收回三块钱。红色的线就是你买了这个指数之后一直放在那儿,实际上收益是非常低的。这证明搜索引擎,包括社交媒体的很多东西能够帮助人类做很多决定,也就是今天汤道生先生谈到的怎么利用大数据帮助人类做一些决定。

摘自://chuansongme.com/n/588516

王宁博士说的那个社媒股市预测模型太简单了,只选取关键词,仗着数据之巨,也有效。

我们可以准确检测股民和市场的情绪,用得得当,应该可以做出好得多的模型来。

实验值得继续做下去,到底看不准的时候为什么不准,准的时候有多少,足以支持一个预测模型否。

不用 17% 回报率,只要有稳定的 10%,哥们就大发啦!

其实这个路子的实验和模型不难做,因为有几乎无限的历史上的标准答案在。
可以反复调整,数据来源,数据量,热议度影响度褒贬度或某种综合,等等,看怎样的 config 最能符合历史,以此建立未来的预测模型,应该相当靠谱(当然任何模型都无法预测突发因素,特别是媒体数据外的因素,但是对于股市的大趋势应该可以预测到位)。

认真设计研究路线,应该可以搞出点名堂来。应该与金融机构合作做这个研究。

via://blog.sciencenet.cn/blog-362400-820072.html

感谢支持199IT
我们致力为中国互联网研究和咨询及IT行业数据专业人员和决策者提供一个数据共享平台。

要继续访问我们的网站,只需关闭您的广告拦截器并刷新页面。
滚动到顶部