=====================
不要低估Twitter 对股市的影响。请看我的专栏:
经济学家告诉你,如何用Twitter预测股市
人人都想预测股市的涨跌,经济学家也发明出各种各样的预测方法。诺贝尔奖获得者 Eugen Fama(尤金·法玛)的有效市场假说(EfficientMarket Hypothesis)认为,有效市场中的投资人都是理性的,可以对所有市场信息做出合理反应。而行为金融学(behavioural finance)认为存在投资者情绪(investor sentiment),投资者是非理性的,会受情绪影响。
一篇来自欧洲央行的工作论文 Quantifying the effects of online bullishness on international financialmarkets 试图通过分析投资者的情绪变化而找到预测股票市场的办法。虽然现在已经有不少关于投资者情绪的数据,但在这篇文章中,作者借鉴了语言学的分析方法,搜集了 Twitter 和 Google 中“牛市”和“熊市”两个词出现的次数作为反映投资者情绪的指标,并与股票市场涨跌情况进行对比,分析二者之间的关系。
先说一下作者的结论:Twitter 中“牛市”一词出现的频率越高,第二天股价上涨的可能性越大。
接下来进入分析部分,首先解释一下什么是 Twitter 指数和 Google 指数。
1. twitter 指数:
定义:如果一条 tweet(推文,在推特上发的信息)中包含“bullish”(形容词,“牛市的”,意为股票价格上涨)这个词,则定义为牛市。这时网络上的人讨论“牛市”比较多,可以在一定程度上反映股票的潜在投资者认为股票可能会上涨的情绪;相反,如果包含“bearish”(形容词,“熊市的”,意为股票价格下跌)这个词,则定义为熊市,即潜在投资者更多的认为股票要下跌。作者收集了2010年到2012年期间约31万条带有英文"bullish(“牛市的”)和“bearish”(“熊市的”)字样的推文。
2. Google 指数:
作者并没有使用 Google 上搜索"bullish"和"bearish"两词的数量,因为这个数据得出的结果不显著,作者认为这可能是由于这两个形容词也经常被用在搜索非金融词汇当中导致的。因此作者使用了两个名词词组“bull market”(牛市)和“bear market”(熊市)来代替。而对于中国股市则收集了汉语“牛市”和“熊市”的搜索数据。数据都来自于Google Trend(谷歌趋势)。
两个指数的方程是:
左边式子的 T 是 Twitter 指数,右边式子的 G 是 Google 指数。B 是“牛市”的推文数量(或搜索结果数量),R 是“熊市”。为了便于理解,可以把这两个式子简单的看作是“牛市”一词出现的次数除以“熊市”一词出现的次数。也就是说,“牛市”一词出现的次数越多(即网络上人们讨论“牛市”的越多),这个指数越大。因此,这里的指数其实是“牛市指数”。
股票市场数据:作者选取了四个国家的股票指数:美国道琼斯工业平均指数(简称DJIA)、英国富时100指数(简称FTSE 100)、加拿大S&P/TSX综合指数(简称GSPTSE)和中国的上证综指(简称 SSE)。下图展示了2007年到2012年四个国家股票指数的走势,可以看出,美国、英国和加拿大股票走势很相似,在2008年前有小幅震荡,到2008年金融危机发生后大幅下跌,然后在2009年开始复苏。而中国在2007年股市快速上涨,然后2008年开始下跌,到了09年小幅反弹后又开始下跌。这其实也是作者选取样本时,除了选择三个发达国家的成熟金融市场外,专门加上了中国,因为中国在市场结构、金融法规、市场成熟度、媒体行为以及投资者行为各个方面都和另外三个国家不同,所以加入中国可以扩展模型的适用性并验证稳健性。
作者主要想研究三个问题:
1)Twitter指数和 Google 指数是否相关?
2)由于 Twitter 上的推文都是实时性的,那么Twitter 指数与股票收益是实时的影响还是预先的影响(即预测作用)?
3)同样的,Google 指数是对股票收益实时的影响还是预先的影响?
分析过程:
第一步:Twitter 牛市指数和 Google 牛市指数的关系:
首先遇到的一个问题是,谷歌趋势上的数据是每周的,而Twitter 则是每天的,所以作者为了时间段的匹配,选取了 Twitter 每一周的平均数进行比较。作者使用了VectorAutoregression Model( VAR,向量自回归模型),具体如下:
其中∆G(wB)代表在 w 星期 Google 牛市指数的变化,T(wB)代表 Twitter 牛市指数,i代表滞后的星期数(PS. 谁能告诉我怎么在输入数学符号?)。分析结果如下:
从第四行我们可以看出,当期的Twitter 指数对第二个星期的 Google 指数变化有显著正影响。但是从第一行和第二行来看,当期的 Google 指数对接下来两个星期的 Google 指数的变化都有显著的负影响,作者认为这可能是因为用 Google 搜索的人在两三个星期之后就把注意力转移到别的话题上去了。另外作者还尝试把解释变量和被解释变量颠倒位置,即估计哪些因素影响 Twitter 指数的变化,结果都不显著。也就是说, Twitter 指数会影响 Google 指数,但反之不成立。
第二步:Twitter 指数和股票市场收益的关系:
即Twitter 指数对股票收益是否有影响,或者说是否有预测作用。模型如下:
这里数据都是每日的。其中被解释变量是上面提到的四个国家的股票市场每日的涨跌情况,即收盘价减去开盘价(并取对数)。解释变量较多,我们可以只看Tt-1B ,即前一天的 Twitter 指数。回归结果如下:
作者分别估计了Twitter 指数对美国几大股票指数——道琼斯(DJIA),标普500(SP500), Russell 1000和 Russell 2000 的影响。结果显示,Twitter 牛市指数对第二天股价上涨有显著的正影响,也就是说,Twitter 上如果讨论“牛市”的多了,那么第二天股市上涨的可能性就很大。
之后作者又把模型简化了一下:
作者将这个模型用到了四个国家主要股市的数据上,结果如下:
结果与上面一张表格类似,Twitter 指数对几个股票的收益都有显著的正影响,特别是对美国、英国和加拿大股市的影响较大,而对于中国影响较小,系数只有8.73,p 值为0.09。作者认为是由于 Twitter 在中国无法使用导致的解释力较弱。关于对中国股市的预测,也许采用微博和百度搜索的数据会得出有趣的结论,不知道是否有人做过类似的分析。
第三步:Google 牛市指数与股票市场收益的关系:
这里的模型和上一部分的类似,不过数据是每周的。回归结果如下:
很遗憾的是,这里不管把 Google 牛市指数和该指数的变化量滞后多少期,其结果都不显著。也就是说 Google 牛市指数对股市没有太大的预测作用。
结论:
1) Twitter 指数与Google 指数相关,前者会影响后者。
2) Twitter 牛市指数对美国、英国和加拿大股市能够起一定预测作用,对中国的解释力稍微弱一些。
3) Twitter 牛市指数提高,意味着第二天股票上涨。
总之,要想预测股市的变化,那就多上 Twitter 吧,搜索一下关于牛市和熊市的“关键词”。
但前提是,你要先找到上 Twitter 的办法。
参考文献:
Mao, Huina, Scott Counts, andJohan Bollen. "Quantifying the effects of online bullishness oninternational financial markets." ECB Workshop on Using Big Data forForecasting and Statistics, Frankfurt, Germany. 2014.
最后总结一下答案:Twitter 上的推文反映了投资者的情绪,投资者的情绪影响股市涨跌。