由我院姜富偉教授和北京大學經濟學院博士生孟令超(我院2019屆卓越項目本科生)、湖南大學金融與統計學院助理教授唐國豪(我校博士生畢業)合作撰寫的論文《媒體文本情緒與股票回報預測》被《經濟學(季刊)》正式接受。
本文探究了财經媒體文本情緒與股票市場資産價格之間的預測關系。本文綜合使用了Loughran and MacDonald(2011)詞典、word2vec算法和人工篩選等方法構建了一個全新的中文金融文本情感詞典(可以在https://github.com/MengLingchao/Chinese_financial_sentiment_dictionary下載),然後用該詞典提取了股票市場的媒體文本情緒。本文發現媒體文本情緒可以很好地衡量我國股票市場投資者情緒的變化,該指标在樣本内和樣本外都對股票回報具有顯著的預測能力。這一指标的預測能力強于常用的宏觀經濟指标或曆史均值預測。此外,媒體文本情緒指标對一些宏觀經濟指标也有顯著的預測能力。
本文的主要創新點是構建了中文金融情感詞典。金融領域的文本分析大多使用情感詞典,但是當前的中文情感詞典均為通用情感詞典,在金融語境下适用程度有限,目前仍缺乏一個廣泛接受的、專業的、開源的金融情感詞典。本文通過将英文的LM詞典轉化為中文版本,從現有的中文通用情感詞典中篩選出适合金融語境的詞語,以及利用word2vec算法從文本語料中挖掘情感詞語等三種方法構建了最終的中文金融情感詞典。随後,本文利用多種方法将其與現有情感詞典進行對比,證明了本文所構建的詞典具有更強的适用性與優良性。
本文接下來應用本文構建的金融情感詞典與文本分析技術構建了我國股票市場媒體文本情緒指數。文本情緒指數與文本情緒分析技術具有以下四個突出優點:(1)相較于可公開獲得的金融市場交易數據,文本情緒信息互補性強,在以往的資産定價研究中往往被忽視。因此,使用文本分析方法研究情緒對資産定價的影響有發現新結論的潛在可能。(2)文本數據規模極大,從這一海量數據來源中聚合情緒信息有利于減少以往的情緒測量誤差。(3)文本情緒屬于直接情緒測度。(4)考慮到文本數據更新的高頻性,我們有機會構建日頻甚至分鐘頻率等更高頻的情緒指數。
随後,本文檢驗了該情緒指數對股票市場的預測能力。結果顯示,文本情緒指标在樣本内與樣本外都可以顯著地正向預測股票市場回報,并且預測能力不弱于常見的經濟指标。此外,文本情緒指标對于資産配置也有着重要作用。這些結果都表明文本情緒指标在現實投資實踐中有着較強的應用的價值。
本文最後還探究了文本情緒預測能力的來源與作用機制。本文首先發現媒體文本情緒可以顯著地影響投資者對宏觀經濟的預期,而投資者會根據預期調整金融市場參與程度,從而讓市場回報産生相應的反應。接下來本文還發現基于風險補償的理論并不能很好地解釋文本情緒的預測能力,說明這一指标對股票産生影響的方式更加符合De Long, Shleifer, Summers, and Waldmann(1990)噪音交易者模型中的非理性傳播渠道。