由我院姜富偉教授和我院博士生馬甜、湖南大學金融與統計學院唐國豪副教授合作撰寫的論文《深度學習與中國股票市場因子投資—基于生成式對抗網絡方法》被《經濟學(季刊)》正式接收。
随着互聯網雲計算等技術的發展,深度學習神經網絡模型已廣泛應用在各行各業。而作為無監督深度學習的代表,生成式對抗網絡模型(GAN)已成功應用在圖片和視頻生成等領域。國内金融領域尚無使用GAN模型進行研究的文獻,本文首次将GAN應用于我國股票市場預測與投資,并強調了深度學習預測背後的經濟理論思考和探索。相比國外成熟市場,中國股票市場散戶參與度較高,市場波動性更大,GAN模型特有的判别器系統帶來更為動态的模型适應性,在面對新一期的樣本數據時,不僅通過生成器中的記憶單元保留了時序數據的趨勢項,還通過判别器進一步過濾噪聲。實證結果發現,相較經典線性模型,GAN深度學習模型在股票收益預測精度和因子投資績效上均有非常顯著提高。股票收益時間序列預測方面,GAN深度學習樣本外預測R2最高達到0.89%,顯著好于線性模型,模型預測精度提升效果在5%水平内顯著。股票橫截面因子投資策略方面,使用預測值排序法構建投資組合,發現基于GAN深度學習模型構建的多空對沖因子投資組合的月平均收益率和夏普比率分别為1.13%和0.71,顯著好于線性模型,且其FF3和FF5模型超額收益在5%水平内顯著。
本文還深入探究深度學習預測背後的經濟理論機制。投資組合構成分析,發現科技類股票相比傳統行業貢獻更高收益。因子重要度分析,發現最重要的特征因子有三類:價格及交易量趨勢類指标、流動性類指标、基本面類指标,其中前10大特征因子的貢獻度占到了所有148個因子的40%左右。錯誤定價理論分析,發現深度學習模型在低金融摩擦、低波動性以及高流動性類股票更為有效。宏觀經濟狀況分析,圍繞宏觀經濟活躍度、經濟政策與金融市場不确定性、投資者情緒等多個角度展開論證,發現深度學習模型可以有效捕捉我國宏觀經濟或金融市場中潛在的風險因素。微觀企業狀況分析,發現深度學習模型能有效預測企業在中短期(未來一年内)的盈利、收入和現金流等基本面狀況信息。
本文在深度學習模型構建和因子大數據分析方面的特色創新如下:
第一、更有效的特征提取和對非線性信息的利用。傳統線性回歸模型忽視了金融大數據内在的潛在信息因子、稀疏性和非線性等數據性質。本文在構建股票特征大數據的基礎上,使用了GAN模型對中國股票市場進行非線性信息特征的提取和分析。實證結果相比線性模型有了顯著的提升,表明了我國股票市場中上市公司數據的非線性特征包含有重要的預測信息。
第二、對于時序數據的有效處理。本文在構建GAN模型時,使用了更适合時序數據處理的長短期記憶網絡模型(LSTM),在對時序數據的處理中有着天然的優勢。金融數據長期存在自相關特性,資産定價領域中動量效應更是作為經典的異象因子被廣泛使用,LSTM通過記憶單元保留有效信息,并通過遺忘單元過濾掉“噪聲”信息,針對不同的資産類型匹配不同的記憶長度。
第三、更“智能”的預測模型。不同于傳統神經網絡模型優化過程中單純的使用梯度下降的方式,生成式對抗網絡引入了“博弈”的過程,生成模塊得到預測數據後,判别器将其與真實數據進行比對分類,評估并否定其預測結果,而最終的優化結果即要求生成器生成的數據騙過判别器達到以假亂真的程度。經濟學中完全競争市場具有最優效率,而通過引入判别器這一“競争”者,生成式對抗模型在結構上優于單一的預測模型。