圖像識别技術是近年來人工智能蓬勃發展的重要推手,其主要特點是通過卷積來進行特征提取。本期我們将讨論一篇基于PCANet的價值成長多因子選股模型的論文。這篇文章首次将PCANet深度架構應用于量化選股中,一方面将金融時間序列預測問題轉變為圖像分類問題,另一方面将PCA用于深度架構提供可解釋性,是中國金融科技研究中心有關量化投資的一部分。
PCANet模型原理
本文使用模型為PCANet模型,遵循CNN的思路,但卷積核使用主成分分析核來組成,非線性層使用哈希算法,最後的特征使用直方圖統計來完成。
與傳統的CNN相比,PCANet參數少,訓練時間短,識别效果好,在經典圖像分類問題上有着優秀的表現。
圖a 經典CNN的示意圖
圖b PCANet的示意圖
量化選股模型構建
因子圖片的生成
考慮到PCANet和CNN都具有處理二維數據的特性,可以将個股的因子數據組織成類似于圖片的二維數據,考慮一定長度的曆史截面期,那麼對于該個股來說,就可以得到一張個股的因子圖片,該個股對應一個t時間的超額收益率Rt來作為标簽。
如果在一個截面上有300隻股票,這樣在每個月的截面上,我們就可以得到300張股票的因子圖片,以及其所對應的标簽。這種數據處理方式很好地将一維時間序列轉換為二維的圖片形式。
模型回測
為了評價PCANet策略的選股表現,我們使用PCANet和CNN對訓練集的數據價PCANet策略的選股表現,我們使用PCANet和CNN對訓練集的數據價PCANet策略的選股表現,我們使用PCANet和CNN對訓練集的數據為了評價PCANet策略的選股 表現,我們使用了PCANet和CNN對訓練集的數據進行訓練,使用了線性回歸模型對訓練集的數據進行回歸。将3種模型在WindQuant平台上進行回測,基準設置為滬深300股指,在時間段2015-07-01至2017-06-30兩年的時間進行了選股回測。由于PCANet和CNN均可輸出每個分類的概率,根據輸出結果的上漲概率,比較選取上漲概率排名前十的股票構成組合。對于線性回歸模型,選取預測超額收益 收益率最高的前十股票構成組合。換倉方面,在每個自然月的最後一個交易日核算因子值,賣掉當月所持有的10隻股票;在下個自然月的首個交易日按照收盤價買入預測的十隻股票進行換倉,每個股票設置等權重調倉。具體的回測結果如下所示
結論
PCANet能夠有限地雜糅因子數據,PCA卷積核能通過篩選因子圖片中方差解釋性較大的因子,來達到抵消風險,從而獲得穩定收益。
實際訓練表明,對金融數據來說,使用PCANet的深度學習所需要占用的計算量較小,且不需要複雜的調參過程。