數學、統計學或者機器學習如何能夠幫助我們提升交易分析的效率?——智能投研。
這個問題比寄希望於讓人工智慧來代替我們交易會更有意義,至少目前是這樣。在很多領域,深度學習似乎做得不錯,但無論是學習的效率,還是學習的本質,AI較人類還差得太遠太遠,更不用說,投資這種人類本身都說不清楚是科學還是藝術的事情。
投資里,我們最常見的數據是交易的時間序列,最常見的數據集是日線OHLCV數據。
時間序列分析屬於統計學的範疇,無論是一維的時間序列還是多元時間序列分析,都在統計系的範圍以內。但由於與經濟學關聯很深,一般作為計量經濟學的重要組成基礎。
Quant本身可以分兩大類:
- 金融與計量經濟領域的quant偏向於時間序列分析——需要的數據量相對較少,所以一般量化投資從時間序列分析開始。
- 機器學習是另一種做quant的手段,與時間序列分析是並列的一種手段。
時間序列有兩種模式,一是均值回歸; 二是趨勢跟隨(動量效應)。
均值回歸:如果時間序列是平穩的,有一個均值,產品價格圍繞均值操作。如果時間序列是隨機遊走,下一刻的狀態沒法根據過往判斷,與過往價格是獨立的,那就沒法在證券市場構建統計模型賺錢。單只股票的價格很可能就是隨機遊走的。但是一個股票組合,可能不是隨機遊走(平穩)的,也就有了研究的必要。——可以通過統計方式,構建一個「平穩」的「套利」投資組合。
時間序列里,有趨勢、周期、自相關性,剩下就是隨機遊走。
平穩性(stationarity)是時間序列分析的基礎。嚴格平衡,說白了就是收益率來自於同一個概率分布:對於所有的 , 的概率分布都是一樣的、不隨時間變化。這樣的時間序列 就是(嚴格)平穩的。但這個條件太嚴格了,一般我們關注弱平穩,即均值與方差具備(二階)平穩性。但即便是弱平穩,金融時間序列要達到標準也不容易。因此,我們需要把時間跨度縮短或者通過更複雜的非線性模型對波動率進行建模(比如 GARCH)。
更加高級的時間序列模型來對自相關性建模。在這方面,自回歸模型(AR)和滑動平均模型(MA),以及它們二者的組合 —— 自回歸滑動平均模型(ARMA) —— 都是非常有力的工具。
P階自回歸,很好理解,就是當期收益率,使用過去P期來線性擬合:
ARIMA模型是在ARMA模型的基礎上解決非平穩序列的模型,因此在模型中會對原序列進行差分。
基於時間序列的分析應用於量化投資符合直覺。因為我們首先獲得的就是時間序列相關數據,技術分析的金融基本假設也是歷史可以重演,就是歷史中含有未來可以重現的模式,若是如此,則時間序列的分析模型會很有用。
但事實在,不要指望一個指標或者模型直接解決問題,而是幫我們更好地理解數據。
比如歷史收益率只是一個方面,那麼結合估值情況呢?結合RSRS指標呢。
(公眾號: 七年實現財富自由(ailabx),思想者,行動派;用數字說基金,用基金做投資組合,踐行財富自由之路)