上一節(jié)課中,我們學(xué)習(xí)了構(gòu)建多因子模型的第一步:如何檢驗(yàn)單個(gè)因子的有效性。本周,讓我們一起學(xué)習(xí)如何用多個(gè)有效因子共同構(gòu)建收益預(yù)測(cè)模型。
在上一節(jié)課中,我們學(xué)習(xí)了檢驗(yàn)單因子有效性的步驟。這是構(gòu)建多因子模型的第一步。不過,要想長(zhǎng)期獲取超額收益,光憑單個(gè)有效因子可不夠。這就好比打籃球。想在籃球聯(lián)賽中獲得冠軍,隊(duì)員的命中率必須夠高,并且投籃的次數(shù)要足夠多。球隊(duì)需要保證在整個(gè)聯(lián)賽期間都能穩(wěn)定發(fā)揮,這就要求各個(gè)隊(duì)員的表現(xiàn)可以互補(bǔ),當(dāng)一名球員狀態(tài)低迷屢屢“打鐵”時(shí),其他的球員的良好表現(xiàn)能夠幫助整個(gè)球隊(duì)保持穩(wěn)定。多因子模型也是如此。我們無法保證每個(gè)有效因子在每個(gè)時(shí)間段內(nèi)都能穩(wěn)定地帶來超額收益,所以為了能持續(xù)盈利,更好的做法是通過多個(gè)有效因子來構(gòu)建投資組合。
多因子模型的理論基礎(chǔ)
時(shí)至今日,多因子模型不但在學(xué)界被廣泛討論,在業(yè)界也成了許多量化私募基金進(jìn)行組合管理的法寶。不過,和其他理論一樣,多因子模型也經(jīng)歷了從無到有、從理論到實(shí)踐的發(fā)展過程。在了解收益模型之前,我們有必要溫習(xí)一下多因子模型背后的理論。
資本資產(chǎn)定價(jià)模型(Capital Asset Pricing Model, CAPM)
20世紀(jì)60年代初,夏普(William Sharpe)等四位學(xué)者基于資產(chǎn)組合理論,提出了資本資產(chǎn)定價(jià)模型。
CAPM模型是現(xiàn)代金融市場(chǎng)價(jià)格理論的支柱。它將收益分解為市場(chǎng)和非市場(chǎng)兩個(gè)部分,并提出所有股票的收益率均受到系統(tǒng)性風(fēng)險(xiǎn)的影響。事實(shí)上,CAPM模型可視為一個(gè)單因子模型,只有市場(chǎng)這一個(gè)因子影響股票的收益率。這也就意味著,根據(jù)CAPM理論,如果想獲取高收益,只有一種辦法,就是購買高風(fēng)險(xiǎn)股票。
套利定價(jià)理論(Arbitrage Pricing Theory, APT)
到了上世紀(jì)70年代,人們逐漸發(fā)現(xiàn),具有某些共同特征的股票往往有著相似的走勢(shì),僅僅通過Beta這一個(gè)因子無法全部解釋股票的收益。于是,1976年,斯蒂芬·羅斯(Stephen Ross)提出了套利定價(jià)理論(Arbitrage Pricing Theory,APT)。
套利定價(jià)理論發(fā)現(xiàn),資產(chǎn)的收益與多個(gè)因素之間存在線性相關(guān)關(guān)系,這使得影響股票收益的因素從單個(gè)變?yōu)榱硕鄠€(gè),并為后來多因子模型的發(fā)展奠定了基礎(chǔ)。
多因子模型(Multi-Factor Model)
在資本資產(chǎn)定價(jià)模型和套利定價(jià)理論的基礎(chǔ)之上,尤金·法瑪(Eugene Fama)和肯尼斯·弗倫奇(Kenneth French)提出了Fama-French三因子模型。
兩位學(xué)者通過研究發(fā)現(xiàn),小市值股票往往表現(xiàn)超越大市值股,且市凈率低的價(jià)值股表現(xiàn)往往優(yōu)于市凈率高的股票。因此,他們?cè)谑袌?chǎng)因素以外,增加了市值因子與價(jià)值因子,提高了模型的歸因能力。此后,動(dòng)量、盈利能力等等越來越多的因子被發(fā)掘,并應(yīng)用于多因子模型之中。
利用多因子構(gòu)建收益預(yù)測(cè)模型
收益預(yù)測(cè)模型是多因子模型的重要組成部分,主要用來對(duì)未來的因子收益進(jìn)行預(yù)測(cè)。收益預(yù)測(cè)模型的構(gòu)建大體分為兩步:首先,進(jìn)行因子共線性分析,對(duì)通過單因子測(cè)試的因子進(jìn)行刪除或合成;然后,基于最終得到的因子集構(gòu)建收益預(yù)測(cè)模型。
因子共線性分析
經(jīng)過單因子測(cè)試后,我們可以得到一些表現(xiàn)優(yōu)異的因子。不過,這些因子在和其他因子構(gòu)建模型時(shí),仍然可能出現(xiàn)問題。一個(gè)主要問題就是多重共線性。
多重共線性(Multicollinearity)
如果線性回歸模型的解釋變量之間存在高度相關(guān)關(guān)系,則會(huì)導(dǎo)致模型失真或預(yù)測(cè)不準(zhǔn)確。
為了解決多重共線性問題,首先需要檢驗(yàn)因子之間的相關(guān)性。最常見的檢驗(yàn)方法是構(gòu)建各因子的相關(guān)性矩陣。而對(duì)于高度相關(guān)的因子,常用的處理方式包括:
1
直接剔除
按照有效性對(duì)這些相關(guān)性高的因子排序,將最有效的因子保留,剔除其他因子。若這些高度相關(guān)的因子經(jīng)濟(jì)含義不相同,通常采用直接剔除的方法。
2
因子合成
將因子進(jìn)行合成,從而盡可能多地保留有效信息。因子合成時(shí),可采用等權(quán)法,也可按照歷史收益率或歷史信息比率進(jìn)行加權(quán)。對(duì)于屬于同一大類的因子,它們的經(jīng)濟(jì)含義相近,可采用因子合成的處理方式。
建立收益預(yù)測(cè)模型
在共線性分析完成并得出最終的因子集后,我們就可以建立收益預(yù)測(cè)模型了。顧名思義,收益預(yù)測(cè)模型的主要作用,是通過因子的歷史收益率對(duì)其未來收益率進(jìn)行預(yù)測(cè)。主要的建立方式包括移動(dòng)平均法、指數(shù)加權(quán)移動(dòng)平均法等。
1
移動(dòng)平均法
將每一期的因子數(shù)據(jù)與下一期的股票收益率進(jìn)行回歸,計(jì)算前N期因子歷史收益率,然后取歷史收益率均值作為第N 1期收益率的預(yù)測(cè)值。
2
指數(shù)加權(quán)移動(dòng)平均法
指數(shù)加權(quán)移動(dòng)平均法與移動(dòng)平均法類似。不同之處在于,它假設(shè)近期的數(shù)據(jù)對(duì)預(yù)測(cè)值的影響更大,而遠(yuǎn)期的數(shù)據(jù)則影響較小,故對(duì)于近期的數(shù)據(jù)賦予更大的權(quán)重,而遠(yuǎn)期數(shù)據(jù)則賦予較小權(quán)重。
這兩種方法各有特點(diǎn)。移動(dòng)平均法簡(jiǎn)單直觀,可較好地反映出因子變化的趨勢(shì),但存在一定滯后性;而指數(shù)加權(quán)移動(dòng)平均法對(duì)近期的因子表現(xiàn)更為敏感,不過若股票收益震蕩劇烈,反而會(huì)影響預(yù)測(cè)效果。此外,常見的預(yù)測(cè)模型還包括時(shí)間序列預(yù)測(cè)法、邏輯回歸法等等。
如何參與培訓(xùn)
10月9日,《我是量化投資經(jīng)理》系列課程將講解第三課,介紹多因子模型的理論基礎(chǔ),以及如何用多個(gè)因子構(gòu)建收益預(yù)測(cè)模型。
聯(lián)系客服