原理简述
首先多因子模型不复杂,它是多元一次回归方程,我们可以按自己的理解选取不同的因子进行回归计算。而不同的因子的暴露程度跟未来一段时间内的收益多少有一定的相关关系,如果这个假设成立,模型即可对未来收益进行预测,而我们可以根据因子的暴露程度挑选出在未来涨势可能更好的股票,而获得更好的收益。
设想
中证500指数由500支股票加上不同的权重而组成,假设我们在500支股票里只挑选出特定暴露程度的因子的股票形成新的组合,如果这个组合比中证500指数要表现得好,那么我们就成功做出了中证500增强组合了。
为了使模型简单,作出以下设定:
1、挑选出的股票不作权重处理,权重一样;
2、用上一个季度的数据计算,挑选出的股票作为下一个季度的组合成分股,按复利计算净值;
3、由于中证500指数里的成分股会变化,仅在季度首月的中证500指数成分股里挑选股票;
4、通过约10年的数据进行回测,从2012年开始,至2021年9月初(按当时跑模型的时间)。
模型简述
此多因子模型只选取了P/E市盈率因子和Market Capitalizaiton Size市值大小因子。
Formula
* 代表的是不同工作日;
* 是在不同工作日的个股收益率;
* 求出个股在一段时间内的和,再用OLS模型回归出个股的和;
*其中求法如下:
* 是个股当天的值,是所有股票当天的均值,是所有股票值的标准差;
*其中求法如下,类比:
求解思路
数据源自Tushare
Step 1
准备选取时间段内各个季度首月的中证500指数的成分股列表;
Step 2
准备数据为季度时长里金融市场全部个股每天的P/E值、MC值,求出其均值及标准差;
以下是部分计算出来的数据:
另外求了中证500成分股内P/E、MC的均值和标准差作研究用;
Step 3
求出各个季度里成分股个股的 和;
Step 4
求出各个季度里成分股个股的两个F值;
可以看出有部分个股是没法算出F值的,一般是因为P/E值缺失;
上图是2012年第1季度首月中证500成分股计算出来的F值;
Step 5
按F值暴露程度,选取个股形成下个季度的持股组合;
以下仅按P/E因子进行暴露选股:
Step 6
对比中证500指数与组合的表现情况,Benchmark为中证500指数。
总的来说,多因子模型是有效的,不过单个因子暴露的效果不是特别明显,与其他因子结合应该会有更好的效果。