多因子策略冗因

版权声明:无情不似多情苦,一寸还成千万缕。天涯地角有穷时,只有相思无尽处。 https://blog.csdn.net/u011078141/article/details/89453358

原 多因子策略之冗余因子

引言:

上一篇文章《多因子选股之有效因子》,我们讲到有效因子的检验。在选择了有效因子之后,我们还需要进行一步去除冗余因子。

不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除, 而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。

主要步骤:

我参考了网络上不同的剔除方法,但都仅仅浅尝辄止,没有进行深入的代码探究。我们先说剔除冗余因子的主要步骤:

假设现有k个因子,回测周期可分为m个月,股票可均分为n个组合,

1、分别按不同因子的大小进行排序,讲股票分为n个组合进行打分,分值与该组合在整个模型形成期的收益相关,收益越大,分值越高。分值赋给每月该组合内的所有个股。

如果组合10的收益大于组合1,那么就将组合 i 各个股票的各个股票分值设置为 i ,各个组合的分值从低到高进行排列分别是

1,2,3,4,5,6,7,8,9,10。如果组合1的收益大于组合10,那么正好是反过来 10,9,8,7,6,5,4,3,2,1。

2、按月计算个股的不同因子得分间的相关性矩阵。

3、在计算完每月因子得分相关性矩阵后,计算整个样本期内相关性矩阵的平均值。

4、设定一个得分相关性阀值,将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保留与其他因子相关性较小、有效性更强的因子,而其它因子则作为冗余因子剔除。

测试参数:

我们根据步骤,在掘金平台上实现
测试参数声明:
测试平台:掘金量化
测试时间:2016-01-01——2018-01-01
测试股票池:“上证50”成分股
测试因子:

0_1533722338455_01.jpg

测试步骤:

1、获取每个月的首个交易日,月初获取每只股票的因子数据及当月收益率,根据因子数值排序,将股票分为10组,根据平均收益为股票组合打分,分值赋予对应组合中所有股票。

2、分别测试股票关于四种因子的分值,根据每月结果,计算相关性系数矩阵。

3、计算整个测试周期的相关性系数平均值。

4、设定阈值,剔除冗余因子。

结果:

我们看几个月份的相关性系数矩阵
0_1533722784179_图片1.png

                                                                              2016年3月


0_1533722839507_图片2.png

                                                                     2016年4月


0_1533722875258_图片3.png

                                                                            2016年6月
0_1533722892677_图片5.png

                                                                     2016年10月
0_1533722944456_图片5.png

                                                                       2016年12月
0_1533722975118_图片6.png

                                                                2017年6月

再来看各个月的统计表格

0_1533723012850_360截图20180808172905332.jpg

我们经过统计,得出平均相关性系数矩阵
0_1533723037047_360截图20180808173102752.jpg

结论:

我们选取的四个有效因子,平均相关性系数均小于0.25,也就是我们选取的因子相关性很低,我们可以放心的进行因子间的组合,构建新的因子。

冗余因子剔除的思想:计算股票根据每个因子的所获得的分值,通过比较该分值,从而得到因子间的相关性,相关性高的,剔除其中一个,留下有效性高并与其他因子相关性低的因子。

查看获取冗余因子策略请点击:https://www.myquant.cn/community/topic/695

来源:掘金量化myquant.cn,作者:经纬量化  宋瑞笛   ,转载请注册出处!

--------------------------------------------------------------------------------------------------------------------------

推荐文章阅读:

1 双均线策略(期货)  量化策略源码 https://www.myquant.cn/docs/python_strategyies/153
2 alpha对冲(股票+期货)  量化策略源码 https://www.myquant.cn/docs/python_strategyies/101
3 集合竞价选股(股票) 量化策略源码 https://www.myquant.cn/docs/python_strategyies/102
4 多因子选股(股票)  量化策略源码 https://www.myquant.cn/docs/python_strategyies/103
5 网格交易(期货)  量化策略源码 https://www.myquant.cn/docs/python_strategyies/104
6 指数增强(股票)  量化策略源码 https://www.myquant.cn/docs/python_strategyies/105
7 跨品种套利(期货)量化策略源码 https://www.myquant.cn/docs/python_strategyies/106
8 跨期套利(期货) 量化策略源码 https://www.myquant.cn/docs/python_strategyies/107
9 日内回转交易(股票)量化策略源码 https://www.myquant.cn/docs/python_strategyies/108
10 做市商交易(期货) 量化策略源码 https://www.myquant.cn/docs/python_strategyies/109
11 海龟交易法(期货) 量化策略源码 https://www.myquant.cn/docs/python_strategyies/110
12 行业轮动(股票) 量化策略源码 https://www.myquant.cn/docs/python_strategyies/111
13 机器学习(股票) 量化策略源码 https://www.myquant.cn/docs/python_strategyies/112

《算法导论 第三版英文版》_高清中文版

《深度学习入门:基于Python的理论与实现》_高清中文版

《深入浅出数据分析》_高清中文版

《Python编程:从入门到实践》_高清中文版

《Python科学计算》_高清中文版

《深度学习入门:基于Python的理论与实现》_高清中文版

《深入浅出数据分析》_高清中文版

《Python编程:从入门到实践》_高清中文版


猜你喜欢

转载自blog.csdn.net/u011078141/article/details/89453358