python大数据分析——属性规约

版权声明:虽然以上内容不一定是本人原创,但是引用还请注明,谢谢! https://blog.csdn.net/weixin_42081554/article/details/82973869

属性规约通过属性合并或者删除不相关的属性来减少数据维数,寻找出最小的属性子集并确保数据子集的概率分布尽可能地接近原来数据集的概率分布。

1.常用方法

(1)合并属性:将一些旧属性合为新属性;

(2)逐步向前选择:从一个空属性集开始,每次都从原来属性集合中选择一个当前最优的属性添加到当前属性子集中,直到无法选择出最优属性或满足一定约束为止;

(3)逐步向后删除:从一个全属性集开始,每次从当前属性子集中选择一个当前最差的属性并将其从当前属性子集中消去,直到无法选择出最差属性为止或满足一定约束为止;

(4)主成分分析:用较少的变量去解释原始数据中的大部分变量,即将许多相关性很高的变量转化成彼此相互独立或不相关的变量;

猜你喜欢

转载自blog.csdn.net/weixin_42081554/article/details/82973869
今日推荐