特征降维

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_41455420/article/details/79859622

特征降维

特征降维,有时候也称之为特征抽取(用于降维的特征选择方法)或数据压缩,因为现实生活中产生的数据是越来越多,数据压缩技术可以帮助我们对数据进行存储和分析。

特征降维是无监督学习的另一个应用,目的有 2:(1)我们会经常在实际项目中遭遇特征维度非常之高的训练样本,而往往又无法借助自己的领域知识人工构建有效特征;(2)在数据表现方面,我们无法用肉眼观测超过三个维度的特征。因此,特征降维不仅仅重构了有效的低纬度特征,同时也为数据展现提供了可能。在特征降维技术中 PCA 主成分分析是最为经典和实用的特征降维技术,在图像识别方面表现的也很突出。

1、特征降维的目的

1.1为什么要进行数据降维?

通常处理的数据是多维的,算法的时间复杂度与维数成指数级增加。维数达上千万维,称为维数灾难,往往就需要进行降维处理。

1.2、数据降维的作用

数据降维:
* 1.使数据集更容易使用
* 2.降低算法的计算开销
* 3.去除噪声
* 4.减轻过拟合
* 5.易于获取有价值的信息

2、降维方法

这里写图片描述
这里写图片描述

如果我们对领域特征比较熟悉,可以对特征加权,可以说特征加权是一种保留或删除特征的办法。特征越重要,所赋予的权值就越大,而不太重要的特征赋予较小的权值。该法在很多模型中均使用了,如 svm 中对每一个特征都赋予了一个权值。

(2)特征提取:用变换(映射)的方法,把原始特征变换为较少的新特征。 由原始数据创建新的特征集称为特征提取。比如照片的集合,按照照片是否包含人脸分类提取一些特征。如下图所示。

这里写图片描述

喜欢就点赞评论+关注吧

这里写图片描述

感谢阅读,希望能帮助到大家,谢谢大家的支持!

猜你喜欢

转载自blog.csdn.net/qq_41455420/article/details/79859622