机器学习入门（四）：特征工程——特征降维 - 代码天地

机器学习入门（四）：特征工程——特征降维

其他 2021-03-22 19:55:07 阅读次数: 0

特征工程
一.为什么需要特征工程？
因为“数据和特征决定机器学习的上限，而模型和算法只是逼近这个上限而已”，使用专业背景知识和技巧处理数据，使算法变得更好。
二.什么是特征工程
sklearn库用于做特征工程
pandas库用来做数据清洗、数据处理。

特征降维

定义：降低特征的个数（降低列数），得到一组“不相关”的主变量得过程

方法一：特征选择
         1.Filter（过滤式）：主要探究特征本身特点、特征与特征和目标值之间得关联
                  ①方差选择法：低方差特征过滤
                  ②相关系数法：衡量特征与特征之间的相关程度
         2.Embedded（嵌入式）：算法自动选择特征（特征与目标值之间的关联）
                  ①决策树：信息熵、信息增益
                  ②正则化：L1、L2
                  ③深度学习：卷积等

特征选择定义：数据中心包含冗余或相关变量，旨在原有特征中找出主要特征
1.Filter（过滤式）
       ①方差选择法：低方差特征过滤
       原理：特征的方差小，说明某个特征的样本值比较相似，则删掉低方差特征；特征的方差大，说明某个特征的样本值差别大，则保留高方差特征。
在这里插入图片描述
         ②相关系数法

当特征与特征之间相关系数很高时：
（1）保留其中一个
（2）加权求和
（3）主成分分析

方法二：主成分分析（PCA）

在这里插入图片描述
例如：给定五个点，画到明面直角坐标系中，是个二维的，我们使用主成分分析给降到一维：

案例：探究用户对物品类别的喜好细分降维

在这里插入图片描述
处理流程：

读取四个表：

将ueser_id和aisle_id合并：

找到ueser_id和aisle_id之间的关系：

取前一万个数据。由于0太多了，冗余太多了，进行PCA降维：

猜你喜欢

转载自blog.csdn.net/qq_45234219/article/details/114821567

机器学习入门（四）：特征工程——特征降维

[机器学习]特征工程：特征降维

机器学习基础之《特征工程（4）—特征降维》

【机器学习】特征降维

机器学习-特征降维

【机器学习】特征降维-特征选择

机器学习特征工程之数据降维

【机器学习之特征工程】数据预处理、特征选择、降维及不平衡处理

机器学习基础之《特征工程（5）—特征降维—案例》

Python机器学习及实践——特征降维

机器学习（七）特征降维

07 特征工程 - 特征降维 - PCA

特征工程——数据降维

特征工程之降维

【特征工程】数据降维

面向机器学习的特征工程六、降维：用 PCA 压缩数据集

机器学习（四）降维之NMF及人脸特征提取

机器学习笔记——降维（特征提取）

机器学习算法（九）特征降维——PCA 与 LDA

机器学习15-特征降维PCA

机器学习实践（五）—sklearn之特征降维

【机器学习】特征降维-主成分分析

【机器学习】特征降维 - 方差选择法VarianceThreshold

【机器学习】特征降维 - 主成分分析PCA

简单粗暴理解与实现机器学习之聚类算法（六）：【特征工程】-特征降维、特征选择、主成分分析(PCA)、案例

四、机器学习中的特征工程

机器学习（四）特征工程介绍

机器学习入门（三）：特征工程——特征预处理

机器学习入门（二）：特征工程——特征抽取

机器学习—特征工程

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)