数据预处理-机器学习 - 代码天地

数据预处理-机器学习

其他 2019-05-09 23:01:18 阅读次数: 0

参考文章：https://blog.csdn.net/marsjhao/article/details/70213749

常见的数据预处理流程：去除唯一属性，处理缺失值，特征编码，数据标准化正则化，特征选择，主成分分析；

特征编码：

# 度热编码 (one-hot encoding) :

　　用N位的状态寄存器对N个可能的值进行编码，每个状态由一位寄存器表示，每个时刻只有一位寄存器有效；

　　独热编码的优点：能够处理非数值属性；在一定程度上扩充了特征；编码后的属性是稀疏的，存在大量的零元分量；

正则化：

标准化：

数据标准化是将样本的属性缩放到某个指定的范围。

数据标准化的原因：

某些算法要求样本具有零均值和单位方差；

需要消除样本不同属性具有不同量级时的影响：①数量级的差异将导致量级较大的属性占据主导地位；②数量级的差异将导致迭代收敛速度减慢；③依赖于样本距离的算法对于数据的数量级非常敏感。

归一化：

对数据的数值范围进行特定缩放，但不改变其数据分布的一种线性特征变换；

1.min-max 归一化：将数值范围缩放到（0,1）,但没有改变数据分布；

2. z-score 归一化：将数值范围缩放到0附近, 但没有改变数据分布；

标准化：

对数据的分布的进行转换，使其符合某种分布（比如正态分布）的一种非线性特征变换；

比如：box-cox 标准化；

猜你喜欢

转载自www.cnblogs.com/robin2ML/p/10841547.html

机器学习数据预处理

机器学习--数据预处理

数据预处理-机器学习

机器学习 —— 数据预处理

机器学习—数据预处理

机器学习：数据预处理

机器学习之数据预处理

机器学习-数据预处理（Python实现）

python 机器学习之数据预处理

机器学习sklearn—数据的特征预处理

机器学习-常见的数据预处理

机器学习中数据预处理的方式

机器学习初探---数据预处理

【机器学习】数据预处理与特征工程

机器学习系列--数据预处理

机器学习预备-Pandas数据预处理

Python机器学习之数据预处理

机器学习一：数据预处理

机器学习——数据特征预处理

机器学习中的数据预处理

机器学习-数据预处理(Data Preprocessing)

机器学习中数据清洗&预处理

机器学习1-数据预处理

机器学习的典型例子-数据预处理

机器学习#数据划分与预处理

机器学习：数据预处理之LabelBinarier()

[机器学习 03] 数据预处理-sklearn

机器学习之数据预处理——降噪

机器学习——数据的预处理（总结大全）

机器学习 | 机器学习100天(1) --- 数据预处理

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)