第四十九篇入门机器学习——数据归一化（Feature Scaling） - 代码天地

第四十九篇入门机器学习——数据归一化（Feature Scaling）

其他 2018-07-18 21:54:41 阅读次数: 0

No.1. 数据归一化的目的

数据归一化的目的，就是将数据的所有特征都映射到同一尺度上，这样可以避免由于量纲的不同使数据的某些特征形成主导作用。

No.2. 数据归一化的方法

数据归一化的方法主要有两种：最值归一化和均值方差归一化。

最值归一化的计算公式如下：

最值归一化的特点是，可以将所有数据都映射到0-1之间，它适用于数据分布有明显边界的情况，容易受到异常值（outlier）的影响，异常值会造成数据的整体偏斜。

均值方差归一化的计算公式如下：

均值方差归一化的特点是，可以将数据归一化到均值为0方差为1的分布中，不容易受到异常值（outlier）影响。

No.3. 向量和矩阵的最值归一化

向量的最值归一化

矩阵的最值归一化

No.4. 向量和矩阵的均值方差归一化

向量的均值方差归一化

矩阵的均值方差归一化

No.5. sklearn中对数据集归一化的流程

扫描二维码关注公众号，回复： 2229748 查看本文章

No.6. 使用鸢尾花数据集进行数据归一化

No.7. 简单实现一个自己的StandardScaler类

No.8. 机器学习流程回顾：

首先我们需要将数据集分成训练数据集和测试数据集两部分；对于kNN这种算法，我们需要保证数据在同一尺度下，因此要进行数据的归一化，训练数据集通过一个Scaler进行数据的归一化；将归一化后的数据进行训练，训练过程中要使用网格搜索来寻找最好的超参数，训练后得到最终的模型；之后，对于测试数据集，需要使用相同的Scaler进行归一化，然后送进用训练数据集得到的模型，得到模型分类的准确度，这样就可以确定训练数据集得到的模型的优劣。

猜你喜欢

转载自www.cnblogs.com/xuezou/p/9332763.html

第四十九篇入门机器学习——数据归一化（Feature Scaling）

数据特征归一化(Feature Scaling)学习及实现

feature scaling

【WPF学习】第四十九章基本动画

KNN-距离-数据归一化 Feature Scaling

06-数据归一化（Feature Scaling）

（一）线性回归与特征归一化(feature scaling)

C++第四十九篇 -- 将一个项目Copy到另一台电脑

浅谈Feature Scaling

特征缩放（feature scaling）

特征缩放 feature scaling

第四十九篇复数的概念

【Python入门第四十九天】Python丨NumPy 数组拆分

python学习第四十九天：CSS3新增

python学习第四十九天XML模块的用法

风炫安全WEB安全学习第四十九节课靶场的搭建与实战

Python学习笔记第四十九天(NumPy 矩阵库(Matrix))

机器学习中的特征缩放（feature scaling）

【读书笔记】Feature Scaling （特征缩放）：归一化、标准化、中心化

理解normalization||Standardization||Feature scaling

第四十九章

可视化特征缩放（Feature Scaling）

第四十九篇 socket套接字编程

Spark -- 数据的特征缩放(Feature scaling)

AWS Auto Scaling (Amazon Auto Scaling)学习笔记

DataScience：深入探讨与分析机器学习中的数据处理之线性变换—标准化standardization、归一化Normalization/比例化Scaling的区别与联系

第一阶段：JAVA 快速入门（第四十九课：JAVA_if-else if-else多选择结构）

IT 数据方体：足迹第四十九步：数据方体的定义和针对数据方体的操作步骤

孤荷凌寒自学python第四十九天继续研究跨不同类型数据库的通用数据表操作函数

【剑指offer】第四十九题(丑数) 和第五十题(第一个只出现一次的字符)

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)