机器学习归一化的几种方法 - 代码天地

机器学习归一化的几种方法

其他 2018-05-08 23:00:00 阅读次数: 2

数据归一化的两个好处：

1、提升模型的收敛速度
2、提升模型的精度

机器学习常见的归一化算法 :

1、 min-max 标准化(Min-max normalization)

也叫0-1标准化（0-1 normalization）:对原始数据的线性变换，是结果落到[0,1]区间，转换函数如下：

\begin{matrix} (63) & x^{n o r m a l i z a t i o n} = \frac{x - m i n}{m a x - m i n} \end{matrix}

$x^{normalization}=\frac{x-min}{max-min}$
转换代码如下：

def NormalData(x):
    return[(float(i)-min(x))/float(max(x)-min(x)) i for i in x]

如果想要把数据映射到[-1,1]，则公式将换成：

\begin{matrix} (28) & x^{n o r m a l i z a t i o n} = \frac{x - x_{m e a n}}{x_{m a x} - x_{m i n}} \end{matrix}

$x^{normalization}=\frac{x-x_{mean}}{x_{max}-x_{min}}$
转换函数如下：

import numpy as np
def NormalData(x):
    return[(float(i)-np.mean(x))/float(max(x)-min(x)) i for i in x]

这种归一化方法的缺点是：当有新数据加入时，可能导致max和min的变化，需要重新计算。

2、z-score 标准化(zero-mean normalization):也叫标准差标准化

公式如下：

\begin{matrix} (75) & x^{n o r m a l i z a t i o n} = \frac{x - μ}{σ} \end{matrix}

$x^{normalization}=\frac{x-\mu }{\sigma }$
z-score标准化方法适用于训练集的最大值和最小值未知的情况下。或有异常数据的情况下。
x-μ只改变均值，标准差不变，所以均值变为0
(x-μ)/σ只会使标准差除以σ倍，所以标准差变为1

参考网址：http://blog.csdn.net/pipisorry/article/details/52247379

猜你喜欢

转载自blog.csdn.net/xiongchengluo1129/article/details/79156032

机器学习归一化的几种方法

数据归一化,标准化的几种方法

机器学习中归一化方法

机器学习数据归一化的方法

机器学习（归一化）

机器学习归一化

机器学习-归一化

机器学习 - 归一化

机器学习常见归一化方法及实现

机器学习-数据归一化方法（Normalization Method）

几种常见的归一化方法

机器学习（一）特征归一化

【机器学习】数据归一化全方法总结：Max-Min归一化、Z-score归一化、数据类型归一化、标准差归一化等

机器学习：数据归一化（Scaler）

【机器学习笔记】数据归一化

机器学习之数据归一化

[机器学习]特征归一化

机器学习中的归一化

【A】python数据分析与机器学习实战机器学习中的归一化的方法讨论

机器学习数据预处理-标准化/归一化方法

机器学习中常见的标准化和归一化方法

数据归一化及三种方法（python）

数据归一化常用的两种方法

Spark ML包中的几种归一化方法总结

#几种归一化方法:python实现csdn

几种归一化方法的概念及python实现

机器学习-两种常用的数据归一化方法

Spark机器学习--四种归一化方法总结及图文解释

机器学习之标准化和归一化

机器学习之归一化和标准化

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)