【Data】数据归一化处理(data normalization)

其他 2018-08-29 16:01:44 阅读次数: 0

介绍 Intro
解决的问题
常用方法 Methods
- 线性归一化
- 非线性归一化
Ref

介绍 Intro

数据的归一化，就是将各路嘈杂的数据映射到一个统一的区间上，只保留相对尺度而消去背景信息，从而方便下一步处理。

常用的归一化区间有

$[0,1]$
$[-1,1]$
$[-0.5, 0.5]$
$[a,b]$ 自定义区间

解决的问题

输入的数据单位不一样，导致难以直接处理。比如给人推荐衣服，身高的参数可能是 $(1.5m, 1.8m)$ , 而体重的参数可能是 $(40kg,100kg)$ , 这两个数据就需要归一化之后再做下一步处理
数据变化区间不同，对模型的影响不同，比如 $x_1 \in (-200, 5000)$ 和 $x_2 \in (10,16)$ 相比，前者对模型的影响显著大于后者。
将 $y'$ 与 $y$ 对应起来。模型的输出 $y'$ 可能是 $(0.1, 0.5)$ , 而 ground truth 中的 $y$ 可能是 $(120, 280)$ ，需要把二者对应起来。

常用方法 Methods

线性归一化

将 $x \in (\min, \max)$ 映射到 $(a,b)$ 区间，其操作为

x^{'} = \frac{x - min}{max - min} \times (b - a) + a

$x' = \frac {x - \min}{\max - \min} \times (b - a) + a$

非线性归一化

使用归一化函数

sigmoid
tanh

Ref

CNN神经网络层次分析

猜你喜欢

转载自blog.csdn.net/baishuo8/article/details/81944268

【Data】数据归一化处理(data normalization)

归一化（Normalization）

Python: data normalization

图像归一化normalization

归一化（Batch Normalization）

Normalization

批归一化Batch Normalization

图像强度归一化Intensity normalization

批归一化（Batch Normalization）

批量归一化（BN: Batch Normalization)

批归一化(Batch Normalization)

批量归一化(Batch Normalization)

Spectral Normalization 谱归一化

批归一化（Batch Normalization，BN）

Pytorch 批量归一化（Batch Normalization）

数据标准化/归一化normalization

机器学习-数据归一化方法（Normalization Method）

数据标准化 (data normalization) 的原理及实现 (Python sklearn)

数据正规化 (data normalization) 的原理及实现 (Python sklearn)

数据的标准化（normalization）

tensorflow实践-batch normalization（一）

数据预处理：独热编码（One-Hot Encoding）均值、方差与协方差矩阵矩阵论：向量范数和矩阵范数再谈机器学习中的归一化方法（Normalization Method） Sigmod/Softmax变换 Scikit-learn：数据预处理Preprocessing data

机器学习之特征归一化（normalization）

局部响应归一化LRN(Local Response Normalization)理解

机器学习------批归一化（Batch Normalization, BN）

批归一化Batch Normalization的原理及算法

局部响应归一化（Local Response Normalization）

局部响应归一化（Local Response Normalization，LRN）

CNN 中的BN（batch normalization）“批归一化”原理

【深度学习】批归一化（Batch Normalization）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)