数据预处理之数据归一化 - 代码天地

数据预处理之数据归一化

其他 2020-09-07 16:02:58 阅读次数: 0

转载来自ufldl.stanford.edu/wiki/index.php/数据预处理

一、简单缩放

分为：最大值缩放和均值缩放

在简单缩放中，我们的目的是通过对数据的每一个维度的值进行重新调节（这些维度可能是相互独立的），使得最终的数据向量落在[0,1]或[− 1,1]的区间内（根据数据情况而定）。

例子:在处理自然图像时，我们获得的像素值在[0,255]区间中，常用的处理是将这些像素值除以255，使它们缩放到[0,1]中。

二、逐样本均值消减(也称为移除直流分量)

如果你的数据是平稳的（即数据每一个维度的统计都服从相同分布），那么你可以考虑在每个样本上减去数据的统计平均值(逐样本计算)。

例子：对于图像，这种归一化可以移除图像的平均亮度值(intensity)。很多情况下我们对图像的照度并不感兴趣，而更多地关注其内容，这时对每个数据点移除像素的均值是有意义的。

注意：虽然该方法广泛地应用于图像，但在处理彩色图像时需要格外小心，具体来说，是因为不同色彩通道中的像素并不都存在平稳特性。

例如

Caffe demo 里头的 classification_demo.m脚本文件中对原始数据有这样的处理

im_data = im_data - mean_data;

三、特征标准化(使数据集中所有特征都具有零均值和单位方差)

特征标准化的具体做法是：首先计算每一个维度上数据的均值（使用全体数据计算），之后在每一个维度上都减

去该均值。下一步便是在数据的每一维度上除以该维度上数据的标准差。

简单的说就是：减去原始数据的均值再除以原始数据的标准差

例子

x
= [ones(m, 1), x];

%x包括2个特征值和1个偏置项，所以矩阵x的规模是 x:[mX3]

sigma
= std(x);%X的标准差；

mu
= mean(x);%X的均值；

x(:,2)
= (x(:,2) - mu(2))./ sigma(2);

x(:,3)
= (x(:,3) - mu(3))./ sigma(3);

猜你喜欢

转载自blog.csdn.net/u012751110/article/details/51103958

数据预处理之归一化

数据预处理之数据归一化

数据预处理--归一化

数据预处理-归一化

数据归一化预处理

Python数据预处理--数据归一化

Python数据预处理 - 归一化与标准化

数据预处理——归一化标准化

数据预处理之中心化和归一化

机器学习之数据预处理——归一化，标准化

特征工程（3）-数据预处理归一化

MATLAB数据预处理-归一化-mapminmax

数据预处理：数值特征归一化

数据预处理归一化详细解释

python之sklearn常见数据预处理归一化方式解析

Scikit-learn 数据预处理之归一化MinMaxScaler

【机器学习】 - 数据预处理之数据归一化(标准化)与实战分析，正则化

一、数据预处理——数据归一化 & 数据标准化

Python数据预处理-数据标准化（归一化）及数据特征转换

数据预处理之中心化（零均值化）与标准化（归一化）

使用sklearn进行数据预处理 —— 归一化/标准化/正则化

使用sklearn数据预处理 —— 归一化/标准化/正则化

Python数据预处理—归一化，标准化，正则化

使用sklearn实现数据预处理 —— 归一化/标准化/正则化

关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化

数据预处理——标准化、归一化、正则化

利用sklearn对数据预处理：标准化，归一化，正则化

Matlab中的数据预处理-归一化（mapminmax）与标准化（mapstd）

数据预处理-归一化与z-score标准化

【实战】数据预处理练习----标准化/归一化/独热化

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)