机器学习练习（二）——标准化Normalization - 代码天地

机器学习练习（二）——标准化Normalization

其他 2018-08-16 10:20:56 阅读次数: 0

由于资料的偏差与跨度会影响机器学习的成效，因此正规化(标准化)数据可以提升机器学习的成效。

一、数据标准化

from sklearn import preprocessing #标准化数据模块
import numpy as np

#建立Array
a = np.array([[10, 2.7, 3.6],
              [-100, 5, -2],
              [120, 20, 40]], dtype=np.float64)

#将normalized后的a打印出
print(preprocessing.scale(a))
# [[ 0.         -0.85170713 -0.55138018]
#  [-1.22474487 -0.55187146 -0.852133  ]
#  [ 1.22474487  1.40357859  1.40351318]]

二、数据标准化对机器学习结果的影响

# 标准化数据模块
from sklearn import preprocessing 
import numpy as np

# 将资料分割成train与test的模块
from sklearn.model_selection import train_test_split

# 生成适合做classification资料的模块
from sklearn.datasets.samples_generator import make_classification 

# Support Vector Machine中的Support Vector Classifier
from sklearn.svm import SVC 

# 可视化数据的模块
import matplotlib.pyplot as plt

#生成具有2种属性的300组数据
X, y = make_classification(
    n_samples=300, n_features=2,
    n_redundant=0, n_informative=2, 
    random_state=22, n_clusters_per_class=1, 
    scale=100)

#可视化数据
plt.scatter(X[:, 0], X[:, 1], c=y)
plt.show()

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
clf = SVC()
clf.fit(X_train, y_train)
print(clf.score(X_test, y_test))
# 0.477777777778 预测前准确率

标准化后X，y都被压缩到了差不多大小的范围

X = preprocessing.scale(X)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
clf = SVC()
clf.fit(X_train, y_train)
print(clf.score(X_test, y_test))
# 0.9  标准化后准确率

猜你喜欢

转载自blog.csdn.net/yueguizhilin/article/details/77711625

机器学习练习（二）——标准化Normalization

机器学习中的标准化方法(Normalization Methods)

标准化(Normalization)

数据的标准化（normalization）

机器学习练习题（二）

深度学习基础（六）—— 批标准化 (Batch Normalization)

理解深度学习中Batch Normalization批标准化

深度学习-批标准化（Batch Normalization）

深度学习 ——> Batch Normalization ——> 批标准化

深度学习——批标准化Batch Normalization

normalization (标准化或者正则化)

机器学习中的数据标准化

sklearn normalization 数据标准化

TensorFlow批标准化（Batch Normalization）

批标准化 (Batch Normalization)

Batch Normalization（批标准化）

批标准化 Batch Normalization

Batch normalization批标准化的理解

Sklearn——对数据标准化(Normalization)

转: 批标准化Batch Normalization

层标准化详解（Layer Normalization）

Batch normalization（批量标准化）

机器学习练习(一)

吴恩达机器学习练习二

机器学习练习二——GAN算法生成图像

normalization 批标准化(batch normalization)理解

批标准化（Batch Normalization）、Tensorflow实现Batch Normalization

DataScience：深入探讨与分析机器学习中的数据处理之线性变换—标准化standardization、归一化Normalization/比例化Scaling的区别与联系

深度学习基础--正则化与norm--Layer Normalization 即层标准化

机器学习之标准化和归一化

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)