TensorFlow2.0之数据标准化 - 代码天地

TensorFlow2.0之数据标准化

其他 2020-03-27 09:50:49 阅读次数: 0

import tensorflow as tf
import tensorflow.keras as keras
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.preprocessing import StandardScaler

#导入数据
fashion_mnist = keras.datasets.fashion_mnist
(X_train_all, y_train_all), (X_test, y_test) = fashion_mnist.load_data()
X_valid, X_train = X_train_all[:5000], X_train_all[1000:]
y_valid, y_train = y_train_all[:5000], y_train_all[1000:]

#归一化
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train.astype(np.float32).reshape(-1,28*28)).reshape(-1,28,28)
X_valid_scaled = scaler.transform(X_valid.astype(np.float32).reshape(-1,28*28)).reshape(-1, 28, 28)


#构建模型
model = keras.Sequential([
    keras.layers.Flatten(input_shape=[28, 28]),
    keras.layers.Dense(300, activation='sigmoid'),
    keras.layers.Dense(100, activation='sigmoid'),
    keras.layers.Dense(10, activation='softmax')
])

model.compile(optimizer='sgd', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
history = model.fit(X_train_scaled, y_train, epochs=10)
print(history.history)

scaler = StandardScaler()定义一个对象用于标准化

scaler.fit_transform(X_train.astype(np.float32).reshape(-1,28*28)).reshape(-1,28,28)调用fit_transform函数，该函数由两部人份组成，第一部分是fit函数，这个函数产生了每一列的均值和标准差，存入scarler对象中，然后调用transform函数对矩阵进行标准化。而fit_transform函数是对这两个函数的整合。所以可以看到

X_valid_scaled = scaler.transform(X_valid.astype(np.float32).reshape(-1,28*28)).reshape(-1, 28, 28)直接调用transform而不是fit_transform，因为scaler中已经有相应的均值和方差了，所以以后只要直接transform就行。因为不管是对验证集还是测试集，都是用的训练集的均值和方差。

可以通过

print(scaler.mean_)
print(scaler.scale_)
查看训练集中每一列（每一个特征）的均值和标准差。

猜你喜欢

转载自www.cnblogs.com/loubin/p/12579269.html

TensorFlow2.0之数据标准化

TensorFlow2.0批标准化

Tensorflow2.0 入门与实战学习笔记（六）--批标准化&卷积神经网络（卫星图像）

标准化Keras：TensorFlow 2.0中的高级API指南

Tensorflow2.0实战（二）——分类模型之数据归一化

Pandas之数据标准化

数据预处理之标准化

Tensorflow2.0之FGSM

Tensorflow2.0之CycleGAN

tensorflow批标准化

TensorFlow2.0教程-结构化数据分类

Tensorflow2.0数据集

数据的标准化

数据标准化

十九.TensorFlow之BatchNormalization批标准化

tensorflow预处理：数据标准化的几种方法

OHDSI——数据标准化

数据的标准化（normalization）

数据标准化_1

数据标准化的方法

芯片数据标准化

数据标准化方法

数据标准化的难题

数据标准化实施

Tensorflow2.0之DeepDream（深度梦境）

Tensorflow2.0 Keras之模型装配

Tensorflow2.0之LSTM的原理与实现

Tensorflow2.0自学笔记之五

TensorFlow2.0学习二之基础

TensorFlow批标准化（Batch Normalization）

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)