数据挖掘笔记一【不定期更新】 - 代码天地

数据挖掘笔记一【不定期更新】

其他 2019-04-06 10:41:08 阅读次数: 0

#matplotlib中的小技巧

1.无法显示中文和负号（乱码）

#coding:utf-8

import matplotlib.pyplot as plt

plt.rcParams['axes.unicode_minus']=False #用来正常显示负号

plt.rcParams['axes.unicode_minus']=False #用来正常显示负号

#有中文出现的情况，需要u'内容'

2.独立数字转到one-hot

import numpy as np
from keras.datasets import mnist
from keras.utils import np_utils

# X shape (60,000 28x28), y shape (10,000, )
(X_train,y_train),(X_test,y_test)=mnist.load_data()
y_train = np_utils.to_categorical(y_train, num_classes=10)
y_test = np_utils.to_categorical(y_test, num_classes=10)

print(y_train[:3])
"""
[[ 0.  0.  0.  0.  0.  1.  0.  0.  0.  0.]
 [ 1.  0.  0.  0.  0.  0.  0.  0.  0.  0.]
 [ 0.  0.  0.  0.  1.  0.  0.  0.  0.  0.]]#变成了one hot 形式（即哪个位置正确哪个位置就是1）

3,将二维数组用图表现出来

import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
data=np.clip(np.random.randn(5,5),-1,1) #生成随机数据,5行5列,最大值1,最小值-1
fig = plt.figure()
# 第一个子图,按照默认配置
ax = fig.add_subplot(111)
ax.imshow(data)

4.图像数据白化

像数据预处理：在mnist的例子中，所有图像都是使用的原始像素值（从0到255）。在机器学习中，对于输入的特征做归一化（normalization）处理是常见的套路。而在图像分类的例子中，图像上的每个像素可以看做一个特征。在实践中，对每个特征减去平均值来中心化数据是非常重要的。在这些图片的例子中，该步骤意味着根据训练集中所有的图像计算出一个平均图像值，然后每个图像都减去这个平均值，这样图像的像素值就大约分布在[-127, 127]之间了。下一个常见步骤是，让所有数值分布的区间变为[-1, 1]。零均值的中心化是很重要的，等我们理解了梯度下降后再来详细解释。

猜你喜欢

转载自blog.csdn.net/qq_36440163/article/details/70257103

数据挖掘笔记一【不定期更新】

面试数据库笔记不定期更新

Python 学习笔记(不定期更新~)

Golang 学习笔记（不定期更新）

前端学习笔记（不定期更新）

js学习笔记--不定期更新

git 日常笔记（不定期更新）

数据分析/数据挖掘/数据开发【笔试题经验】【不定期更新】

书单（不定期更新）

不定期更新的作业

菜鸟教程PHP学习笔记（不定期更新）

C#学习笔记和技巧，不定期更新

小程序和PHP学习笔记 ----- 不定期更新。

Keras 文档阅读笔记（不定期更新）

RT-Thread|【学习笔记，不定期更新】

Android驱动笔记（3）——adb（不定期更新）

Systemctl 学习笔记(不定期更新中)

投资理财入门笔记【不定期更新编辑】

Python高级编程笔记（不定期更新）

我的Vim学习笔记（不定期更新）

数据库常用高级用法(不定期更新)

数据库常规操作【不定期更新】

预处理数据时，需要用到的一些方法（不定期更新）

关于前端的一些随笔(不定期更新)

编程的一些思想【不定期更新】

PyCharm 的一些设置，不定期更新

网络杂记（不定期更新）

注意事项，不定期更新

Linux学习收藏--不定期更新

Linux学习(不定期更新~)

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)