Python数据预处理 - 将excel文件读入矩阵matrix中 - 代码天地

Python数据预处理 - 将excel文件读入矩阵matrix中

其他 2018-08-30 11:01:17 阅读次数: 0

版权声明：转载请联系作者，获得允许后，添加链接及作者到页首 https://blog.csdn.net/weixin_40683253/article/details/81910453

机器学习中，很多算法的计算逻辑是基于数学的，免不了求特征值和特征向量这种事情，因此，在数据预处理的时候，将数据源中的数据转储成矩阵格式是很有必要的。

import numpy as np
import pandas as pd
from sklearn import preprocessing

def excel_to_matrix(path):
    table = xlrd.open_workbook(path).sheets()[0]#获取第一个sheet表
    row = table.nrows  # 行数
    col = table.ncols  # 列数
    datamatrix = np.zeros((row, col))#生成一个nrows行ncols列，且元素均为0的初始矩阵
    for x in range(col):
        cols = np.matrix(table.col_values(x))  # 把list转换为矩阵进行矩阵操作
        datamatrix[:, x] = cols # 按列把数据存进矩阵中
    #数据归一化   
    min_max_scaler = preprocessing.MinMaxScaler()
    datamatrix  = min_max_scaler.fit_transform(datamatrix)
    return datamatrix

datafile = u'E:\\pythondata\\test.xlsx'
excel_to_matrix(datafile)

运行结果：

array([[1.        , 0.13209733, 1.        ],
       [0.43478261, 0.16917729, 0.26420934],
       [0.5942029 , 0.87949015, 0.4372538 ],
       [0.60869565, 0.50405562, 0.        ],
       [0.11594203, 1.        , 0.51547552],
       [0.        , 0.        , 0.87070906]])

代码中min_max_scaler = preprocessing.MinMaxScaler()是做数据归一化用的，MinMaxScaler()默认将数据归一到 [0, 1]，这是比较常用的，但是也有一些时候是归一到 [-1, 1]，有时候是需要做数据标准化，而这些东西都在另外一篇文章中说过了，下面是链接，参考着学习吧，一起成长！

Python数据预处理 - 归一化与标准化

猜你喜欢

转载自blog.csdn.net/weixin_40683253/article/details/81910453

Python数据预处理 - 将excel文件读入矩阵matrix中

ML | Python中的数据预处理

Python数据预处理-导入Excel数据存为数组

利用Python将Excel文件读入数据库

【Python处理EXCEL】基础操作篇2：Python对EXCEL数据的预处理

数据预处理—文件读取

sklearn中的数据预处理

ML中的数据预处理

python出租车轨迹数据预处理之二——文件批量处理及try的使用

python数据预处理——Excel和txt文本的数据储存和读取

python数据预处理之将类别数据转换为数值的方法

python-dataframe数据预处理（二）之txt数据集文件合并

数据预处理：读取文件数据，并存为python数组

数据挖掘——python中pandas库的常用用法（观察数据、预处理）

如何用Python将数据预处理速度提升2至6倍？

数据预处理--sort乱序DICOM文件

机器学习中的预处理及Python实现

Python: sklearn库中数据预处理函数fit_transform()和transform()的区别

Python：sklearn数据预处理中fit(),transform()与fit_transform()的区别

深度学习中的数据预处理

深度学习中的数据预处理方法

机器学习中数据预处理的方式

sklearn 中的preprocessing数据预处理

机器学习中的数据预处理

数据挖掘中的常用预处理操作

机器学习中数据清洗&预处理

NLP中基于Bert的数据预处理

Python数据预处理

Python将数据写入excel或者txt，读入csv格式或xls文件

python操作excel读入文件

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)