[python]读取csv/excel数据,对文件数据归一化,将数据写入文件

import pandas as pd
from sklearn import preprocessing

//读入数据
# df = pd.read_excel('test.xlsx',sheet_name='test')     #这一句读取到excel文件数据
df = pd.read_csv('data.csv')                            #想要读取的文件数据
data = df.iloc[0:101, 0:8].copy().values        #0:101, 0:8想要读的行0到101行,和0到8列
print(data)                                             #展示读到的数据

//开始归一化
min_max_scaler = preprocessing.MinMaxScaler()           #归一化到0-1
X_train_minmax = min_max_scaler.fit_transform(data)
print(X_train_minmax)                                   #归一化之后结果

//将数据写入csv文件
df = pd.DataFrame(X_train_minmax)                       #类型问题,没有这一句报错
df.to_csv('data_new.csv')                               #将处理后的数据写入文件

说明:

1.读入数据、归一化、写入文件三部分可以拆开,按需使用

2.这里归一化使用的是0-1归一化,还有其他,归一化方法如z-score

3.读取CSV文件或者excel一般都读不到第一行,第一行默认为列标签

3.写入csv文件时,最开始直接写的df_to.csv,报错,查阅发现是类型问题,查阅的链接如下,具体解决方法已经截图。该回复最后一行应该是df不是dt,具体参照我上面写的代码即可。

说明1.如何把python计算的结果输出到.csv,'numpy.ndarray' object has no attribute 'to_csv‘-Python-CSDN问答

猜你喜欢

转载自blog.csdn.net/qq_46073783/article/details/127548792