2020年Python数据分析学习笔记之Pandas数据获取与保存(六)

目录

1、数据读取(csv文件)

2、数据读取(excel文件)

3、数据保存

4、na_values函数讲解:

5、数据读取相关参数介绍:

 


  

1、数据读取(csv文件)

(如果读取的是excel文件,则只需将csv换成excel即可,相关参数与csv参数使用相同)

import os
import pandas as pd
print(os.getcwd())      # 路径读取
# >>>  F:\Python\自学部分

# 读取文件
df = pd.read_csv('预测结果.csv',encoding='utf-8', nrows=10) 
# nrows=10  只读取前10行数据     
# 如果读取的是excel文件,则只需将csv换成excel即可,相关参数与csv参数使用相同
 

print(df)    # 打印数据

运行结果

2、数据读取(excel文件)

import os
import pandas as pd
print(os.getcwd())      # 路径读取
# >>>  F:\Python\自学部分

# 读取文件
df = pd.read_excel('score.xlsx',encoding='utf-8')

print(df)

运行结果:

批量读取多个工作页:

import os
import pandas as pd
print(os.getcwd())      # 路径读取
# >>>  F:\Python\自学部分

# 读取文件
df = pd.read_excel('score.xlsx',encoding='utf-8')

sheet_name = ['score' + str(i) for i in range(1,4)]
print(sheet_name)
data_all = pd.DataFrame()
for i in sheet_name:
    data = pd.read_excel('score.xlsx',encoding='gbk',sheet_name=i)
    data_all = pd.concat([data_all,data],axis = 0,ignore_index = True)

print(data_all)

运行结果:

3、数据保存

import os
import pandas as pd
print(os.getcwd())      # 路径读取
# >>>  F:\Python\自学部分

# 读取文件
df = pd.read_excel('score.xlsx',encoding='utf-8')

sheet_name = ['score' + str(i) for i in range(1,4)]
print(sheet_name)
data_all = pd.DataFrame()
for i in sheet_name:
    data = pd.read_excel('score.xlsx',encoding='gbk',sheet_name=i)
    data_all = pd.concat([data_all,data],axis = 0,ignore_index = True)


#  保存数据为CSV文件格式
print(data_all.to_csv('data_all.csv',index=False,encoding='utf-8'))

#  保存数据为EXCEL文件格式
print(data_all.to_excel('data_all.xlsx',index=False,encoding='utf-8'))

结果展示:

4、na_values函数讲解:

import os
import pandas as pd
print(os.getcwd())      # 路径读取
# >>>  F:\Python\自学部分

# 读取文件
df = pd.read_csv('预测结果.csv',encoding='utf-8', nrows=10, na_values=118.0,header=0)
# nrows=10  只读取前10行数据    na_values=118.0   将数据中为118.0的数据读为缺失值
# header=0   将数据第一行作为表头

print(df)    # 打印数据

运行结果:

5、数据读取相关参数介绍:

import os
import pandas as pd
print(os.getcwd())      # 路径读取
# >>>  F:\Python\自学部分

# 读取文件
df = pd.read_csv('预测结果.csv',encoding='utf-8', nrows=10, na_values=118.0)
# nrows=10  只读取前10行数据    na_values=118.0   将数据中为118.0的数据读为缺失值

# print(df)    # 打印数据

print(df.head(5))     # 输出前5行数据

print(df.tail(5))     # 打印最后5行数据

print(df.dtypes)      # 输出每一列的数据类型

运行结果展示:

 

猜你喜欢

转载自blog.csdn.net/weixin_44940488/article/details/106794977