2020年Python数据分析学习笔记之Pandas数据获取与保存（六）

1、数据读取（csv文件）

（如果读取的是excel文件，则只需将csv换成excel即可，相关参数与csv参数使用相同）

import os
import pandas as pd
print(os.getcwd())      # 路径读取
# >>>  F:\Python\自学部分

# 读取文件
df = pd.read_csv('预测结果.csv',encoding='utf-8', nrows=10) 
# nrows=10  只读取前10行数据     
# 如果读取的是excel文件，则只需将csv换成excel即可，相关参数与csv参数使用相同
 

print(df)    # 打印数据

运行结果

2、数据读取（excel文件）

import os
import pandas as pd
print(os.getcwd())      # 路径读取
# >>>  F:\Python\自学部分

# 读取文件
df = pd.read_excel('score.xlsx',encoding='utf-8')

print(df)

运行结果：

批量读取多个工作页：

import os
import pandas as pd
print(os.getcwd())      # 路径读取
# >>>  F:\Python\自学部分

# 读取文件
df = pd.read_excel('score.xlsx',encoding='utf-8')

sheet_name = ['score' + str(i) for i in range(1,4)]
print(sheet_name)
data_all = pd.DataFrame()
for i in sheet_name:
    data = pd.read_excel('score.xlsx',encoding='gbk',sheet_name=i)
    data_all = pd.concat([data_all,data],axis = 0,ignore_index = True)

print(data_all)

运行结果：

3、数据保存

import os
import pandas as pd
print(os.getcwd())      # 路径读取
# >>>  F:\Python\自学部分

# 读取文件
df = pd.read_excel('score.xlsx',encoding='utf-8')

sheet_name = ['score' + str(i) for i in range(1,4)]
print(sheet_name)
data_all = pd.DataFrame()
for i in sheet_name:
    data = pd.read_excel('score.xlsx',encoding='gbk',sheet_name=i)
    data_all = pd.concat([data_all,data],axis = 0,ignore_index = True)


#  保存数据为CSV文件格式
print(data_all.to_csv('data_all.csv',index=False,encoding='utf-8'))

#  保存数据为EXCEL文件格式
print(data_all.to_excel('data_all.xlsx',index=False,encoding='utf-8'))

结果展示：

4、na_values函数讲解：

import os
import pandas as pd
print(os.getcwd())      # 路径读取
# >>>  F:\Python\自学部分

# 读取文件
df = pd.read_csv('预测结果.csv',encoding='utf-8', nrows=10, na_values=118.0,header=0)
# nrows=10  只读取前10行数据    na_values=118.0   将数据中为118.0的数据读为缺失值
# header=0   将数据第一行作为表头

print(df)    # 打印数据

运行结果：

5、数据读取相关参数介绍：

import os
import pandas as pd
print(os.getcwd())      # 路径读取
# >>>  F:\Python\自学部分

# 读取文件
df = pd.read_csv('预测结果.csv',encoding='utf-8', nrows=10, na_values=118.0)
# nrows=10  只读取前10行数据    na_values=118.0   将数据中为118.0的数据读为缺失值

# print(df)    # 打印数据

print(df.head(5))     # 输出前5行数据

print(df.tail(5))     # 打印最后5行数据

print(df.dtypes)      # 输出每一列的数据类型

运行结果展示：

2020年Python数据分析学习笔记之Pandas数据获取与保存（六）

1、数据读取（csv文件）

2、数据读取（excel文件）

3、数据保存

4、na_values函数讲解：

5、数据读取相关参数介绍：

猜你喜欢