02-pandas-读取文件

读取文件


import pandas as pd  # 引入pandas模块

#####################
# People = pd.read_excel(r'F:\Python\py\1\Pandas_Excel_30\People.xlsx')      # 使用read_excel方法读取02.excel文件
# print(People.shape)                           # 使用shape方法输出02.excel的维度(行列)数据,比如有19972行6列运行后会输出19972, 6
# print(People.columns)                        # 使用columns方法查看sheet第一行每列标题的数据
# print(People.head(3))                            # 使用head查看默认前5行数据,后面括号内可指定行数
# print('=======================================================================')      # 分隔符便于观看
# print(People.tail(3))                  # 使用tail方法查看后三行数据
###################

# People = pd.read_cexl(r'F:\Python\py\1\Pandas_Excel_30\People1.xlsx ',header=1) # 读取People1内容,
#                           # 由于此文件第一行有无效内容head读取默认从0行开始,所以我们给文件路径后面加header=1把值指定为1
#
# print(People.columns)     # 上面改好了下面运行columns方法查看sheet第一行每列标题的数据就会正常了
##########################################

# 如果打开文档后第一行是空的没有数据head会自动跳过并正确识别

# 下面是文档内没有head的人为处理的方式
# 如果第二行代码不设定head运行的话就会自动生成column为012345
# People = pd.read_excel(r'F:\Python\py\1\Pandas_Excel_30\People1.xlsx', header=None)  #
# # 上面的写法是将header值设为None(没有的意思)这样读的时候就不会有head了
#
# People.columns = ('ID', 'Type', 'Title', 'FirsName', 'MiddkeName', 'LastName')  # 使用columns方法给第一行写入数据就会正常读取heade了
#
# # People = People.set_index('ID')       #方法一使用set_index生成一个新的DateFrame赋值于Peop变量引用
# People.set_index('ID', inplace=True)  # 最优方法二使用set_index方法后面加上inplac=True参数直接修改当下DateFrame不生成新的
#
# print(People.columns)                                            # 打印查看修改后所读取的head
# People.to_excel(r'F:\Python\py\1\Pandas_Excel_30\People1.xlsx')  # 保存修改并覆盖People1文档
# print('Done!')


########################################################


df = pd.read_excel(r'F:\Python\py\1\Pandas_Excel_30\People1.xlsx', index_col='ID')
# 上面代码每次使用pd.read_excel读取这里路径后面不加参数就会自动生成indx,所以就需要在读取时人为使用index_col=指定已有indx那一列的值
df.to_excel(r'F:\Python\py\1\Pandas_Excel_30\People2.xlsx')     #输出保存
print(df.head())             #查看head
print('Done!')                #打印完毕

猜你喜欢

转载自blog.csdn.net/m0_50970375/article/details/126825700
今日推荐