关于在python中如何使用pandas库读取excel表格后 删除含有空值的列

在使用pandas读入相关的excel后,若是表格中有空值的列,要如何清洗呢
在查阅了网上的相关的资料后,得到了办法

pandas.dropna(axis=1,how=‘any’)

axis=0指行,若是参数中不写,则是默认为axis=0,
axis=1则是指列

how=‘any’则是指只要列中含有一个空值,就删除该列
how='all’则是代表只有一整列为空值,才删除该列

需要注意的是在python3.7的版本里
使用pandas.dropna需要有一个变量来接收返回值
否则在运行程序的时候 不会报错 但数据也不会发生改变


再写一些pandas库中关于excel表格的操作

#encoding=gb18030
import numpy
import pandas as pd
data_filename = "data/data21695/数据.xlsx"
df = pd.read_excel(data_filename)
x = df.dropna(axis=1,how='any')
g=df["编号"]
y = len(g)
i=0
print(y)
del x["无机盐"]
x["无敌"]=x["身高"]
for i in range(y):
    x.iloc[i,0]=i

x.to_excel('new.xlsx')

pandas.read_excel 读入excel表格

del[‘无机盐’] 删除名为无机盐的列

x[‘无敌’]=x[‘身高’] 添加一列名为无敌,将身高这一列的数据复制到无敌这一列

x.iloc[i,0] 获取第i行,第0列的数据

x.to_excel 导入至名为new.xlsx的excel表格中

扫描二维码关注公众号,回复: 9379621 查看本文章
发布了2 篇原创文章 · 获赞 1 · 访问量 79

猜你喜欢

转载自blog.csdn.net/weixin_43209227/article/details/104482630