python进行数据处理——pandas的drop函数(收藏) - 代码天地

python进行数据处理——pandas的drop函数(收藏)

其他 2018-07-12 10:39:55 阅读次数: 0

删除表中的某一行或者某一列更明智的方法是使用drop，它不改变原有的df中的数据，而是返回另一个dataframe来存放删除后的数据。

清理无效数据

df[df.isnull()]  #返回的是个true或false的Series对象（掩码对象），进而筛选出我们需要的特定数据。 df[df.notnull()]  
df.dropna()     #将所有含有nan项的row删除 df.dropna(axis=1,thresh=3)  #将在列的方向上三个为NaN的项删除 df.dropna(how='ALL')        #将全部项都是nan的row删除
 
 
  
  1
  
  2
  
  3
  
  4
  
  5
  
  6

此处：print( data.dropna()) 和 print(data[data.notnull()]) 结果一样

填充无效值

df.fillna(0) df.fillna({1:0, 2:0.5})         #对第一列nan值赋0，第二列赋值0.5 df.fillna(method='ffill')   #在列方向上以前一个值作为值赋给NaN
 
 
  
  1
  
  2
  
  3

drop函数的使用

（1）drop函数的使用：删除行、删除列

print(frame.drop(['a']))print(frame.drop(['Ohio'], axis = 1))
 
 
  
  1
  
  2

drop函数默认删除行，列需要加axis = 1

（2）drop函数的使用：inplace参数

采用drop方法，有下面三种等价的表达式：

DF= DF.drop('column_name', axis=1)； DF.drop('column_name',axis=1, inplace=True) DF.drop([DF.columns[[0,1, 3]]], axis=1, inplace=True)   # Note: zero indexed
 
 
  
  1
  
  2
  
  3

注意：凡是会对原数组作出修改并返回一个新数组的，往往都有一个 inplace可选参数。如果手动设定为True（默认为False），那么原数组直接就被替换。也就是说，采用inplace=True之后，原数组名（如2和3情况所示）对应的内存值直接改变；

而采用inplace=False之后，原数组名对应的内存值并不改变，需要将新的结果赋给一个新的数组或者覆盖原数组的内存位置（如1情况所示）。

（3）drop函数的使用：数据类型转换

df['Name'] = df['Name'].astype(np.datetime64)
 
 
  
  1

DataFrame.astype() 方法可对整个DataFrame或某一列进行数据格式转换，支持Python和NumPy的数据类型。

猜你喜欢

转载自www.cnblogs.com/nxf-rabbit75/p/9298110.html

python进行数据处理——pandas的drop函数(收藏)

python进行数据清理之pandas中的drop用法

python进行数据处理与分析

利用python数据分析——Numpy基础：通用函数、利用数组进行数据处理

python遍历文件进行数据处理

Python学习 | Numpy 利用数组进行数据处理

python数据预处理：使用pandas 进行数据清洗

python 数据处理对txt文件进行数据处理

python 数据处理对csv文件进行数据处理

利用数组进行数据处理

使用PyTorch进行数据处理

【python】数据处理pandas

python数据处理pandas

Python———pandas数据处理

Python——数据处理（pandas)

基于pandas进行数据预处理

使用 pandas 进行数据预处理

python进行数据处理过程中怎么对单列进行操作（python3中get_dummies函数为例）

pandas 数据处理常用函数总结

Python数据处理(二) | Pandas数据处理

Python——pandas数据处理（python programming）

Python数据分析 | (11)利用NumPy数组进行数据处理

Python连接Oracle数据库进行数据处理操作

python自学-class23(down)-使用多线程进行数据处理的练习

python——pandas关于数据处理的库

Python 数据处理库 pandas

python pandas常用数据处理方法

【python数据处理】pandas基础操作

【python数据处理】pandas多表操作

Python数据处理工具----pandas

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)