Dataframe 如何去重 - 代码天地

Dataframe 如何去重

其他 2018-05-07 15:57:58 阅读次数: 6

python中的pandas模块中对重复数据去重步骤：

1）利用DataFrame中的duplicated方法返回一个布尔型的Series,显示各行是否有重复行，没有重复行显示为FALSE，有重复行显示为TRUE；

2）再利用DataFrame中的drop_duplicates方法用于返回一个移除了重复行的DataFrame。

注释：

如果duplicated方法和drop_duplicates方法中没有设置参数，则这两个方法默认会判断全部列元素都重复才返回，如果在这两个方法中加入了指定的属性名（或者称为列名），例如：frame.drop_duplicates(['state']),则仅对指定列（state列）进行重复的判断，决定是否返回改行。

具体实例如下：

[plain]view plain copy
>>> import pandas as pd  
>>> data={'state':[1,1,2,2],'pop':['a','b','c','d']}  
>>> frame=pd.DataFrame(data)  
>>> frame  
  pop  state  
0   a      1  
1   b      1  
2   c      2  
3   d      2  
>>> IsDuplicated=frame.duplicated()  
>>> print IsDuplicated  
0    False  
1    False  
2    False  
3    False  
dtype: bool  
>>> frame=frame.drop_duplicates(['state'])  
>>> frame  
  pop  state  
0   a      1  
2   c      2  
>>> IsDuplicated=frame.duplicated(['state'])  
>>> print IsDuplicated  
0    False  
2    False  
dtype: bool  
>>>   

猜你喜欢

转载自blog.csdn.net/hellocsz/article/details/79939235

Dataframe 如何去重

dataframe去重

Python中DataFrame去重

pandas.DataFrame去重

dataframe去重 drop_duplicates

python pandas dataframe 的去重函数

python pandas dataframe 去重函数

pandas中DataFrame的数据去重

Pandas玩转数据（七) -- Series和DataFrame去重

pandas之Dataframe转成dict+过滤+index去重

pandas dataframe重复数据查看.判断.去重

【python】详解pandas dataframe 去重函数 pandas.DataFrame.drop_duplicates

如何加速pandas的DataFrame

pandas数据处理实践三（DataFrame.apply、merge、rename，数据预处理、DataFrame.drop_duplicates去重）

dataframe

pandas DataFrame 中按条件筛选或去重后重新定义连续的index

【Python】DataFrame去重（不）保留重复值，取重复值

dataframe 拼接、合并、去重、查看数据规模数据预处理合辑

如何更改DataFrame列的顺序？

Python数据分析实战-将dataframe某一列的去重并统计去重后数量（附源码和实现效果）

list如何去重

如何对列表去重

excel如何去重

Python操作Mysql之追加写入Dataframe到数据库(Python/Mysql/去重更新)

Pandas 如何通过获取双(多)重索引获取指定行DataFrame数据

如何获取Dataframe的行数和列数

如何获得 Pandas dataframe 对象的行数

pandas dataframe 如何打乱数据

Pandas——如何更改DataFrame中的值

如何获取大熊猫DataFrame的行数？

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)