【pandas】[5] DataFrame通过drop_duplicates()函数找出重复的行 - 代码天地

【pandas】[5] DataFrame通过drop_duplicates()函数找出重复的行

其他 2020-10-19 11:01:48 阅读次数: 0

1、构建测试数据

import pandas as pd
df = pd.DataFrame({'k1' : ['a1','a2','a1','b1','b2'],
    'k2' : ['c1','d1','c1','c2','d2'],
    'data' : [10,100,20,30,300]})
print(df)

   k1  k2  data
0  a1  c1    10
1  a2  d1   100
2  a1  c1    20
3  b1  c2    30
4  b2  d2   300

2、使用drop_duplicates()函数找出重复的行

###找出k1列的重复数据
df_tmp1 = df.drop_duplicates(subset=['k1'])
df_tmp2 = df.drop_duplicates(subset=['k1'], keep=False)
df_tmp3 = pd.concat([df_tmp1, df_tmp2], axis = 0)
df_tmp4 = df_tmp3.drop_duplicates(subset=['k1'], keep=False)
print(df_tmp4)

   k1  k2  data
0  a1  c1    10

至此。通过drop_duplicates函数找出了k1列含有重复数据的值。如果不是想找某一列含有重复的数据，而是整行都重复的话。在第2步的代码中无需subset=['k1']即可

猜你喜欢

转载自blog.csdn.net/xiezhen_zheng/article/details/105352913

【pandas】[5] DataFrame通过drop_duplicates()函数找出重复的行

pandas使用drop_duplicates去除DataFrame重复项

pandas使用drop_duplicates去除DataFrame重复项参数

pandas 去重函数 drop_duplicates() 和选取重复行函数 duplicated()

Pandas之去除重复项函数drop_duplicates()

pandas.DataFrame.dropna | drop_duplicates

pandas drop_duplicates()函数去重

pandas drop_duplicates

pandas使用drop_duplicates去除DataFrame重复项参数详解

Pandas之drop_duplicates：去除重复项

Pandas 数据重复处理 duplicated()和drop_duplicates()

Pandas drop_duplicates的inplace属性

pandas中drop_duplicates用法

pandas包 —— drop()、sort_values()、drop_duplicates()

pandas dataframe去除重复数据pandas.DataFrame.drop_duplicates

pandas去重保留前一条或后一条 drop_duplicates、打乱列表顺序 random.shuffle()的使用方法、pandas 按行遍历Dataframe

pandas中的drop_duplicates和duplicated的应用

【python】详解pandas dataframe 去重函数 pandas.DataFrame.drop_duplicates

判断dataframe是否有重复行索引或列索引和drop_duplicates用法

5 pandas模块，DataFrame类

dataframe去重 drop_duplicates

pandas.DataFrame.drop_duplicates 用法说明

Pandas的5个高效函数

pandas DataFrame(5)-合并DataFrame与Series

pandas DataFrame apply()函数(1) pandas DataFrame applymap()函数 pandas数组(pandas Series)-(5)apply方法自定义函数 pandas的qcut()方法

Python中pandas dataframe删除一行或一列：drop函数

Python pandas dataframe删除一行或一列: drop函数

Python中pandas dataframe删除一行或一列:drop函数详解

5 pandas之DataFrame简单实用2

pandas中DataFrame通过行选择数据

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)