Pandas之去除重复项函数drop_duplicates() - 代码天地

Pandas之去除重复项函数drop_duplicates()

其他 2018-10-31 20:11:06 阅读次数: 0

一、drop_duplicates函数用途

pandas中的drop_duplicates()函数可以通过SQL中关键字distinct的用法来理解，根据指定的字段对数据集进行去重处理。

二、drop_duplicates()函数的具体参数

用法：
DataFrame.drop_duplicates(subset=None, keep=‘first’, inplace=False)
参数说明

参数	说明
subset	根据指定的列名进行去重，默认整个数据集
keep	可选{‘first’, ‘last’, False}，默认first，即默认保留第一次出现的重复值，并删去其他重复的数据，False是指删去所有重复数据。
inplace	是否对数据集本身进行修改，默认False

三、drop_duplicates用法举例

根据指定字段进行去重，保留第一次出现的数据

import pandas as pd
#创建数据框
df=pd.DataFrame({
    'a':[1,2,4,3,3,3,4],
    'b':[2,3,3,4,4,5,3]
})
print('去重前：\n',df)

#根据字段a进行去重，保留第一次出现的数据
df.drop_duplicates(['a'],keep='first',inplace=True)
print('去重后：\n',df)

>>>
去重前：
    a  b
0  1  2
1  2  3
2  4  3
3  3  4
4  3  4
5  3  5
6  4  3
去重后：
    a  b
0  1  2
1  2  3
2  4  3
3  3  4

猜你喜欢

转载自blog.csdn.net/MsSpark/article/details/83451491

Pandas之去除重复项函数drop_duplicates()

Pandas之drop_duplicates：去除重复项

pandas使用drop_duplicates去除DataFrame重复项

pandas使用drop_duplicates去除DataFrame重复项参数

pandas使用drop_duplicates去除DataFrame重复项参数详解

pandas drop_duplicates

pandas drop_duplicates()函数去重

pandas 去重函数 drop_duplicates() 和选取重复行函数 duplicated()

【pandas】[5] DataFrame通过drop_duplicates()函数找出重复的行

Pandas 数据重复处理 duplicated()和drop_duplicates()

Pandas drop_duplicates的inplace属性

pandas.DataFrame.dropna | drop_duplicates

pandas中drop_duplicates用法

pandas包 —— drop()、sort_values()、drop_duplicates()

pandas中的drop_duplicates和duplicated的应用

pandas dataframe去除重复数据pandas.DataFrame.drop_duplicates

判断dataframe是否有重复行索引或列索引和drop_duplicates用法

dataframe去重 drop_duplicates

pandas去除列重复项

python3中的drop_duplicates函数（对数据进行去重处理）

pandas之drop函数

Pandas数据处理/drop_duplicates()/映射map()/replace()/rename()/分箱/过滤异常值/随机抽样take()/random.permutation()

【python】详解pandas dataframe 去重函数 pandas.DataFrame.drop_duplicates

pandas去重保留前一条或后一条 drop_duplicates、打乱列表顺序 random.shuffle()的使用方法、pandas 按行遍历Dataframe

Pandas详解九之Drop丢弃指定轴的项

python TypeError: drop_duplicates() got an unexpected keyword argument 'take_last'

leetcode Remove Duplicates from Sorted Array 有序数组去除重复项

pandas的drop函数

pandas drop()函数用法

pandas去除重复列

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)