pandas对连续值进行识别,并根据连续值的变化，设置递增标签 - 代码天地

pandas对连续值进行识别,并根据连续值的变化，设置递增标签

企业开发 2023-10-02 19:23:13 阅读次数: 0

情况一：某一列连续值变化无重复

如下所示，GROUP列依次由 123，456，767 依次变化，后面没有出现前面出现过的值

  A   B   C   GROUP
0   abc a   1   123
1   abc a   1   123
2   abc a   1   123
3   xyz a   1   123
4   xyz a   2   123
5   abc z   5   456
6   abc z   5   456
7   abc z   5   456
8   xyz p   9   767
9   xyz p   9   767
10  xyz p   9   767
11  xyz q   9   767

对于这种情况，首先使用下面代码判断该列前后两个值是否重复，若后面一个值与前面重复，则返回True：

df['GROUP'].duplicates()

上述显示结果：

False
True
True
True
False
。。。

对上诉代码取非：

~df['GROUP'].duplicates()

累计求和：

(~df['GROUP'].duplicates()).cumsum()

情况二：某一列连续值变化重复

ddd['change'] = (ddd['A'] != ddd['A'].shift()).cumsum()

shift()函数表示将数据列向下偏移，ddd[‘A’] != ddd[‘A’].shift() 表示比较前后两条数据是否相同，相同则表示重复。

猜你喜欢

转载自blog.csdn.net/qq_44881930/article/details/130946246

pandas对连续值进行识别,并根据连续值的变化，设置递增标签

自增长字段值的连续递增实现

对连续型数据，用pandas和plt进行折线图分析

连续值与缺失值

Excel表格数据非连续二同值识别

用kmeans split 连续值

【203】连续型的最值

Mysql分数排名（连续值）

根据自动连续递增编号修改时间

pandas设置值、更改值

(11)对连续图像的高效扫描

lintcode 3650 · 绝对连续数

SQL面试题3：怎么对连续数据进行归类?case when、if

Pandas设置值

Pandas DataFrame设置值

通过RCpp计算连续值的信息增益

关于连续值离散化[MODL]

决策树模型、本质、连续值

CART分类树连续值的处理

序列中连续值之间的差值列表

JS去重-删除连续重复的值

用kmeans split 连续值（2）

如何查找不连续的id值

二值图片连续区域检测

决策树—连续值处理

RMQ（连续相同最大值）

求和连续子数组最小值

js获取字符中连续的值

决策树-连续值处理代码

决策树-连续值处理代码

今日推荐

周排行

解析ReentrantLock实现原理

面试之非技术

第三周助教点评

《阅读-拖延心理学》

第二章使用 kind 一分钟搭建 k8s 集群

2018福大软工实践第五次作业

Day2.基本条件语句

抢占物联网入口，“腾讯云小微”将和AliGenie互怼

IO流的输入输出

vSphere 7.0初体验

每日归档

更多

2024-06-12(0)

2024-06-11(0)

2024-06-10(0)

2024-06-09(0)

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)