Pandas---实现SQL中分组排序 - 代码天地

Pandas---实现SQL中分组排序

其他 2018-12-24 01:44:17 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/wendaomudong_l2d4/article/details/84818133

hive中经常会用到row_number这个函数，比如取用户第n次购买，前n次购买记录等等。那么python中如何实现呢？直接看个例子即可

下面是a、b两个用户购买的记录，user为用户名，amount为消费金额，要去按照user分组，组内按照amount降序排序，并且新增一列标识序号

import pandas as pd
df = pd.DataFrame({'user':['a','a','a','b','b'],'amount':[21,11,31,32,42]})
df

	user	amount
0	a	21
1	a	11
2	a	31
3	b	32
4	b	42

下面构建辅助函数:
这个函数两个功能，一个是提供分组排序的功能
另外提供部分聚合函数的功能

import pandas as pd
def test_f(df,column,istopn = False,n=1):
    """
    df:数据框
    column:为需要对之聚合的列
    istopn:返回每一组的第n行数据
    """
    count = len(df)
    distinct_count = df[column].nunique()
    sum = df[column].sum()
    avg = df[column].mean()
    if istopn == True:
        # 降序生序，自己注意
        # df.sort_values(by=column, ascending=False)[:n] # 返回前n个
        temp_data = df.sort_values(by=column, ascending=False)
        temp_data['row'] = range(len(df))
        return temp_data
    else:
        return pd.DataFrame({'count':[count],'distinct_count':[distinct_count],'sum':[sum],'avg':[avg]})

df_sort = df.groupby(['user']).apply(test_f,column = 'amount',istopn = True)
df_sort

		user	amount	row
user
a	2	a	31	0
	0	a	21	1
	1	a	11	2
b	4	b	42	0
b	3	b	32	1

改变行索引

df_sort.index = range(len(df_sort))
df_sort

	user	amount	row
0	a	31	0
1	a	21	1
2	a	11	2
3	b	42	0
4	b	32	1

后面对row这一列进行筛选，即可.

2018-12-105 于南京市栖霞区紫东创业园

猜你喜欢

转载自blog.csdn.net/wendaomudong_l2d4/article/details/84818133

Pandas---实现SQL中分组排序

Pandas---排序sort_values

Pandas---取子集

[sql]sql中分组查询/union/join

oracle中分组排序函数用法

Oracle 中分组排序取值的问题

Pandas分组与排序

Pandas---合并merge &concat

SQL中分组查询的执行次序

sql 实现先分组再排序

sql中实现先排序后分组

pandas多级分组如何排序

Pandas---汇总和频数统计

SQL数据排序与分组

SQL分组排序

SQL - 分组排序

sql查询语句中分组添加小计，GROUPING的使用

sql server中分组合并列值

hive中使用标准sql实现分组内排序

mysql -- 先排序再分组的sql语句实现

mysql先分组再排序的sql语句实现

SQL实现group by 分组后组内排序

mysql数据库使用sql实现分组排序

SQL 和 Java 代码，分别实现分组排序

pandas dataframe 按生肖分组统计排序

Pandas四、Grouping(分组)和Sorting(排序)

Python 教学 | Pandas 分组聚合与数据排序

分组排序的功能实现

mysql实现分组排序

java实现分组排序

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)