使用python分享一下数据分组以及数据聚合运算 - 代码天地

使用python分享一下数据分组以及数据聚合运算

企业开发 2023-04-09 01:24:15 阅读次数: 0

今天分享一波python技术分析数据分组，数据分组有四种方法

方法目录

by = ‘参数’
字典
以Seri分列
以函数进行分割

首先我们导入数据

athlete_data = pd.read_csv("运动员信息表.csv", encoding='GBk')
print(athlete_data)

我们一个一个方法的来实现分组

1.by = ‘参数’

group_by_events = athlete_data.groupby(by='项目')
# print(group_by_events)
for data in group_by_events:
    print(data)

2.字典

mapping = {  # 字典的key要对应文件的列名
    '姓名': '1',
    '性别': '1',
    '出生年份(年)': '1',
    '身高(cm)': '2',
    '体重(kg)': '3',
    '项目': '4',
}
group_by_map = athlete_data.groupby(mapping, axis=1)
for data in group_by_map:
    print(data)

代码运行结果

3.以Seri分列

listl = []
for i in range(0, 179):
    listl.append(random.randint(1, 5))
se = pd.Series(listl)  # 相当于是csv的一列
print(se)
group_by_se = athlete_data.groupby(by=se)
for data in group_by_se:
    print(data)

4.以函数进行分割

print(athlete_data.index)

def group(x):
    if x % 2 == 0:
        return "偶数"
    else:
        return "奇数"


group_by_fun = athlete_data.groupby(group)
for i in group_by_fun:
    print(data)

athlete_data = pd.read_csv("运动员信息表.csv", encoding='GBK', index_col=3)
#
def age_group(age):

    # 设置年龄区间
    if 20<age<40:
        return '青年'
    elif 40<age<=55:
        return '中年'
    elif age>55:
        return '老年'
    else:
        return 'error'

group_by_fun_age = athlete_data.groupby(age_group)
for data in group_by_fun_age:
    print(data)

print(athlete_data)

通过对上述四种方法，可以选有一种符合现状的方法来分组。同时，经过分析也得出，青年大部分的项目都是，篮球，羽毛球男子现代五项，女子现代五项，铁人三项，而中年就是射击这类需要靠经验来比赛的项目。

总结

一个Python数据分组案例，主要对运动员数据进行分析，案例相关代码、Excel表、json文件等上传在我的csdn下载区中。

小郭锅在此希望对你的编程之旅有所帮助

猜你喜欢

转载自blog.csdn.net/G6_12/article/details/115874469

使用python分享一下数据分组以及数据聚合运算

数据聚合与分组运算(一)

数据聚合与分组运算

python之数据聚合及分组运算

pandas 数据聚合与分组运算

07数据聚合与分组运算

数据聚合与分组运算(四)

数据聚合与分组运算(三)

数据聚合与分组运算(二)

【数据分析】：python：GroupBy：数据聚合与分组运算

python数据分析08——pandas数据聚合与分组运算

利用Python进行数据聚合和分组运算

【Python数据分析-10】数据分组和聚合-聚合运算

pandas之数据聚合与分组运算

数据的聚合与分组运算（进阶篇）

利用python进行数据分析之数据聚合和分组运算

【利用python进行数据分析】数据聚合与分组运算

利用python对2012美国大选进行数据分析(三，数据聚合与分组运算)

Python3：Pandas的简单使用5(NaN值的处理，特殊显示值?的处理以及数据的分组和聚合)

【python数据分析】分组聚合操作

Python 教学 | Pandas 分组聚合与数据排序

《python for data analysis》第九章，数据聚合与分组运算

数据分组与聚合函数

数据聚合与分组

分组数据聚合

pandas数据聚合与分组

数据的分组和聚合

Pandas数据分组与聚合

数据聚合与分组操作

第十篇数据聚合与分组运算

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)