python_pandas DAY_18(4)分组计算 - 代码天地

python_pandas DAY_18(4)分组计算

编程语言 2020-01-27 11:03:03 阅读次数: 0

学习内容
pandas分组计算
Tips：分组求和步骤
1）分组
2）应用
3）合并
重点
1.一般分组

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randint(10, 20, (4, 2)),
                  index=['a', 'b', 'c', 'd'],
                  columns=["one", "two"])
print(df)
print(df["one"].groupby(df['two']))#这个关键字分组只能按列分组
   one  two
a   11   12
b   16   14
c   15   16
d   12   13
<pandas.core.groupby.generic.SeriesGroupBy object at 0x00000297773CDC50>


print(df["one"].groupby(df['two']).mean())
two
11    14
14    16
15    15
17    14
Name: one, dtype: int32

2.按字典表分组

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randint(10, 20, (4, 3)),
                  index=['a', 'b', 'c', 'd'],
                  columns=["one", "two", 'three'])
df.iloc[1, 1:3] = np.NaN
mapping={'a':'red','b':'red','c':'blue','d':'white'}
grouped=df.groupby(mapping,axis=0)
print(grouped.sum())
       one   two  three
blue    15  10.0   10.0
red     35  12.0   18.0
white   17  13.0   12.0

3.通过函数分组

import pandas as pd
import numpy as np


def group_by(idx):
    print(idx)
    return idx


df = pd.DataFrame(np.random.randint(10, 20, (4, 3)),
                  index=['a', 'b', 'c', 'd'],
                  columns=["one", "two", 'three'])
print(df)
print(df.groupby(group_by).size())
   one  two  three
a   17   10     14
b   10   16     10
c   12   16     14
d   17   17     13
a
b
c
d
a    1
b    1
c    1
d    1

4.通过索引级别分组

df.groupby(level="关键字"，axis= )
#这里的level可以是一级索引也可以是二级索引，但是如果索引选择行索引，那么axis必须是列，不然无法进行分组

发布了33 篇原创文章 · 获赞 0 · 访问量 668

私信关注

猜你喜欢

转载自blog.csdn.net/soulproficiency/article/details/104091096

python_pandas DAY_18(4)分组计算

python_pandas DAY_18（1）

python_pandas DAY_18(2)

python_pandas DAY_18(3) pandas索引

python_pandas DAY_20(1)时间重采样

python_pandas DAY_19(3)时间数据

python_pandas DAY_19(1)聚合运算

python_Pandas用法大全

Python_pandas包中series的基本使用

python_pandas中的get_dummies使用

Python_pandas实现excel工作表合并功能

Python_pandas不是熊猫(2)——DataFrame、Series的排序操作

【Python_Pandas】reset_index() 函数解析

python_pandas操作-数值上下滑动一个格

Python_pandas不是熊猫(3)——Series自定义运算Series.apply()

Python_pandas：读取CSV文件、查找指定列和单元格、解决NaN问题

Python科学计算库Pandas分组

Python科学计算：Pandas

Python之Pandas（4）

Python入门 —— Pandas Day4【转载】

python pandas 聚合与分组函数

day_18 常用模块，time，datatime，calendar，os，sys

Python科学计算之Pandas

Python pandas库 ->groupby分组操作

Python-pandas对excel筛选(分组)查询

Python 教学 | Pandas 分组聚合与数据排序

Pandas - 数据的聚合与分组计算

Python科学计算之Pandas!Pandas可是神级框架！

python-pandas-numpy DAY_17

Python入门：pandas——自学（day 2）

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)