python笔记20:数据处理之数据分组 - 代码天地

python笔记20:数据处理之数据分组

其他 2019-01-18 10:41:03 阅读次数: 0

# -*- coding: utf-8 -*-
#概念：数据分组，根据数据分析对象的特征，按照一定的数值指标，把数据分析对象划分为不同的区间进行研究，以揭示
#其内在的联系和规律性

#cut函数：cut(series,bins,right=True,labels=NULL)
#series:需要分组的序列数据
#bins:划分数组（如何定义划分数组是重点）
#right：分组的时候，右边是否闭合，默认闭合
#labels:分组的自定义标签，可以不自定义

#返回值：分组结果的序列，列名即上述的自定义标签

import pandas

data = pandas.read_csv("D:/workspaces/python/pythonStudy/20.csv",sep="|")

#分析消费金额的分布情况：
#定义分组区间：
bins = [
min(data.cost)-1,20,40,60,80,100,max(data.cost)+1
]

#问：分组区间中，最小值和最大值为什么要分别减一和加一？
#答：因为分组的时候有可能会碰上边界值（即需要分组的数据和我们的最小值或最大值相等），这可能会导致找不到范围

#开始分组（左开右闭）：
data["cut"] = pandas.cut(
data.cost,
bins
)
#查看分组结果，可以看到如果我们不自定义标签，那么python给我们生成的默认标签是数据的范围表达式

#左闭右开：
data["cut"] = pandas.cut(
data.cost,
bins,
right=False
)

#自定义分组标签：
labels = [
          '20以下','20到40','40到60','60到80','80到100','100以上'
          ]
#开始分组
data["cut"] = pandas.cut(
    data.cost,
    bins,
    labels = labels
)

猜你喜欢

转载自blog.csdn.net/aiyo92/article/details/86535498

python笔记20:数据处理之数据分组

python 数据处理笔记

Python数据处理笔记

python笔记6:数据处理之导入数据

python笔记7:数据处理之导出数据

20 python数据处理numpy

python笔记9:数据处理之缺失值处理

python笔记18:数据处理之简单计算

python笔记17:数据处理之字段匹配

python笔记16:数据处理之字段合并

python笔记15:数据处理之记录合并

python笔记14:数据处理之随机抽样

python笔记13:数据处理之记录抽取

python笔记12:数据处理之字段拆分

python笔记11:数据处理之字段抽取

python笔记10:数据处理之去除空格

《Python数据处理》9.1.6创建分组笔记：NameError：name text_type is not defined

python numpy和pandas的聚合分组数据处理及分析

大数据处理之专题笔记

数据处理笔记

python学习笔记（一）数据处理

Python之DataFrame数据处理

python数据处理之numpy

python爬虫之json数据处理

Python 之Excel 数据处理

Python之数据处理案例

python 数据处理之滤波

python数据处理

Python --数据处理

python的数据处理

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)