本次使用的安装包
import pandas as pd
import numpy as np
from collections import Counter
def discrete(k,b):
a=Counter(k[b])
c=list(a.keys())
for i in range(len(list(a.keys()))):
c[i]=k[k[b]==list(a.keys())[i]]
return(c)
假设数据长这样
我们需要把数据按照部门归类,按部门生成dataframe。
基于以上目的
我们使用代码需要统计:
1、有多少部门
2、不同部门分别有多少列
3、部门生成dataframe
使用如下代码:
def discrete(k,b): #k是dataframe b是需要统计的字段
a=Counter(k[b])
c=list(a.keys())
for i in range(len(list(a.keys()))):
c[i]=k[k[b]==list(a.keys())[i]]
return(c)
#输出的c是一个复杂的dataframe
如果想知道,每一个dataframe具体是什么部门的话
可以输入
c[i] #i代表你想看的列数
进行查看
此处为财务管理部的列表
输出内容样例如下