Python Pandas GroupBy

 global root
        # 合并Excel表格
        filearray = []
        filelocation = glob.glob(root + "\*.xls")
        for filename in filelocation:
            filearray.append(filename)
        res = pd.read_excel(filearray[0])
        for i in range(1, len(filearray)):
            A = pd.read_excel(filearray[i])
            res = pd.concat([res, A], ignore_index=False, sort=True)
        # 分组统计排序
        # 通过reset_index()函数将groupby()的分组结果转成DataFrame对象
        #1.groupby(["宝贝标题"] :groupby统计文档中"宝贝标题"同样的行出现了多少次.
        #2.groupby(["宝贝标题"])["宝贝总数量"]..sum() :计算分组中宝贝总数量的和
        #3.res.groupby(["宝贝标题"])["宝贝总数量"].sum().reset_index() 重置列名字
        print(res.groupby(["宝贝标题"])["宝贝总数量"].sum())
        df = res.groupby(["宝贝标题"])["宝贝总数量"].sum().reset_index()
        df1 = df.sort_values(by='宝贝总数量', ascending=False)
        self.textEdit.setText(str(df1))
        # 调用SaveExcel函数,将统计排行结果保存到Excel
        SaveExcel(df1, self.rButton2.isChecked())

记录一下,以后有统计数据业务的时候看看

猜你喜欢

转载自www.cnblogs.com/guomeng888/p/11437867.html