F02_案例一_成为领导的秘诀,统计入职年份分布结果与EXCEL透视表结果不一致

F02_案例一_成为领导的秘诀.ipynb
练习中遇到的问题记录如下:


以上代码输出结果,是统计入职年份的个数如图1。
用EXCEL透视表(出生年份筛选不为空)验算了,得出来的值不一样?

因为EXCEL统计“ 年份”为“ 2000”共208个数据,其中包含了2000年卸任的数据!所以Python运行出来的答案是正确的
# 年龄情况: 入职年龄分布 / 

图1

图2

#计算入职年龄数据
df_yearmin=data_age_re[['党委书记姓名','年份']].groupby(data_age_re['党委书记姓名']).min()
print('-----------入职年龄分布------------------')
print(df_yearmin.head())

print('-----------计算入职年龄数据------------------')
df2 = df_yearmin['年份'].groupby(df_yearmin['年份']).count()
print(df2)

print('-----------计算卸任年龄数据------------------')
data_age_max=data_age_re[['党委书记姓名','年份']].groupby(data_age_re['党委书记姓名']).max()
df3=data_age_max['年份'].groupby(data_age_max['年份']).count()
print(df3.head())
以上代码Python运行结果如下:

猜你喜欢

转载自blog.csdn.net/weixin_42491373/article/details/80750280