F02_案例一_成为领导的秘诀.ipynb
练习中遇到的问题记录如下:
以上代码输出结果,是统计入职年份的个数如图1。
用EXCEL透视表(出生年份筛选不为空)验算了,得出来的值不一样?
因为EXCEL统计“
年份”为“
2000”共208个数据,其中包含了2000年卸任的数据!所以Python运行出来的答案是正确的
# 年龄情况: 入职年龄分布 /
图1
图2
图1
图2
#计算入职年龄数据 df_yearmin=data_age_re[['党委书记姓名','年份']].groupby(data_age_re['党委书记姓名']).min() print('-----------入职年龄分布------------------') print(df_yearmin.head()) print('-----------计算入职年龄数据------------------') df2 = df_yearmin['年份'].groupby(df_yearmin['年份']).count() print(df2) print('-----------计算卸任年龄数据------------------') data_age_max=data_age_re[['党委书记姓名','年份']].groupby(data_age_re['党委书记姓名']).max() df3=data_age_max['年份'].groupby(data_age_max['年份']).count() print(df3.head())以上代码Python运行结果如下: