Python实现按某一列关键字分组,并计算各列的平均值,并用该值填充该分类该列的nan值。
DataFrame数据格式
以下是数据存储形式:
fillna方式实现
- 按照industryName1列,筛选出业绩
- 筛选出相同行业的Series
- 计算平均值mean,采用fillna函数填充
- append到新DataFrame中
- 循环遍历行业名称,完成2,3,4步骤
factordatafillna = pd.DataFrame() industrys = newfactordata1.industryName1.unique() for ind in industrys: t = newfactordata1.industryName1 == ind a = newfactordata1[t].fillna(newfactordata1[t].mean()) factordatafillna = factordatafillna.append(a)