pandas 数据预处理实例演示

泰坦尼克-全员存活经典分析案例

●查看数据

●找出年龄未知的人的个数

●求年龄均值 ---.mean()函数亦可

●用循环的方法,通过船票等级定位船票价格从而得到三种等级船票的均值

●分析船舱等级和是否存活的关系,发现船舱等级越高存活概率越大

●分析船舱等级和所住人员年龄的关系,发现年龄越大住的船舱等级越高,不指定aggfunc,默认为均值

●分析三个上岸地点的花费总数和生存指标

●去除空值

●找指定值

●对年龄进行排序

●函数的定义以及调用,查看每列的空值个数

●数据替换

●对年龄离散化,并求两个年龄段的获救概率


猜你喜欢

转载自www.cnblogs.com/nnadd/p/12616814.html