missingno绘制缺失数据分布图

pip install missingno
 
import missingno as msno


无效矩阵的数据密集显示

msno.matrix(data, labels=True)

条形图,msno.bar 是列的无效的简单可视化:

msno.bar(data)

缺失性相关性热图

 missingno相关性热图措施无效的相关性:一个变量的存在或不存在如何强烈影响的另一个的存在:

msno.heatmap(data)

树状图

树形图使用层次聚类算法通过它们的无效性相关性(根据二进制距离测量)将变量彼此相加。在树的每个步骤,基于哪个组合最小化剩余簇的距离来分割变量。变量集越单调,它们的总距离越接近零,并且它们的平均距离(y轴)越接近零。

msno.dendrogram(data)

猜你喜欢

转载自blog.csdn.net/qq_15111861/article/details/86623876
今日推荐