基于seaborn的pandas-DataFrame数据可视化

seaborn是基于DataFrame级的可视化。  matplotlib就是seaborn的底层。


import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns   
sns.set()                         #引入seaborn的set()方法设置样式,比纯用matplotlib要多了一些东西如图底的格子纹,图例和线条的变化。
rng = np.random.RandomState(0)
x = np.linspace(0, 10, 500)
y = np.cumsum(rng.randn(500, 6), 0)
plt.plot(x, y)
plt.legend('ABCDEF', ncol=2, loc='upper left')

进行统计数据可视化时, 我们通常想要的就是频次直方图和多变量的联合分布图。
还可以用 KDE 获取变量分布的平滑估计,Seaborn 通过 sns.kdeplot 实现。
用 sns.jointplot 可以同时看到两个变量的联合分布与单变量的独立分布。

对多维数据集进行可视化时, 最终都要使用矩阵图(pairplot) 。 如果想画出所有变量中任意两个变量之间的图形, 用矩阵
图探索多维数据不同维度间的相关性非常有效。直接用 sns.pairplot 即可。也可以用 sns.jointplot 画出不同数据集的联合分布和各数据本身的分布。
 

猜你喜欢

转载自blog.csdn.net/qq_42422981/article/details/83213835