版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Tyro_java/article/details/81407618
关于数据的整洁性
- 每个变量占一列
- 每个观察值占一行
- 每种观察单位是一个表格
画出条形图
- 我们可以通过 seaborn 的
countplot
函数创建基本的频率条形图:
sb.countplot(data = df, x = 'cat_var')
- 将所有长条都用相同的颜色标注,可以减少不必要的干扰, 使用 “color” 参数设置长条颜色
base_color = sb.color_palette()[0]
sb.countplot(data = df, x = 'cat_var', color = base_color)
- 对条形图的排序
base_color = sb.color_palette()[0]
cat_order = df['cat_var'].value_counts().index
# 使用 "order" 参数设置排序方式
sb.countplot(data = df, x = 'cat_var', color = base_color, order = cat_order)