python小技巧(四)数据可视化问题

数据可视化是数据科学或机器学习项目中十分重要的一环。常见的5种基础的数据可视化方法:
1.散点图;
2.线图;
3.直方图;
4.条形图;
5.箱型图。

1.热力图(Heat Map):是数据的一种矩阵表示方法,其中每个矩阵元素的值通过一种颜色表示。不同的颜色代表不同的值,通过矩阵的索引将需要被对比的两项或两个特征关联在一起。热力图非常适合于展示多个特征变量之间的关系,因为你可以通过颜色知道该位置上的矩阵元素的大小。通过查看热力图中的其他点,你还可以看到每种关系与数据集中的其他关系之间的比较。颜色是如此直观,因此它为我们提供了一种非常简单的数据解释方式。

2.二位密度图(2D Density Plot)是一维版本密度图的直观扩展,相对于一维版本,其优点是能够看到关于两个变量的概率分布。例如,在下面的二维密度图中,右边的刻度图用颜色表示每个点的概率。我们的数据出现概率最大的地方(也就是数据点最集中的地方)。

3.蜘蛛网图(Spider Plot):是显示一对多关系的最佳方法之一。换而言之,你可以绘制并查看多个与某个变量或类别相关的变量的值。在蜘蛛网图中,一个变量相对于另一个变量的显著性是清晰而明显的,因为在特定的方向上,覆盖的面积和距离中心的长度变得更大。如果你想看看利用这些变量描述的几个不同类别的对象有何不同,可以将他们并排绘制。

4.树状图(Tree Diagram):树状图是自然而直观的,这使得他们容易被解释。直接相连的节点关系密切,而具有多个连接的节点则不太相似。

发布了57 篇原创文章 · 获赞 3 · 访问量 2401

猜你喜欢

转载自blog.csdn.net/yang_jianfeng/article/details/105376114
今日推荐