数据科学导论课程笔记(二):数据可视化

数据可视化是一项致力于把抽象的数据或概念转化为适于人类理解和接受的视觉化的信息的技术。是一个典型的交叉学科,涉及计算机科学,认知心理学,美学和艺术设计等学科,涉及数据处理、算法设计和软件开发和人机交互等多种知识和技能。可视化是一种以图像、图表或动画的形式进行有效信息传递的技术。它的主要目的在于,作为载体和媒介有效地传递信息。它可以发挥人类视觉的感知能力,从而帮助人们更好地理解数据当中蕴含的信息。通常来说,人们对抽象概念的处理能力并不是十分强大。可视化技术可以能够最大化人类在视觉认知方面的优势,将分析和决策从盲人摸象转变为看图说话和按图索骥。
人们在识别物体时,易受已存在事物的影响,并利用经验知识来进行辅助判断,还能在目标识别中利用潜意识对不完整的部分进行自动填充。常用的视觉表示包括位置,长度,梯度,面积,体积,形状,色调,饱和度,对比度,纹理等,在使用时需要对如何选择合适的视觉表示进行认真的思考。
我们在做数据分析工作的时候,除了要关注发掘一般性的规律,对一些例外和异常的数据也不要轻易忽视,应该做进一步的思考和探究。可以把目的地根据相互之间的距离进行分组,类似于数据挖掘中的层次型聚类,从而形成一个树状的结构,进而减少根节点上的分支个数,最终利用结构化的思想提升Flow Map的表达能力。
将表格转化为图形的技术,称之为Mosaic Plot。当人们利用数据进行分析和决策的时候,并不需要得到非常精确的计算结果。在实际工作中,可视化技术应与数据的特点和应用的需求紧密结合。
几种高维数据的可视化技术。对于高维数值型属性,可以使用二维坐标图,雷达图和平行坐标图表示。可视化架起了人与数据之间沟通的桥梁,有助于发挥人类专家的领域知识和主观能动性。同时,可视化贯穿于从对原始数据的直观描述到对数据挖掘过程的理解,再到对数据分析结果的展示,这一完整的过程,是数据科学不可或缺的一部分。二维坐标图
雷达图
平行坐标图

猜你喜欢

转载自blog.csdn.net/not__only/article/details/81808201