数据可视化之"Research on visualization techniques in data mining"

Research on visualization techniques in data mining

Jin, Hailiang (Key Laboratory of Mine Spatial Information Technologies of State Bureau of Surveying and Mapping, Henan Polytechnic University, Jiaozuo, China); Liu, Huijie Source: Proceedings - 2009 International Conference on Computational Intelligence and Software Engineering, CiSE 2009, 2009, Proceedings - 2009 International Conference on Computational Intelligence and Software Engineering, CiSE 2009

新型可视化技术

(1)基于几何投影技术的可视化方法

基于几何投影技术的可视化方法的目标是建立多维数据集的有趣投影,从而将多维数据分析转换为分析少量兴趣维数据分析,包括散射矩阵技术,框架地图,测量地图,安德鲁斯曲线技术,平行坐标可视化技术,放射性可视化技术和侦探统计,如主成分分析、缩放尺寸。

(2)基于图像的可视化方法

基于图像的可视化技术将每个多维数据映射到图像,例如线图,图标和颜色图。 线图将两个维度映射到显示维度,其余维度映射到角度和组件长度。 该技术限制了可视化的维度数量。 图标是一些非常小的地图; 其不同特征的大小由特定变量的值决定,如针形图标,星形图标。 在星形图标中,相对于原点的不同方向对应于不同的变量; 在这些方向上投影的半径长度对应于变量的值。

(3)面向像素的可视化方法

面向像素的可视化方法将每个数据值映射到彩色像素,并在单独的窗口中表示属于每个属性的数据值。 这种方法的优点是可以一次性描述海量信息
并且不会有重叠。 不仅可以有效地保留一小部分用户感兴趣,还可以概述数据。 如果像素表示数据值,则此方法可以显示最大数据(最多1,000,000个数据值)。 诸如递归模式技术,无线电技术划分,螺旋技术和Z次序技术的可视化方法属于这种技术。

可视化技术新进展

(1)失真技术

失真技术显示高级细节中的部分数据以及低细节和许多细节级别的其他数据。 该技术提供了一种集中的方法,同时保持对数据的概述,这有利于交互式探索的过程。

(2)交互技术和协作技术

交互式可视化技术允许根据检测对象可视化动态变化,并且可以实现各种独立可视化的组合,例如交互式映射,投影和过滤,缩放,交互式链接和刷牙。 用户可以比较多个模型,充分利用不同可视化方法的优势和不同模型的描述方式。 在强调模型的某些部分时,不同关联模型的描述方式将同时在多个独立窗口中自动显示。 这些技术的一般使用可以获得比独立考虑这些可视组件更多的信息。 协同技术允许生成原始数据的描述和相应模型的许多不同描述方式,这有利于模型的比较分析。

(3)钻取技术

钻取技术意味着我们可以看到模型的一部分是从原始数据中提取出来的,并且在选择模型的一部分时可以访问它们。 例如,决策树可视化方法允许选择和钻取决策树的分支,以便用户可以访问与分支结构相关的数据,同时忽略其他数据描述。

(4)虚拟技术

虚拟技术可以将模型结果输出到虚拟设备或虚拟可视化环境,从而使用户能够留下来。 用户可以通过导航搜索有趣的信息,并获得对数据和分析的更直观的理解。 该技术可以结合人们的认知能力,使人们充分融入数据挖掘的过程。 已经提出的虚拟技术是数据立方体[7]和头盔显示器。

总结

(1)视觉技术的应用还很有限,方法也单一,主要集中在初始视图的可视化和结果(模型)。

(2)目前的数据挖掘可视化方法大致可分为以下几类。第一类由传统的可视化方法或独立于数据挖掘的算法组成。第二类描述了通过数据挖掘算法提取的模式,从而有助于更好地理解模型。第三类与各种可视化方法紧密相连在数据挖掘算法的运行过程中。算法允许用户在算法运行中引导和操纵可视化。几乎所有提出的可视化数据挖掘方法都属于第一类或第二类。因此,未来的工作包括两个方面,第一,为半结构化和非结构化数据(如Web数据和文本)的复杂信息结构开发适当的可视化挖掘方法;第二,将各种可视化方法与统计学,机器学习,运筹学,模拟技术,融入数据挖掘过程等传统方法紧密结合,结合快速自动数据挖掘算法和人脑认知能力和判断能力,提高数据挖掘可视化过程的质量和速度。最终目标是使基于计算机的可视化数据挖掘系统具有简单性,可见性,用户自治性,可靠性,可重用性和安全性,具有更好,更快,更直观的大数据资源探索能力。

猜你喜欢

转载自www.cnblogs.com/xiaomingzaixian/p/9961239.html