数据可视化之"A survey of visualization-driven interactive data mining approaches"

A survey of visualization-driven interactive data mining approaches

Ma, Yuxin (State Key Laboratory of CAD&CG, Zhejiang University, Hangzhou; 310058, China); Cao, Zhendong; Chen, Wei Source: Jisuanji Fuzhu Sheji Yu Tuxingxue Xuebao/Journal of Computer-Aided Design and Computer Graphics, v 28, n 1, p 1-8, January 1, 2016 Language: Chinese
Database:Compendex

基于可视化的交互数据挖掘方法分类

(1)基于可视化和数据挖掘的参与程度

1) +V 型方法, 指以数据挖掘为主要的知识发现和提取方法, 可视化作为数据挖掘的辅助方法;

2) +M 型方法, 指以可视化方法为主, 其中数据挖掘方法帮助完成可视化中的数据处理、可视映射部分.

如在从数据转化为可视表达的过程中, 数据挖掘方法可以帮助生成数据点在二维平面上的投影.

(2)基于用户参与形式

基于用户参与形式(types of user involvement, TUI)的分类策略. TUI 用于描述基于用户的可视化探索参与数据挖掘算法的方式, 分别由以下 2 个维度组成:

1) 信息流动方向

算法本身产生的过程描述信息形成算法对用户的反馈; 用户对算法的信息输入形成对算法的控制.

2) 目标实体

信息交换阶段, 可以是算法运行过程时进行信息交换, 或是在算法运行完毕时, 通过可视化方法查看和理解算法结果.

(3)面向应用场景的方法

可视化增强通用数据挖掘算法

(1)基于黑盒方式的可视化增强方法

在基于黑盒方式的可视化增强方法中, 可视化设计者仅根据数据挖掘算法所面向的任务进行设计, 并不考虑具体算法的内部机制, 即把算法本身当作“ 黑盒” .

1) 面向输入数据的可视化方法

用户在使用数据挖掘方法之前, 可先使用可视化方法对数据进行预探索. 这种方式有助于帮助用户获得输入数据的大致分布特征, 可以指导其后续的数据清洗、参数设定等工作. 如使用多个散点图并列排布的方式展示数据点所在的原始空间中各个维度的相关性, 用户通过观察散点图中的数据点相关度来筛选出冗余维度, 以得到不同子空间下的聚类结果.

2) 面向算法结果的可视化方法

3) 迭代式可视化方法

迭代式可视化方法帮助用户基于已有探索结果对输入参数或数据进行修改, 继而生成新的模型和输出结果, 并使用迭代策略引导用户对算法结果进行优化.

(2)基于白盒方式的可视化增强方法

在基于白盒方式的可视化增强方法中, 可视化是对算法过程本身进行展示, 使用户能够更好地理解计算结果与输入数据、参数之间的关系.

1) 决策树因其可解释性较强的特性, 在可视化界有不少针对决策树模型的可视化案例.

2) 针对支持向量机提出了基于投影的可视化方案.

3) 面向图像识别的深度神经网络可视化方法, 其使用可视化方式展示出不同层次神经元上的特征, 帮助用户进行参数调整等工作.

面向应用场景的方法

(1)文本分析

基于 LDA(latent Dirichlet allocation)的可视化文本探索方法.

(2)图像分析

加州大学伯克利分校的 deepViz系统用于可视化面向图像分类任务的深度神经网络. 该工作的出发点是卷积网络的神经元都可直接表达为图像形式, 用户可以直接看到模型内部的中间图像结果. 通过查看每层神经元所代表的特征图像, 用户可在训练过程中大致了解神经元上的特征分布, 据此对相应模型参数进行调整, 以完成模型训练快速迭代.

(3)用户行为分析

用户在同一网站上的页面浏览顺序形成用户在该网站的点击流. 针对用户点击流进行分析, 可以刻画出用户在网页间的浏览行为. 如自组织映射(self-organizing map)方法对用户点击流进行投影分析,基于可视分析的多上下文移动社交网络社团发现方法.

(4)时空数据分析

基于LDA 模型和 STL(seasonal-trend decomposition procedure based on loess smoothing)方法分别提取某时间段内的文本主题和异常关键词, 并可视化相关文本信息的地理位置和时序波动信息. 用户可以通过多种交互方式渐进式探索和发现异常文本信息, 并通过相关文本提取出事件.

猜你喜欢

转载自www.cnblogs.com/xiaomingzaixian/p/9966783.html