数据挖掘-概念与技术1

1. 数据

1 数据对象与属性类型

属性

  1. 标称属性

  2. 二元属性(布尔属性)

  3. 序数属性

  4. 数值属性

    1. 区间标度属性

    2. 比率标度属性

  5. 离散属性与连续属性

 2. 数据的基本统计描述

  1. 中心趋势度量:均值、中位数和众数

  2. 度量数据分布:极差、四分位数、方差、标准差和四分位数极差

  3. 数据的基本统计描述的图形显示

3. 数据可视化

  1. 基于像素的可视化技术

  2. 几何投影可视化技术

  3. 基于图符的可视化技术

  4. 层次可视化技术

  5. 可视化复杂对象和关系

4. 度量数据的相似性和相异性

  1. 数据矩阵和相异性矩阵

  2. 标称属性的临近矩阵

  3. 二元属性的临近矩阵

  4. 数值属性的相异性:闵可夫斯基距离

  5. 序数属性的临近性度量

  6. 混合属性的相异性

  7. 余弦相似性

猜你喜欢

转载自www.cnblogs.com/Moriarty12138/p/9171661.html