认识数据-数据对象与数据类型

什么是属性

属性(attribute)是一个数据字段,表示数据对象的一个特征。
数据仓库 - 维
机器学习 - 特征
统计学家 - 变量
数据挖掘 - 属性

标称属性

标称属性(nominal attribute)的值是一些符号或事务名称。
通常用于分类,在计算机科学中也被看成是枚举的。
标称属性值并不具有有意义的序,并且不是定量的,因此,给定一个数据集,找出这种属性的均值、中位数 没有意义。
然而有意义的书该属性常出现的值,,–众数。

二元属性(布尔属性)

二元属性(binary attribute)分对称的和非对称的,区分方式看两种状态的权重价值。

序数属性

序数属性(ordinal attribute)其可能的值之间具有意义的序或秩评定(ranking),但是相继值之间的差是未知的。
序数属性的中心趋势可以用他的众数和中位数表示,但不能定义均值。

注意 标称、二元、序数属性都是定性的。

数值属性

数值属性(numeric attribute)是定量的。
1. 区间标度属性 (interval-scaled)– 这种属性允许我们比较和定量评估值之间的差。
2. 比率标度属性 (ratio-scaled) –具有零点的数值属性。

离散属性和连续属性

猜你喜欢

转载自blog.csdn.net/xiaocajiyyd/article/details/78746286