数据分析中的变量解释

1.数值变量Numerical Variables

数值型变量(metric variable)是说明事物数字特征的一个名称,其取值是数值型数据。如“产品产量”、“商品销售额”、“零件尺寸”、“年龄”、“时间”等都是数值型变量,这些变量可以取不同的数值。数值型变量根据其取值的不同,又可以分为离散型变量连续型变量。在计算机中可识别的字符,一般都对应有一个ASCII码,ASCII码为数值型的数据。ASCII码值的改变,对应的字符也会改变。所以,非数值型的数据,本质上也是数值型的数据。为了接近人的思维习惯,方便程序的编写,计算机高级语言,划分了数据的类型:数值型数据有:整型 单精度型 双精度型。非数值类型数据有:字符型 或 布尔型 或者 字符串型

1.1离散型变量Discrete Features

离散变量指变量值可以按一定顺序一一列举,通常以整数位取值的变量。
离散变量的概率分布,常用的有二项分布、泊松(Poisson)分布。其余的还有两点分布、几何分布、超几何分布等概率分布。

1.2连续型变量

在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。
连续变量的概率分布,常用的有指数分布、均匀分布、正态分布等等。

例子:

离散变量:

1、书中的印刷错误数。

2、新德里的交通事故数量。

3、个人兄弟姐妹的数量。

连续变量:

1、一个人的身高

2、一个人的年龄

3、公司赚取的利润。

猜你喜欢

转载自blog.csdn.net/guoguozgw/article/details/129259538