常用统计量和随机数生成
文章目录
常用统计量
1. 平均值
1. mean(X)
2. mean(A)
3. mean(A,dim)
- X 为向量,返回 X 中各元素平均值
- A 为矩阵,返回 A 中各列元素的平均值所构成的向量
- 在给出的维度内的中位数
2. 中位数
1. median(X)
2. median(A
3. median(A,dim)
- X 为向量,返回 X 中各元素中位数
- A 为矩阵,返回 A 中各列元素的中位数所构成的向量
- 求给出的维度内的中位数
3. 标准差、方差和极差
1. D = var(X)
2. D = var(A
3. D = var(X,1)
4. D = var(X,w)
- 若 X 为向量,则返回向量的样本方差。
- 若 A 为矩阵,则返回 A 的列向量的样本方差构成的行向量。
- 返回向量 X 的简单方差。
- 返回向量 X 的以 w 为权重的方差。
1. std(X)
2. std(x,1)
3. std(x,flag,dim)
- 返回向量 X 的样本标准差。
- 返回向量的标准差。
- 返回向量中维数为 的标准差值,其中 时置前因子为 ; 否则置前因子为 .
4. 偏度和峰度
偏度:
峰度:
偏度是反映数据对称性的量。 称为 右偏态 ,此时数据位于均值右边的比位于左边的多; 称为 左偏态 ,所反映的情况相反。 接近于 ,则可认为数据是对称的.
峰度是反映数据分布形状的量:正态分布的峰度为 ,若 比 大很多,表示样本中有较多远离均值的数据,分布有沉重的尾巴。因此,峰度可用于衡量偏离正态分布的尺度.
峰度-偏度检验又称为 检验,该检验基于数据样本的偏度和峰度,评价给定数据是否服从未知均值和方差的正态分布的假设。对于正态分布数据,样本偏度接近于 ,样本峰度接近于 .
在 中,我们使用 函数进行 检验,测试数据对正态分布的似合程度:
1. h = jbtest(X)
2. h = jbtest(X,alpha)
3. [H,P,JBSTAT,CV] = jbtest(X,alpha)
- 对输入数据向量 X 进行 检验,返回检验结果 . 若 ,则在显著性水平 下拒绝 服从正态分布的假设,若 ,则可认为 服从正态分布。
- 在显著性水平 下进行 检验。
- 函数同时返回三个其他输出: 为检验的 值, 为检验统计量, 为确定是否拒绝零假设的临界值。
随机数
下面介绍几种常用的随机数生成方法:
1 二项分布随机数
在概率论和统计学中,二项分布指 个独立的是/非试验中成功的次数的离散概率分布,其中没次试验成功的概率为 . 这样的单次成功/失败试验又称为 试验。
在 中,我们使用 函数产生二项分布随机数:
1. R = binornd(N,P)
2. R = binornd(N,P,m)
3. R = binornd(N,P,m,n)
- 为二项分布的两个参数,返回服从参数为 的二项分布的随机数,且 的形式相同。
- 是一个 向量,它为指定随机数的个数。其中 分别代表返回值 中行与列的维数。
- 分别表示 的行数和列数。
2 分布随机数
分布表达式为:
在 中,我们使用 函数获取 分布随机数:
y = poisspdf(x,Labmda)
求取参数为 的 分布的概率密度函数值。
3 均匀分布随机数
在 中,我们使用 函数获取均匀分布随机数:
1. R = unifrnd(A,B)
2. R = unifrnd(A,B,m,n,……)
- 生成被 和 指定上下端点 的连续均匀分布的随机数组 .若 是数组, 是生成的被 对应元素指定连续均匀分布的随机数。若 和 是标量,则被扩展为和另一个输入有相同维度的数组。
- 返回 数组。若 和 是标量, 中所有元素是相同分布产生的随机数。若 和 是数组,则必须是 数组。
4 正态分布随机数
中提供正态分布函数 :
1. R = normrnd(mu,sigma)
2. R = normrnd(mu,sigma,m,n,……)
- 返回均值为 ,标准差为 的正态分布的随机数据, 可以是向量或矩阵。
- 分别表示 的行数和列数。