MATLAB数据统计和分析:常用统计量和随机数生成

常用统计量和随机数生成




常用统计量

1. 平均值

1. mean(X)
2. mean(A)
3. mean(A,dim)
  1. X 为向量,返回 X 中各元素平均值
  2. A 为矩阵,返回 A 中各列元素的平均值所构成的向量
  3. 在给出的维度内的中位数

2. 中位数

1. median(X)
2. median(A
3. median(A,dim)
  1. X 为向量,返回 X 中各元素中位数
  2. A 为矩阵,返回 A 中各列元素的中位数所构成的向量
  3. 求给出的维度内的中位数

3. 标准差、方差和极差

1. D = var(X)
2. D = var(A
3. D = var(X,1)
4. D = var(X,w)
  1. 若 X 为向量,则返回向量的样本方差。
  2. 若 A 为矩阵,则返回 A 的列向量的样本方差构成的行向量。
  3. 返回向量 X 的简单方差。
  4. 返回向量 X 的以 w 为权重的方差。
 1. std(X)
 2. std(x,1)
 3. std(x,flag,dim)
  1. 返回向量 X 的样本标准差。
  2. 返回向量的标准差。
  3. 返回向量中维数为 d i m dim 的标准差值,其中 f l a g = 0 flag = 0 时置前因子为 1 / ( n 1 ) 1/(n-1) ; 否则置前因子为 1 / n 1/n .

4. 偏度和峰度

偏度:
g 1 = 1 s 3 i = 1 n ( X i X ) 3 g_{1} = \frac{1}{s^{3}}\sum^{n}_{i = 1}(X_{i} - \overline{X})^{3}

峰度:
g 2 = 1 s 4 i = 1 n ( X i X ) 4 g_{2} = \frac{1}{s^{4}}\sum^{n}_{i = 1}(X_{i} - \overline{X})^{4}

偏度是反映数据对称性的量。 g 1 > 0 g_{1}>0 称为 右偏态 ,此时数据位于均值右边的比位于左边的多; g 1 < 0 g_{1}<0 称为 左偏态 ,所反映的情况相反。 g 1 g_{1} 接近于 0 0 ,则可认为数据是对称的.

峰度是反映数据分布形状的量:正态分布的峰度为 3 3 ,若 g 2 g_{2} 3 3 大很多,表示样本中有较多远离均值的数据,分布有沉重的尾巴。因此,峰度可用于衡量偏离正态分布的尺度.

峰度-偏度检验又称为 J a r q u e B e r a Jarque-Bera 检验,该检验基于数据样本的偏度和峰度,评价给定数据是否服从未知均值和方差的正态分布的假设。对于正态分布数据,样本偏度接近于 0 0 ,样本峰度接近于 3 3 .


M A T L A B MATLAB 中,我们使用 j b t e s t jbtest 函数进行 J a r q u e B e r a Jarque-Bera 检验,测试数据对正态分布的似合程度:

1. h = jbtest(X)
2. h = jbtest(X,alpha)
3. [H,P,JBSTAT,CV] = jbtest(X,alpha)
  1. 对输入数据向量 X 进行 J a r q u e B e r a Jarque-Bera 检验,返回检验结果 h h . 若 h = 1 h = 1 ,则在显著性水平 0.05 0.05 下拒绝 X X 服从正态分布的假设,若 h = 0 h = 0 ,则可认为 X X 服从正态分布。
  2. 在显著性水平 a l p h a alpha 下进行 J a r q u e B e r a Jarque-Bera 检验。
  3. 函数同时返回三个其他输出: P P 为检验的 p p 值, J B S T A T JBSTAT 为检验统计量, C V CV 为确定是否拒绝零假设的临界值。

随机数

下面介绍几种常用的随机数生成方法:

1 二项分布随机数

在概率论和统计学中,二项分布指 n n 个独立的是/非试验中成功的次数的离散概率分布,其中没次试验成功的概率为 p p . 这样的单次成功/失败试验又称为 B e r n o u l l i Bernoulli 试验。

M A T L A B MATLAB 中,我们使用 b i n o r n d binornd 函数产生二项分布随机数:

1. R = binornd(N,P)
2. R = binornd(N,P,m)
3. R = binornd(N,P,m,n)
  1. N , P N,P 为二项分布的两个参数,返回服从参数为 N , P N,P 的二项分布的随机数,且 N , P , R N,P,R 的形式相同。
  2. m m 是一个 1 x 2 1x2 向量,它为指定随机数的个数。其中 N , P N,P 分别代表返回值 R R 中行与列的维数。
  3. m , n m,n 分别表示 R R 的行数和列数。

2 P o i s s o n Poisson 分布随机数

P o i s s o n Poisson 分布表达式为:
f ( x λ ) = λ x x ! e λ ,     x = 0 , 1 , , . f(x|\lambda) = \frac{\lambda^{x}}{x!}e^{-\lambda}, \ \ \ x = 0,1,\cdots, \infty.

M A T L A B MATLAB 中,我们使用 p o i s s p d f poisspdf 函数获取 P o i s s o n Poisson 分布随机数:

y = poisspdf(x,Labmda)

求取参数为 L a m b d a Lambda P o i s s o n Poisson 分布的概率密度函数值。


3 均匀分布随机数

M A T L A B MATLAB 中,我们使用 u n i f r n d unifrnd 函数获取均匀分布随机数:

1. R = unifrnd(A,B)
2. R = unifrnd(A,B,m,n,……)
  1. 生成被 A A B B 指定上下端点 [ A , B ] [A,B] 的连续均匀分布的随机数组 R R .若 A , B A,B 是数组, R ( i , j ) R(i,j) 是生成的被 A , B A,B 对应元素指定连续均匀分布的随机数。若 N N P P 是标量,则被扩展为和另一个输入有相同维度的数组。
  2. 返回 m n m * n*\cdots 数组。若 A A B B 是标量, R R 中所有元素是相同分布产生的随机数。若 A A B B 是数组,则必须是 m n m * n * \cdots 数组。

4 正态分布随机数

M A T L A B MATLAB 中提供正态分布函数 n o r m r n d normrnd

1. R = normrnd(mu,sigma)
2. R = normrnd(mu,sigma,m,n,……)
  1. 返回均值为 m u mu ,标准差为 s i g m a sigma 的正态分布的随机数据, R R 可以是向量或矩阵。
  2. m , n m,n 分别表示 R R 的行数和列数。

发布了32 篇原创文章 · 获赞 14 · 访问量 6365

猜你喜欢

转载自blog.csdn.net/u010186354/article/details/104093422
今日推荐