常用统计量和随机数生成

文章目录

常用统计量和随机数生成

常用统计量

1. 平均值
2. 中位数
3. 标准差、方差和极差
4. 偏度和峰度

随机数

1 二项分布随机数
2 $Poisson$ 分布随机数
3 均匀分布随机数
4 正态分布随机数

常用统计量

1. 平均值

1. mean(X)
2. mean(A)
3. mean(A,dim)

X 为向量，返回 X 中各元素平均值

A 为矩阵，返回 A 中各列元素的平均值所构成的向量

在给出的维度内的中位数

2. 中位数

1. median(X)
2. median(A
3. median(A,dim)

X 为向量，返回 X 中各元素中位数

A 为矩阵，返回 A 中各列元素的中位数所构成的向量

求给出的维度内的中位数

3. 标准差、方差和极差

1. D = var(X)
2. D = var(A
3. D = var(X,1)
4. D = var(X,w)

若 X 为向量，则返回向量的样本方差。

若 A 为矩阵，则返回 A 的列向量的样本方差构成的行向量。

返回向量 X 的简单方差。

返回向量 X 的以 w 为权重的方差。

 1. std(X)
 2. std(x,1)
 3. std(x,flag,dim)

返回向量 X 的样本标准差。

返回向量的标准差。

返回向量中维数为 $dim$ 的标准差值，其中 $flag = 0$ 时置前因子为 $1/(n-1)$ ; 否则置前因子为 $1/n$ .

4. 偏度和峰度

偏度:
$g_{1} = \frac{1}{s^{3}}\sum^{n}_{i = 1}(X_{i} - \overline{X})^{3}$

峰度：
$g_{2} = \frac{1}{s^{4}}\sum^{n}_{i = 1}(X_{i} - \overline{X})^{4}$

偏度是反映数据对称性的量。 $g_{1}>0$ 称为 右偏态 ，此时数据位于均值右边的比位于左边的多； $g_{1}<0$ 称为 左偏态 ，所反映的情况相反。 $g_{1}$ 接近于 $0$ ，则可认为数据是对称的.

峰度是反映数据分布形状的量：正态分布的峰度为 $3$ ，若 $g_{2}$ 比 $3$ 大很多，表示样本中有较多远离均值的数据，分布有沉重的尾巴。因此，峰度可用于衡量偏离正态分布的尺度.

峰度-偏度检验又称为 $Jarque-Bera$ 检验，该检验基于数据样本的偏度和峰度，评价给定数据是否服从未知均值和方差的正态分布的假设。对于正态分布数据，样本偏度接近于 $0$ ，样本峰度接近于 $3$ .

在 $MATLAB$ 中，我们使用 $jbtest$ 函数进行 $Jarque-Bera$ 检验，测试数据对正态分布的似合程度：

1. h = jbtest(X)
2. h = jbtest(X,alpha)
3. [H,P,JBSTAT,CV] = jbtest(X,alpha)

对输入数据向量 X 进行 $Jarque-Bera$ 检验，返回检验结果 $h$ . 若 $h = 1$ ，则在显著性水平 $0.05$ 下拒绝 $X$ 服从正态分布的假设，若 $h = 0$ ，则可认为 $X$ 服从正态分布。

在显著性水平 $alpha$ 下进行 $Jarque-Bera$ 检验。

函数同时返回三个其他输出： $P$ 为检验的 $p$ 值， $JBSTAT$ 为检验统计量， $CV$ 为确定是否拒绝零假设的临界值。

随机数

下面介绍几种常用的随机数生成方法：

1 二项分布随机数

在概率论和统计学中，二项分布指 $n$ 个独立的是/非试验中成功的次数的离散概率分布，其中没次试验成功的概率为 $p$ . 这样的单次成功/失败试验又称为 $Bernoulli$ 试验。

在 $MATLAB$ 中，我们使用 $binornd$ 函数产生二项分布随机数:

1. R = binornd(N,P)
2. R = binornd(N,P,m)
3. R = binornd(N,P,m,n)

$N,P$ 为二项分布的两个参数，返回服从参数为 $N,P$ 的二项分布的随机数，且 $N,P,R$ 的形式相同。

$m$ 是一个 $1x2$ 向量，它为指定随机数的个数。其中 $N,P$ 分别代表返回值 $R$ 中行与列的维数。

$m,n$ 分别表示 $R$ 的行数和列数。

2 $Poisson$ 分布随机数

$Poisson$ 分布表达式为：
$f(x|\lambda) = \frac{\lambda^{x}}{x!}e^{-\lambda}, \ \ \ x = 0,1,\cdots, \infty.$

在 $MATLAB$ 中，我们使用 $poisspdf$ 函数获取 $Poisson$ 分布随机数：

y = poisspdf(x,Labmda)

求取参数为 $Lambda$ 的 $Poisson$ 分布的概率密度函数值。

3 均匀分布随机数

在 $MATLAB$ 中，我们使用 $unifrnd$ 函数获取均匀分布随机数：

1. R = unifrnd(A,B)
2. R = unifrnd(A,B,m,n,……)

生成被 $A$ 和 $B$ 指定上下端点 $[A,B]$ 的连续均匀分布的随机数组 $R$ .若 $A,B$ 是数组， $R(i,j)$ 是生成的被 $A,B$ 对应元素指定连续均匀分布的随机数。若 $N$ 和 $P$ 是标量，则被扩展为和另一个输入有相同维度的数组。

返回 $m * n*\cdots$ 数组。若 $A$ 和 $B$ 是标量， $R$ 中所有元素是相同分布产生的随机数。若 $A$ 和 $B$ 是数组，则必须是 $m * n * \cdots$ 数组。

4 正态分布随机数

$MATLAB$ 中提供正态分布函数 $normrnd$ ：

1. R = normrnd(mu,sigma)
2. R = normrnd(mu,sigma,m,n,……)

返回均值为 $mu$ ，标准差为 $sigma$ 的正态分布的随机数据， $R$ 可以是向量或矩阵。

$m,n$ 分别表示 $R$ 的行数和列数。

齐次线性方程组

发布了32 篇原创文章 · 获赞 14 · 访问量 6365

私信关注

MATLAB数据统计和分析：常用统计量和随机数生成

常用统计量和随机数生成

文章目录

常用统计量

1. 平均值

2. 中位数

3. 标准差、方差和极差

4. 偏度和峰度

随机数

1 二项分布随机数

2 $Poisson$ 分布随机数

3 均匀分布随机数

4 正态分布随机数

猜你喜欢

MATLAB数据统计和分析：常用统计量和随机数生成

常用统计量和随机数生成

文章目录

常用统计量

1. 平均值

2. 中位数

3. 标准差、方差和极差

4. 偏度和峰度

随机数

1 二项分布随机数

2 P o i s s o n Poisson Poisson 分布随机数

3 均匀分布随机数

4 正态分布随机数

猜你喜欢

2 $Poisson$ 分布随机数