概率分布分类
分为离散型概率分布和连续型概率分布
离散型概率分布的概率函数被称为概率质量函数。
连续型概率分布对应的函数称为概率密度函数。
离散型概率分布分为
二项分布(结果只有2个)、多项分布(结果至少3个)、超几何分布(有限总体中有放回的抽样分布)和泊松分布
在实际运用中,只要数据总体的个案数目是样本容量的10倍以上,即N>=10n,就可以用二项分布近似超几何分布。
泊松分布
在连续时间或空间单位上发生随机时间次数的概率。泊松分布是关于历史平均次数的函数。例如过去一年店里平均每周卖出2块巧克力,问库存量多少合适。
准则:如果n>=20且p<=0.05,用泊松分布近似二项分布的结果是良好的。如果n>=100且p<=0.01,那么泊松分布近似二项分布的结果极好。
常用连续型概率分布
指数分布、均匀分布和正态分布。
指数分布
指数分布描述的是两次随机事件发生的时间间隔的概率分布情况。指数分布和泊松分布正好互补。
泊松分布解决:接下来1小时有8人结账的概率是多少问题?
指数分布解决:接下来10分钟有人来结账的概率是多少?
均匀分布
是古典概率分布的连续形式。是指随机事件的可能结果是连续型数据变量,所有的连续型数据结果所对应的概率相等。
正态分布
正态分布能够表示被测量事物处于稳定状态的原因。六西格玛法则。
只有当连续型随机变量x服从正态分布时,随机变量x的Z变换才能将普通正态分布转换成标准正态分布,Z变换不能将非正态分布转换成标准正态分布。
峰度:常峰态:峰度系数=3。
偏度系数:对称分布,偏度系数=0