统计学习第五弹--python实践概率分布

正态分布(Normal distribution)

正态分布(Normal distribution),又名高斯分布(Gaussian distribution),正态曲线呈钟型,两头低,中间高,左右对称,中央部位的概率密度最大。越偏离均值,其概率密度减小。
若随机变量X服从一个数学期望为μ、方差为σ2的正态分布,记为N(μ,σ2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。
概率密度函数f(x):通过它可以求出一个数据范围内的某个连续变量的概率,可以指出该概率分布的形状。
概率密度:通过面积指出各种范围内的概率大小,通过概率密度函数进行描述。
求解正态分布概率步骤:
(1)确定分布和范围,即算出均值和标准差;
(2)将分布标准化,求出标准分;

 Python 实践正态分布的代码:

def Norm(mu,sigma):
    """
    mu:正态分布的均值
    sigma:标准差
    """
    import numpy as np
    import matplotlib.pyplot as plt
    plt.rcParams['font.sans-serif'] = ['SimHei'] #正常显示中文
    plt.rcParams['axes.unicode_minus'] = False #正常显示负号
    #正态分布的概率密度函数。可以理解成 x 是 mu(均值)和 sigma(标准差)的函数
    def Norm_PDF(x,mu,sigma):
        pdf = np.exp(-((x - mu)**2)/(2*sigma**2)) / (sigma * np.sqrt(2*np.pi))
        return pdf
    X = np.arange(mu - sigma * 5,mu + sigma * 5, 0.1) #模拟的是5sigma 原则 
    y = Norm_PDF(X,mu,sigma)
    plt.plot(X5,y)
    plt.xlabel('随机变量:x')
    plt.ylabel('概率:y')
    plt.title('正态分布:mu=%.1f,sigma=%.1f' % (mu5,sigma))
    plt.grid()
    plt.show()

泊松分布

一个服从泊松分布的随机变量X,表示在具有比率参数(rate parameter)λ的一段固定时间间隔内,事件发生的次数。参数λ告诉你该事件发生的比率。随机变量X的平均值和方差都是λ。

E(X) = λ, Var(X) = λ

泊松分布的例子:已知某路口发生事故的比率是每天2次,那么在此处一天内发生4次事故的概率是多少?

具体的代码实现可以参考:https://blog.csdn.net/weixin_42695959/article/details/84036865

参考文献

贾俊平 中国人民大学出版社 统计学第七版

百度百科

如何在Python中实现这五类强大的概率分布

本文是在木东居士的统计学习小组 学习笔记 供大家参考 

居士是腾讯的以为数据科学家 在工作之余组织一些学习小组 不是培训班 让大家在一起讨论学习

数据科学家学习小组之统计学(第二期)
https://mp.weixin.qq.com/s/JUnaXgjDMcLinMxpJLZ36g

机器学习小组(第一期)学习形式+打卡方式+参考资料
https://mp.weixin.qq.com/s/fUAUm74AAqWYI_UIMmB-mA

发布了42 篇原创文章 · 获赞 6 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/zkyxgs518/article/details/103449396