信頼区間 - Pythonはパラメータ推定を実現します

まず、体温、性別、の心拍数に対する臨床データ
男性の体温計算上95%信頼区間サンプリングの母集団平均範囲。転送:https://www.jianshu.com/p/a3efca8371eb

インポートPANDAS AS PD
 インポートnumpyのAS NP 
 インポートSeaborn AS SNS
 インポートPLTのAS matplotlib.pyplot
 読み出しデータ 
DF = pd.read_csv(' http://jse.amstat.org/datasets/normtemp.dat.txt '、ヘッダ=いずれも、オン9月= ' \ + S '、名前= [ ' 温度'' 性別'' HR ' ])

ビューデータは、サンプルサイズを選択し 
(42れるnp.random.seed ()df.describeの
#のサンプルデータを表示するための90のサンプル量 
df_sam = df.sample(90 
df_sam.head()


人の平均体温に取り込ま計算サンプル 
DF3 = df_sam.loc [df_sam [ セックス ] == 1 ]
DF3 [ ' 温度' .mean(])

重複サンプルを採取し、試料分配得るために、他のサンプル中の男性の平均温度を算出する 
boot_meansを= []
 のための _ 範囲(10000 )。
   bootsample = df.sample(90、置き換える= 真)
   平均 = bootsample [bootsample [ ' セックス' ] == 1] [ ' 温度' .mean(])
   boot_means.append(平均)


#は、平均体温の男性の標本分布を描きます

集団平均、%信頼水準95推定するサンプリング分布の計算信頼区間 
np.percentile(boot_means、2.5)、np.percentile(boot_means、97.5)

二、信頼区間の全体的な平均値を達成するためのpython

 転送:https://blog.csdn.net/qq_39284106/article/details/103707239

 

 

デフ mean_interval(平均=なし、STD =なし、SIG =なし、N =なし、自信= 0.95 ):
     ""」
    意味:サンプルの平均を
    STD:標本標準偏差
    SIG:母分散
    N:サンプルサイズ
    信頼:信頼水準
    機能:母平均の信頼区間を構築します
    ""」
    アルファ = 1 - 自信
    z_score = scipy.stats.norm.isf(アルファ/ 2)   #1 Z分布閾値 
    t_score = scipy.stats.t.isf(アルファ/ 2、DF =(1-N-))  Tしきい値分布
   
    もし N> = 30  SIG =!なし: = z_score * SIG / np.sqrt(N)  误差 
        lower_limitで=平均- 私は
        upper_limitは平均+の= 私を
        
    もし N> = 30  SIG == なし: = z_score * STD / np.sqrt(N)
        lower_limitで =平均- 
        upper_limitは平均+の= 私を
        
    もし N <30  SIG == なし: = t_score * STD / np.sqrt(N)
        lower_limitで =平均- 
        upper_limitは平均+の= 私を
    
    リターン(ラウンド(lower_limitで、3)、ラウンド(upper_limit、3 ))
 
mean_interval(平均 = 8900、STD =なし、SIG = 500、N = 35、信頼度= 0.95 
mean_interval(平均 = 8900、STD = 500、SIG =なし、N = 35、信頼度= 0.90 
mean_interval(平均 = 8900、STD = 500、SIG =なし、N = 35、信頼度= 150)

第三に、母分散の信頼区間を達成するために

 

 

(1 )21サンプル平均、2のサンプル標準偏差、50のサンプルサイズ。                     2)1.3、0.02のサンプル標準偏差のサンプル平均、15のサンプルサイズ。                         3 試料の平均、31のサンプル標準偏差、22のサンプルサイズの)167。                        
Question1:上記のサンプルの結果に基づいて、母分散が90に計算される%の信頼区間を?  
Question2:上記サンプルの結果に基づいて、全体的な標準偏差は90計算%の信頼区間を?        
 
デフ std_interval(平均=なし、STD =なし、N =なし、自信= 0.95、パラ= " 总体标准差" ):
     ""」
    意味:サンプルの平均を
    STD:標本標準偏差
    N:サンプルサイズ
    信頼:信頼水準
    パラ:パラメータの全体的な見積もり
    機能:建築・総人口の分散、標準偏差の信頼区間
    ""」
    分散 = np.power(STD、2 
    アルファ = 1 - 自信
    
    chiscore0 = scipystatschi2isf(アルファ/ 2 DFへ=(N-1、のためのものです))
    chi_score1 = scipy.stats.chi2.isf(1 -アルファ/ 2、DF =(N-1 ))
   
    IFパラ== 母標準偏差
        lower_limitで = np.sqrt((N-1)*分散/ chi_score0)
        upper_limit = np.sqrt((1-N-)分散* /。chi_score1)
     IFパラ== " 分散" 
        lower_limitで =(N-1)*分散/ chi_score0
        upper_limit =(N-1)*分散/ chi_score1
        
    リターン(ラウンド(lower_limitで、2)、ラウンド(upper_limit、2 ))
 
std_interval(平均 = 21、STD = 2、N = 50、信頼度= 0.90 
std_interval(平均 = 1.3、STD = 0.02、N = 15、信頼度= 0.90 
std_interval(平均 = 167、STD = 31、N = 22、信頼度= 0.90)

第四には、2の母分散比の信頼区間を実装します

 

 

DATA1 = [3.45、3.22、3.90、3.20、2.98、3.70、3.22、3.75、3.28、3.50、3.38、3.35、2.95、3.45、3.20、3.16、3.48、3.12、3.20、3.18、3.25 ]
DATA2 = [3.22、3.28、3.35、3.38、3.19、3.30、3.30、3.20、3.05、3.30、3.29、3.33、3.34、3.35、3.27、3.28、3.16、3.28、3.30、3.34、3.25 ]

DEF two_std_interval(D1、D2、信頼= 0.95、パラ= " 2つの全体分散比" ):
 "" "
D1:1つのデータ
D2:データ2
信頼:信頼水準
パラ:パラメータの全体的な見積もり
機能:母分散のビルド信頼区間に全体の&の2つの標準偏差より
""」
N1 = LEN(D1)
N 2 = のみ(D2)
VAR1 = np.var(D1、DDOF = 1) 。DDOF =試料分散1 
VAR2 = np.var(D2、DDOF = 1) 。DDOF =試料分散1 
アルファ= 1 - 自信

f_score0 = scipy.stats.f.isf(アルファ/ 2 DFD = N2-1、N1-1 = DFN) F.配布閾値 
f_score1 = scipy.stats.f.isf(1-α/ 2、DFN = N1 -1、DFD = N2-1) F.配信閾値

IFパラ== 2つの全体の標準偏差比
lower_limitで = np.sqrt((VAR1 / VAR2)/ f_score0)
upper_limit = np.sqrt((VAR1 / VAR2)/ f_score01)
 IFパラ== " 2つの全体分散比" 
lower_limitで =(VAR1 / VAR2)/ f_score0
upper_limit =(VAR1 / VAR2)/ f_score1

リターン(ラウンド(lower_limitで、2)、ラウンド(upper_limit、2 ))

two_std_interval(DATAL、DATA2、自信 = 0.95、パラ= " 2つの全体の分散比"

 



おすすめ

転載: www.cnblogs.com/zym-yc/p/12111381.html