まず、体温、性別、の心拍数に対する臨床データ
男性の体温計算上95%信頼区間サンプリングの母集団平均範囲。転送:https://www.jianshu.com/p/a3efca8371eb
インポートPANDAS AS PD インポートnumpyのAS NP インポートSeaborn AS SNS インポートPLTのAS matplotlib.pyplot #読み出しデータ DF = pd.read_csv(' http://jse.amstat.org/datasets/normtemp.dat.txt '、ヘッダ=いずれも、オン9月= ' \ + S '、名前= [ ' 温度'、' 性別'、' HR ' ]) #ビューデータは、サンプルサイズを選択し (42れるnp.random.seed ) #()df.describeの #のサンプルデータを表示するための90のサンプル量 df_sam = df.sample(90 ) df_sam.head() #人の平均体温に取り込ま計算サンプル DF3 = df_sam.loc [df_sam [ 「セックス」 ] == 1 ] DF3 [ ' 温度' .mean(]) #重複サンプルを採取し、試料分配得るために、他のサンプル中の男性の平均温度を算出する boot_meansを= [] のための _ 中範囲(10000 )。 bootsample = df.sample(90、置き換える= 真) 平均 = bootsample [bootsample [ ' セックス' ] == 1] [ ' 温度' .mean(]) boot_means.append(平均) #は、平均体温の男性の標本分布を描きます #集団平均、%信頼水準95推定するサンプリング分布の計算信頼区間 np.percentile(boot_means、2.5)、np.percentile(boot_means、97.5)
二、信頼区間の全体的な平均値を達成するためのpython
転送:https://blog.csdn.net/qq_39284106/article/details/103707239
デフ mean_interval(平均=なし、STD =なし、SIG =なし、N =なし、自信= 0.95 ): ""」 意味:サンプルの平均を STD:標本標準偏差 SIG:母分散 N:サンプルサイズ 信頼:信頼水準 機能:母平均の信頼区間を構築します ""」 アルファ = 1 - 自信 z_score = scipy.stats.norm.isf(アルファ/ 2) #1 Z分布閾値 t_score = scipy.stats.t.isf(アルファ/ 2、DF =(1-N-)) #のTしきい値分布 もし N> = 30 と SIG =!なし: 私 = z_score * SIG / np.sqrt(N) #误差 lower_limitで=平均- 私は upper_limitは平均+の= 私を もし N> = 30 と SIG == なし: 私 = z_score * STD / np.sqrt(N) lower_limitで =平均- 私 upper_limitは平均+の= 私を もし N <30 と SIG == なし: 私 = t_score * STD / np.sqrt(N) lower_limitで =平均- 私 upper_limitは平均+の= 私を リターン(ラウンド(lower_limitで、3)、ラウンド(upper_limit、3 )) mean_interval(平均 = 8900、STD =なし、SIG = 500、N = 35、信頼度= 0.95 ) mean_interval(平均 = 8900、STD = 500、SIG =なし、N = 35、信頼度= 0.90 ) mean_interval(平均 = 8900、STD = 500、SIG =なし、N = 35、信頼度= 150)
第三に、母分散の信頼区間を達成するために
(1 )21サンプル平均、2のサンプル標準偏差、50のサンプルサイズ。 ( 2)1.3、0.02のサンプル標準偏差のサンプル平均、15のサンプルサイズ。 ( 3 試料の平均、31のサンプル標準偏差、22のサンプルサイズの)167。 Question1:上記のサンプルの結果に基づいて、母分散が90に計算される%の信頼区間を? Question2:上記サンプルの結果に基づいて、全体的な標準偏差は90計算%の信頼区間を? デフ std_interval(平均=なし、STD =なし、N =なし、自信= 0.95、パラ= " 总体标准差" ): ""」 意味:サンプルの平均を STD:標本標準偏差 N:サンプルサイズ 信頼:信頼水準 パラ:パラメータの全体的な見積もり 機能:建築・総人口の分散、標準偏差の信頼区間 ""」 分散 = np.power(STD、2 ) アルファ = 1 - 自信 chiscore0 = scipystatschi2isf(アルファ/ 2 DFへ=(N-1、のためのものです)) chi_score1 = scipy.stats.chi2.isf(1 -アルファ/ 2、DF =(N-1 )) IFパラ== 「母標準偏差」: lower_limitで = np.sqrt((N-1)*分散/ chi_score0) upper_limit = np.sqrt((1-N-)分散* /。chi_score1) IFパラ== " 分散" : lower_limitで =(N-1)*分散/ chi_score0 upper_limit =(N-1)*分散/ chi_score1 リターン(ラウンド(lower_limitで、2)、ラウンド(upper_limit、2 )) std_interval(平均 = 21、STD = 2、N = 50、信頼度= 0.90 ) std_interval(平均 = 1.3、STD = 0.02、N = 15、信頼度= 0.90 ) std_interval(平均 = 167、STD = 31、N = 22、信頼度= 0.90)
第四には、2の母分散比の信頼区間を実装します
DATA1 = [3.45、3.22、3.90、3.20、2.98、3.70、3.22、3.75、3.28、3.50、3.38、3.35、2.95、3.45、3.20、3.16、3.48、3.12、3.20、3.18、3.25 ] DATA2 = [3.22、3.28、3.35、3.38、3.19、3.30、3.30、3.20、3.05、3.30、3.29、3.33、3.34、3.35、3.27、3.28、3.16、3.28、3.30、3.34、3.25 ] DEF two_std_interval(D1、D2、信頼= 0.95、パラ= " 2つの全体分散比" ): "" " D1:1つのデータ D2:データ2 信頼:信頼水準 パラ:パラメータの全体的な見積もり 機能:母分散のビルド信頼区間に全体の&の2つの標準偏差より ""」 N1 = LEN(D1) N 2 = のみ(D2) VAR1 = np.var(D1、DDOF = 1) #。DDOF =試料分散1 VAR2 = np.var(D2、DDOF = 1) #。DDOF =試料分散1 アルファ= 1 - 自信 f_score0 = scipy.stats.f.isf(アルファ/ 2 DFD = N2-1、N1-1 = DFN) #F.配布閾値 f_score1 = scipy.stats.f.isf(1-α/ 2、DFN = N1 -1、DFD = N2-1) #F.配信閾値 IFパラ== 「2つの全体の標準偏差比」: lower_limitで = np.sqrt((VAR1 / VAR2)/ f_score0) upper_limit = np.sqrt((VAR1 / VAR2)/ f_score01) IFパラ== " 2つの全体分散比" : lower_limitで =(VAR1 / VAR2)/ f_score0 upper_limit =(VAR1 / VAR2)/ f_score1 リターン(ラウンド(lower_limitで、2)、ラウンド(upper_limit、2 )) two_std_interval(DATAL、DATA2、自信 = 0.95、パラ= " 2つの全体の分散比")