それらの接触の完全な説明と議論のための仮説検定と信頼区間の完全な説明

実生活では、例えば、私は万人の平均年齢はFiは20歳ですが、ネットワークが実際にインターネットの全体的な年齢のために意味どのように多くの人を知りません、それは30歳かもしれ25歳であってもよいことを知って、母集団の平均を知ることは困難であることが多いですそれほど頻繁に冗談があり、全体的な平均値は、神が知ることができます。

しかし、我々は、統計によってそれを推定することができます。

EDITORIAL

仮説検定:母集団の平均μが知られているとき、私はこの仮説をテストします(私は値または間隔が知っていると仮定して)統計の分布によって正しい
信頼区間:μが未知の母集団の平均のときに私はあるとき、年間のおおよその範囲内の未知の母平均を推定するための統計によります。

仮説検定の考え方(実際には、2段階)

最初のステップ:仮説

第二段階:仮説を検証します

具体的な手順の仮説検定

仮説は、その統計のために提唱したイベントを見つける検討し、その分布(通常、2、カイ二乗、T、F、など)を書き、そして母分散と標本分散が知られているならば、参照1。

四大分布紹介があり、前に私がブログを書きました
ここに画像を挿入説明
ここに画像を挿入説明

2.デフォルトの仮定は、仮定イベントP(p値)値の検定に計算分散、有効です

この確率
ここに画像を挿入説明
すなわち:貧困層の平均の数とサンプルの平均がより大きくなる確率
次のイベントの極端なケース(小さな確率)が発生する確率
(中心極限定理によって、我々はその多数のサンプル、サンプル平均であるのほとんどを知っています全体の平均の差が一定数以上であるので、近く、私たちはサンプルの平均から、このテストを判断する)は、極端なケースである、または小さな確率事象であります

1.首先我们会划分哪些为小概率事件
2.然后将小概率事件发生的概率相加起来
3.当事件样本非常大的时候,经过多年的检验的测算,我们发现一般相加得到的小概率事件发生的概率为0.05或者0.01或者0.1。(根据小概率原理)
4.我们将所有极端事件发生(小概率事件发生)的概率即0.05或者0.1定义为显著性水平

显著性水平为α,意为对于极端事件的极端字眼做一个界限
或者说是调控极端事件的极端程度
当原假设为真时所得到的样本观察结果或更极端结果出现的概率
p值我们一般取的是假设事件较为极端(小概率发生)的一面
如果我假设的事件主观上我认为发生概率很大,我的p值就设假设的反面,算反面的概率,如果我假设的事件主观上我认为发生概率很小,我的p值就设假设的正面,

但是我们一般把我们认为该事件不太可能发生的情况作为假设,为此来判断该事件是否为小概率事件,p越小越拒绝原假设,越大越接受原假设。

原因很简单:因为显著性水平是来评判小概率事件的,而要与显著性水平比较概率,我们也应该把事件的不太可能发生的情况作为假设来算概率与之检验。

3.将P值与显著水平进行比较,一般我们显著水平设为0.05

若我认为假设的事件发生概率很大,我p值设的是假设的反面
当P值比显著水平还小时,说明这个假设的反面事件发生概率巨小,明显假设正确。
当P值比显著水平还大时,说明这个假设的反面事件发生概率符合显著水平,假设假设错误。
若我认为假设的事件发生概率很小,我p值设的是假设的正面
当P值比显著水平还小时,说明这个假设事件发生概率巨小,明显假设错误。
当P值比显著水平还大时,说明这个假设事件发生概率符合显著水平,假设假设正确。

但是我们一般把我们认为该事件不太可能发生的情况作为假设,为此来判断该事件是否为小概率事件,p越小越拒绝原假设,越大越接受原假设。

这句话我要说两遍,因为总有人会把假设事件设为大概率事件。

ここに画像を挿入説明
这个为小概率事件发生的概率,展开写x拔到μ0的距离

ここに画像を挿入説明
这就是拒绝域,

ここに画像を挿入説明
若总体方差知道,我们将其标准正态化,
若总体方差不知道,我们用样本标准差代替将其化为t分布化
ここに画像を挿入説明
所以我们既可以通过p值检验,也可以通过x拔是否在拒绝域里检验,貌似都是一样的。

置信区间的概念

理解前提:中心极限定理和大数定理

大数定理用一句话概括:
1.当你抽的样本越多,越接近总体的数量,那么他的样本均值越会趋近于总体均值。

中心极限定理两句话概括:
1.样本平均值约等于总体平均值。
2.不管总体是什么分布,抽的样本足够大时,样本平均值的分布呈正态分布。

(说人话就是我测1000个学生的学习水平能得到中国所有学生学习水平,因为抽样样本的平均值和总体样本的平均值差不多。而且呈正态分布,也就是你去抽1000份样本平均值,大部分都在总体平均值周围,2条正好更能说明1条是正确的)

ジェリーの芸術は、一つの文を定理:
1.サンプルサイズはサンプルの分布が近い全体的な分布にある、非常に大きいです。

全体的な正規分布、常に正規分布採取されたサンプルの分布の平均値は、(サンプルサイズも、満足1である)場合
総合通常、単一のサンプルサイズ> = 30時間、ラインnのサンプル平均値の分布を分布していません正規分布(中心極限定理)

信頼区間は区間推定する方法です。95%信頼区間

分布のサンプル平均値が正規分布に従うものとするので、したがって、サンプル十分な大きさを得るために、

公開された19元の記事 ウォンの賞賛4 ビュー504

おすすめ

転載: blog.csdn.net/qq_35050438/article/details/102988897