실제 생활에서는 예를 들어, 나는 만명의 평균 연령은 인터넷이 20 세임을 알고, 인구 평균을 알고하는 것이 어렵지만, 네트워크, 25 살 될 수있다 30 세 수 있습니다 얼마나 많은 사람들이 실제로 평균 인터넷의 전반적인 나이에 모르는 너무 자주 농담은 전체 평균이 하나님을 알 수있다,있다.
그러나 우리는 통계하여 추정 할 수있다.
사설
가설 테스트 : 인구 평균 μ이 알고있을 때, 나는이 가설을 테스트하는 것이다 (나는 값이나 간격이 알고 있다고 가정하고) 통계의 분포에 의해 정확한
신뢰 구간 : μ 알 수없는 인구 평균 때 인 경우 통계에 의해 년의 대략적인 범위에서 알 수없는 인구의 평균을 추정합니다.
가설 검정의 개념 (사실, 두 단계)
첫 번째 단계 : 가설
두번째 단계 : 가설 테스트
특정 단계 가설 테스트
가설이 통계 제시 이벤트를 찾아 고려하고 유통 (일반, 둘, 카이 제곱, t, F 등)을 작성하고, 인구 분산 및 샘플 분산이 알고있는 경우 다음을 참조하십시오.
, 네 개의 주요 유통 소개가되기 전에 나는 블로그를 썼다
2. 다음 기본 가정은 가상 이벤트 P에 분산 컴퓨팅, 유효 (p 값) 시험용
이 확률
, 즉 : 평균 가난한 인구의 수와 표본 평균보다 큰 확률
다음 다음 이벤트 극단적 인 케이스 (작은 확률) 발생 확률
이론은 우리가 알고있는 중앙 한계에 의해 (샘플의 많은 수의, 표본 평균의 대부분은 때 차이가 특정 수보다 큰 수 있도록 전체 평균 근처) 표본 평균이 극단적 인 경우 체크 아웃 우리는이 테스트를 판단, 또는 그 작은 확률 이벤트
1.首先我们会划分哪些为小概率事件
2.然后将小概率事件发生的概率相加起来
3.当事件样本非常大的时候,经过多年的检验的测算,我们发现一般相加得到的小概率事件发生的概率为0.05或者0.01或者0.1。(根据小概率原理)
4.我们将所有极端事件发生(小概率事件发生)的概率即0.05或者0.1定义为显著性水平
显著性水平为α,意为对于极端事件的极端字眼做一个界限
或者说是调控极端事件的极端程度
当原假设为真时所得到的样本观察结果或更极端结果出现的概率
p值我们一般取的是假设事件较为极端(小概率发生)的一面
如果我假设的事件主观上我认为发生概率很大,我的p值就设假设的反面,算反面的概率,如果我假设的事件主观上我认为发生概率很小,我的p值就设假设的正面,
但是我们一般把我们认为该事件不太可能发生的情况作为假设,为此来判断该事件是否为小概率事件,p越小越拒绝原假设,越大越接受原假设。
原因很简单:因为显著性水平是来评判小概率事件的,而要与显著性水平比较概率,我们也应该把事件的不太可能发生的情况作为假设来算概率与之检验。
3.将P值与显著水平进行比较,一般我们显著水平设为0.05
若我认为假设的事件发生概率很大,我p值设的是假设的反面
当P值比显著水平还小时,说明这个假设的反面事件发生概率巨小,明显假设正确。
当P值比显著水平还大时,说明这个假设的反面事件发生概率符合显著水平,假设假设错误。
若我认为假设的事件发生概率很小,我p值设的是假设的正面
当P值比显著水平还小时,说明这个假设事件发生概率巨小,明显假设错误。
当P值比显著水平还大时,说明这个假设事件发生概率符合显著水平,假设假设正确。
但是我们一般把我们认为该事件不太可能发生的情况作为假设,为此来判断该事件是否为小概率事件,p越小越拒绝原假设,越大越接受原假设。
这句话我要说两遍,因为总有人会把假设事件设为大概率事件。
这个为小概率事件发生的概率,展开写x拔到μ0的距离
这就是拒绝域,
若总体方差知道,我们将其标准正态化,
若总体方差不知道,我们用样本标准差代替将其化为t分布化
所以我们既可以通过p值检验,也可以通过x拔是否在拒绝域里检验,貌似都是一样的。
置信区间的概念
理解前提:中心极限定理和大数定理
大数定理用一句话概括:
1.当你抽的样本越多,越接近总体的数量,那么他的样本均值越会趋近于总体均值。
中心极限定理两句话概括:
1.样本平均值约等于总体平均值。
2.不管总体是什么分布,抽的样本足够大时,样本平均值的分布呈正态分布。
(说人话就是我测1000个学生的学习水平能得到中国所有学生学习水平,因为抽样样本的平均值和总体样本的平均值差不多。而且呈正态分布,也就是你去抽1000份样本平均值,大部分都在总体平均值周围,2条正好更能说明1条是正确的)
제리 예술은 하나 개의 문장을 정리 :
1. 표본 크기는 표본의 분포는 가까운 전체 분포이다 매우 크다.
전체적인 정규 분포의 샘플 분포의 평균이 항상 정상 (샘플 사이즈도 만족 1) 분산 취해진
전체적으로 통상 단일 샘플 크기> = 30 시간, 광고 N의 샘플 평균의 분포 분배되지 정규 분포 (중심 극한 정리)
신뢰 구간은 구간 추정하는 방법이다. 95 % 신뢰 구간
분포의 샘플 평균은 정규 분포 될 수 있기 때문에, 충분히 큰 샘플을 수득