R t検定言語と非正規の堅牢性

オリジナルの接続:http://tecdat.cn/?p=6261

 

t検定は、統計学的に最も一般的に使用されるテストの一つです。サンプル上の私たちの2標本t検定二つのグループから各グループが集団平均の同じグループの帰無仮説をテストすることができます。

これは実際に何を意味するのでしょうか?我々のデータは、通常の仮定に違反していると思われる場合は、当社のサンプルサイズは、小さすぎではない場合、我々はについてはあまり心配する必要はありません。さらに、Xが正常でない場合であっても同様の理由、(同様に、サンプルサイズが十分に大きい場合)のために、平均グループ95%信頼区間における差は、正しいカバレッジを有することになります。もちろん、少量の試料又は漸近結果の高度に歪んだ分布のために、タイプ1エラー率が非常に良好な近似が得られないことがあり、したがって、名目5%レベルからずれてもよいです。

今度は(重複サンプル中)分布の平均は正規分布の速度に収束するサンプルをテストするためにRを使用してみましょう。私たちは、対数正規分布からのデータをシミュレートします - つまり、正規分布に従う(X)のログ。このことから、我々はべき乗正規分布からのランダムサンプルを生成するランダムに分布することができます。まず、我々は大きな(N = 100000)サンプルを描き、それがどのように見えるかを確認するためにその分布を描画します:私たちは、その分布は非常に偏っている見ることができます。表面には、我々はXが正規分布していることを想定し、t検定データを使用して心配します。

サンプルのサンプル配布を表示するには、我々は、n個のサンプルサイズを選択し、サイズnのサンプルを描く繰り返し対数正規分布から、サンプルの計算の意味やサンプルがこれらのドローの分布を意味します。以下は、サンプルが(10,000複製から)n = 3つのヒストグラムを平均示します。

 

サンプルの分布は、平均N = 3

 

ここではサンプルの分布が傾斜しています。このような小さなサンプルサイズ1は、分布の裾から高い値のサンプルを持っている場合、これは非常に遠くを意味するサンプル間の真の平均差を与えるだろう。私たちは、今のn = 10繰り返した場合:それは今より正常に見えるが、それはまだ歪んでいる - サンプルは時々大きな意味します。、x軸の範囲は、現在非常に小さいことに注意してください - サンプルは変動が今3未満ではN =であることを意味します。最後に、我々は試すN = 100:

今、標本平均(母集団から重複サンプル)の分布は非常にノーマルに見えます。ときに大きなN、我々の観察の一つは、分布の尾部に配置することができるにもかかわらず、中心の近傍内の他のすべての観測値の分布は、平均値のままです。これは、ことを示しているXのこの特定の分布のために、t検定が正しいあるべきで、N = 100。これをチェックするより直接的な方法は、t検定の誤り率が、所定のn個の選択の分布に適用される、請求我々は経験的にタイプを推定し、試験をシミュレートすることです。



Xは、タイプ1エラー率の正常のt検定は、5%に近い場合であっても、正規分布でない場合はもちろん、テストは最適ではないであろう。すなわち、対立仮説は、より多くの電力を検出した帰無仮説をテストするための代替が存在することになります。

  

おすすめ

転載: www.cnblogs.com/tecdat/p/11459386.html