パラメータ推定の統計的根拠

内容:

まず、点推定値

  1、モバイルコンポーネント

  2、順序統計法

  3、最尤法

  図4に示すように、最小二乗法

第二に、区間推定

  1、レンジ推定人口パラメータ:

  • 全体の平均区間推定
  • 区間推定の全体的な割合
  • 母分散の区間推定    

  2、2つの集団のパラメータの間隔見積り:

  • 2人の人口の違いのための間隔を推定意味します
  • 全体的な割合の2つの推定値の違いのために間隔
  • 2つの区間推定の全体的な分散比  

第三に、サンプルサイズが決定されます

  1は、サンプル集団を意味する時間の量を決定するために推定されています

  2、サンプル集団の割合を決定するための時間の見積額


 まず、点推定値

点推定値は、パラメータを推定するサンプル統計量であり、いくつかのサンプルの統計値軸の点として、推定された結果はまた、いわゆる、ポイントの値を示す点推定。

ポイントと区間推定はに属し、人口のパラメータ推定問題このグループによる情報の全体的な特性を推定するためにどのように、いつ研究のサンプルから得られたデータの集合、全体的な統計パラメータは何ですか、それは地元の結果から、全体的な状況を推測する方法、である、と呼ばれる全体的なパラメータ推定

サンプルデータによって、未知のパラメータに含まれる真の値の全体的な分布を推定するために、得られた値が呼び出され 、推定値 どのように正確に表現し、信頼区間の点推定値。
女性人口の性質が明確でないとき、私たちは母親の数の性質を理解するためとして、推定値の一定数を使用する必要があります。以下のような:親グループが、サンプルの平均がμの推定値を意味します。我々は、特定の値を使用する場合、即ち、ドットラインの数は、親の数を推定するための推定値として、それが呼び出される 点推定
物点推定値は、関数g(θ)に含まれるサンプルX =(X1、X2 ... XI)未知パラメータθは全体の分布を推定または、θに基づいています。[シータ]または一般的なG(θ)は、数学的期待値、分散、相関係数などの一般的な特性値です。

1、モバイルコンポーネント

使用したサンプルの瞬間を一般的に対応するパラメータを推定します。導出は、関心の略矩形最初のパラメータ(確率変数パワーの期待値、すなわち、検討中の)式に関する。サンプルを除去し、サンプルが全体の瞬間から推定されます。そして、置換サンプルの瞬間を使用して(不明)全体的な瞬間は、目的のパラメータを解決しました。ためにこれらのパラメータの推定値を得ることができます。

最も簡単な方法は、推定する瞬間を使用することで、サンプル順序原点モーメントを二次と期待の全体的なサンプルを推定する中心モーメント母分散を推定します。パラメータ推定モーメント法を探しているときに、瞬間の全体的な分布の起源は、それがいくつかの図面の唯一の一般的な特徴を含む一方、コーシー分布などを使用することができない、存在しない場合、全体的な分布が使用されていないので、モーメント推定方法実際にのみに焦点を当て量の一般的な、それは分布の全体的な性質を反映するように、情報の一部は、多くの場合、悪い、とのみにサンプルサイズ nはその優位性を保護するために、したがって理論的には、大規模で、モーメント法は、見積もりに基づいています大規模なサンプルアプリケーションオブジェクト。

K未知のパラメータは、一般的にそこに使用一般的にk次のKサンプルの瞬間前に、適切な瞬間の前に推定した後、一瞬の全体的な機能と未知パラメータを使用することができている場合は、我々は、パラメータ推定を得ます。

2、順序統計法

受注統計が提供さXの母集団のサンプルを、彼らが配置された大規模に運ばれ、この配置はと呼ばれる統計サンプル順序一つのサンプル、大型にもたらし観測のセット

これに対応し、前記
観測値は、最小であります
これは、観測値の最大です。 例えば 、サンプル値3.15,2.98,3.16,3.05,2.90、2.90,2.98,3.05,3.15,3.16の順序統計量  
この方法は、推定のシンプルで直感的な方法で推定するための統計量を推定するための統計では、多くの場合、全体的な数学的期待値と標準偏差でした。
設定し 、全体的なサンプル順序統計Xのために、と呼ばれる ため のサンプルの中央値。 中央サンプル
観察
値ルールは次のとおりです。サンプルの観察
統計的観測の大量に小さいものから順に並べ
nがである場合、奇数(即ち、N = + 1 2K)
中央で撮影したデータ
; nが偶数(N = 2K)である場合、
2つのデータセンターの平均を取ります
その
意味のビット数から見て、それは、従って、Xの平均の全体的な情報値をもたらし Xの推定総数学的期待値が適切であるため です。試料に使用されるビットの数
この方法の数学的期待値のX全体の推定値は、の数学的期待値E(X)と呼ばれる 法律を推定するための統計情報を 結果として、量および推定値を推定する点があります。

3、最尤法

  確率分布Dが与えられると、確率密度関数(連続分布)または確率集計関数(離散分布)であると仮定すると 、F D 、および分布パラメータθは、我々が有するこのプロファイルから抽出することができる N個 のサンプルX1の値をX2、...、Xnのは、使用して のF Dを 、私たちは確率を計算することができます しかし、我々はこれらが分布D.からのデータをサンプリングすることを知っているにもかかわらず、θの値を知らないかもしれません θを推定する方法は?自然のアイデアが持つこのプロファイルから抽出された n個の θを推定するために、X1、X2、...、Xnのは、その後、使用これらのサンプル・データのサンプリング値を。およそθの推定値を検索します。最尤推定を約θ(すなわち、すべての可能で、θの値は、サンプルの「可能性」の価値の最大化を探してください)の最も可能性の高い値を探します。このような非偏った推定値θとしてだけで他のいくつかの推定方法、このアプローチは、出力は非偏った推定最も可能性の高い値ではないかもしれないが、過大評価されなかったり出力にθの値を過小評価しますどちらも。最尤推定法を達成するために、数学的に定義可能:
そして、θの全ての値は、この関数が最大となるように。最大値が知られるようになる可能性 最尤推定値のθ

図4に示すように、最小二乗法

 

 

 観察はサンプルの私達の複数のセットで、理論値は、我々の仮説フィッティング機能です。目的関数は、多くの場合、機械学習損失関数に言われて、私たちの目標は、目標関数がときフィット関数モデルを最小化され得ることです。我々は、m個のサンプルの特徴の一つだけ持っているような単純な線形回帰の簡単な例を示します。

 

 

 

 以下のサンプルを使用してフィッティング機能:我々は、θxは、フィッティング関数に対応する2つのパラメータを有し、サンプルを持って0 と、θ 1を求める必要があります。

目的関数は以下のとおりです。

 

 

 ように、最小二乗法によってそれを行うJ θは0 θは。1 最小すなわちJ取得するように、θは0 θは1 最低でθを0 と、θ 1だから、フィッティング関数はに来るでしょう。

参考ます。https://www.cnblogs.com/pinard/p/5976811.html


第二に、区間推定

区間推定は、母集団パラメータ推定値の範囲間隔を与えられた点推定値に基づいており、この間隔は通常、プラスまたはマイナスの推定誤差の統計値を得られた試​​料です。一般的なパラメータはサンプル統計のサンプリング分布に基づく確率サンプル統計の指標を与えることができますどの程度近い場合には異なる点推定値、区間推定、

1 、区間推定人口パラメータ:転送:https://blog.csdn.net/liangzuojiayi/article/details/78043658

  • 全体の平均区間推定
  •  

     

  • 区間推定の全体的な割合
  •  

     

  • 母分散の区間推定
  •  

     

     

     

        

2、2つの集団のパラメータの間隔の推定値:転送します。https://blog.csdn.net/liangzuojiayi/article/details/78044718

  • 2人の人口の違いのための間隔を推定意味します
  • 大きなサンプル
  •  

     小さなサンプル

  •  

     

     

     

  • 全体的な割合の2つの推定値の違いのために間隔
  •  

     

  • 2つの区間推定の全体的な分散比
  •  

     

     

     


OK第三に、サンプルサイズ:転送します。https://blog.csdn.net/rosa_zz/article/details/79562794

•サンプルサイズ:

個人または単位からなるサンプル集団のサンプル数の数。

•必要なサンプルサイズ:

また、ユニットの必要サンプル数として知られている、少なくとも満たすように選択し、ケースを調査するために必要なサンプル単位の数です。

1は、サンプル集団を意味する時間の量を決定するために推定されています

1.繰り返しサンプリング

与えられた値と全体の標準偏差σの信頼レベル(1-α)、決定された上の値Zα/ 2、一旦、サンプルが必要な許容誤差の任意の所望の容量を決定することができます。Eが必要な公差を達成するために表し、それは次のようになります。

 

決意は、サンプルボリュームに以下の式をプッシュすることができます。

 

2.サンプリングを繰り返さないでください。

 

•nはサンプルサイズと母分散に比例し、
•絶対誤差に反比例し、
•確率の程度に比例。

例:MBA大学院の給与の標準偏差は約4,000元です、あなたは年俸の推定95%信頼区間をしたいと仮定し、エラーを許可するには、サンプルサイズを描画する必要があるどのくらいの、万元ですか?

2、サンプル集団の割合を決定するための時間の見積額

1.繰り返しサンプリング

信頼水準(1-α)と、値Zα/ 2が決定されます。全体の比の値は固定されているので、公差が大きいエラーを可能にするために、サンプルサイズ、小さいサンプルサイズによって決定されます。推定の精度、より良いです。このように、πの所与の値に対して、それが所望される任意のエラーサンプルサイズが必要な可能を決定することができます。Eが必要な公差を達成するために表し、それは次のようになります。

 

これは、下記式を繰り返しサンプリングし、無限の人口サンプリングサンプルサイズの決意を推定することができます。

 

2.サンプリングを繰り返さないでください。

 

•D値は一般に0.1未満
•未知のπ、サンプルの割合pを交換します
ときのp。•πまたは不明である、それは0.5が望ましいが、これは慎重な推定値であります

例:誤差範囲は5%に設定されている場合、コミュニティの調査では、スポーツ活動に参加する住民の割合を知りたいサンプル、パラメータ推定と95%の信頼水準かどうか尋ね、どのくらいのサンプルの?

 

 メモは、サンプルサイズを決定します

まず、使用することは、実際にサンプリングが、リサンプリングの代わりに使用される式を繰り返されることはありません。

第二に、pと未知の、どのプロセスがあるとします。

        代わりに、過去の1.最近のデータ、

        2.代わりのサンプルデータを使用して、

        3.テイクP = 0.5または0.5の値に最も近いです。

第三に、同じ集団は、Nxの、Np個の範囲を取得した場合、その後、必要に応じて、より大きなサンプルサイズを取ります

        調査の2種類を行う必要性を満たすために。

第四に、実際には、多くの場合、リサンプリングのための単純なランダムサンプリングの式を使用して。

おすすめ

転載: www.cnblogs.com/zym-yc/p/11484974.html