統計の基本的な概念[統計ノート]

統計の基本的な概念[統計ノート]

統計は、より良い方法論の規律決定するためには、法律ことがわかった、効率的な収集、処理、分析およびデータの解釈です。これは、データの法律がより良い意思決定を行うためにすることが分かりました。客観性、適用性、正確性と適時性:統計の法則を発見するには、通常、要件です。

データを分析する方法は、記述統計、推測統計です。

  • 記述統計

値は表形式またはグラフ形式で表されると記述統計①有用な情報は、収集されたデータを処理します。

②記述統計は、統計的推論、統計的なコンサルティング、統計的な意思決定に必要な情報を提供基盤、です。

  • 推測統計は、データの特徴の全体的な特性を推定または試験するサンプルデータに基づいています。

それは現実的な問題を解決するためにどのように重要です

基本的な考え方は、統計学的に現実的な問題を解決である:
       ①統計に関連する実用的な問題を作る。
       ②効果的なインジケータシステムを確立する。
       ③収集したデータ、
       ④処理効率的な統計的方法の選択または作成、収集されたデータの表示特性、
       ⑤に係ります合理的な推論全体の特性を作るための定性的および定量的な知識と組み合わせたデータ収集機能、;
       推論に基づく⑥ギブアドバイスより良い意思決定、
       問題解決では、繰り返しステップ②-⑥。


    
統計のいくつかの基本的な概念

全体的に、ユニットおよびサンプル

  • 全体:全体的な統計は、客観的な現実、一定の均質全体と個々の多くのものか​​らなる、特定の目的に応じて決定されています。

(1)均質性は、与えられた統計や研究目的に基づいて母集団を決定するための基本的な基準です。意義も変化のその均質性によって決定されるも、一般的に異なるさまざまな研究目的、。

(2)母集団は、その全体的な統計情報の多くは、均質な単位の十分な数で構成されなければならない必要があります。

  • (単位と称する)全体的なユニットは、それぞれ全体的な個人で構成されています。
  • サンプル:一般的な部分のユニットの集合は、(これもサブサンプルとして知られている)のサンプルと呼ばれます。試料を構成するユニットがサンプルと称され、試料中のサンプルの数は、サンプルサイズと呼ばれます。

この問題を解決するための統計の目的は、データの一般的な特徴を認識することです。しかし、調査は破壊的である、または、コスト、時間、および考慮すべきその他の要因の、すべてのユニットを持っていることが不要または不可能では全体的な調査を構成します。

サイン、指標(パラメータ)と統計

  • マーク:総合ユニットは、一般的に、フラグと呼ばれる属性や特性を持っています。その性能品質マークと上のマーカーの数にサインインします。

       ユニットは、プロパティの側面を備えていること①品質マークを示し、品質マークの性能は、非数値によって記述することができます。例えば、商品のカテゴリ、性別の住民。
       ②番号フラグは展示は数値を使用する態様の単位の数、の特徴を示します。例:商品価格、販売量、収入の住民。

  • パラメータ(マーク):機能の数と値の全体的な概念はまた、パラメータとして知られている統計的な指標を、呼び出した回数。統計的指標は、2つの基本的な要素、すなわち値の概念と指標指数から成ります。インデックスの概念は抽象化の自然現象だけでなく、機能の全体的な数の規範的な性質を研究することです。たとえば、次のよう千万の居住人口は60億元、総収入の数。

統計的指標の表現は指標や品質インジケータの数に応じて分割することができます。

①現象の合計サイズを反映する人は、統計的指標の全体的なレベルを表すために絶対数と、定量的指標と呼ばれます。例えば、600億元などの総収入で10万人の総数は、。
②現象を反映する人は平均相対数に又は表現することが、比較的レベルと品質指標と呼ばれる統計的指標の品質である。例えば、企業の労働者のための5000元、作業者の出席93%などの平均賃金。品質指標指数は、現象とrelativities間の固有のリンクを反映させるために凝集体を得ています。

単一のインデックスは、インデックスシステムを設定する必要がありますが、全体像を反映するものではありません。統計的インジケータシステムは、統計的な指標一連の有機全体は、相互依存の相互拘束のすべての側面を反映するために研究現象の構成要素を連結しています。

 

  • 統計

       知られている機能の統計サンプルは、サンプルの特性を説明するために、測定され表示します。サンプルの特性を説明するためのサンプル観測の既知の関数です。

       統計観測撮影したさまざまなサンプルが異なっています。標本平均、標本分散、統計サンプルの割合は、サンプルを採取した後、それは通常観察され、全体的な統計は、パラメータ、全体としてパラメータ推定に対応します。(走行距離とこれらの車の平均値で、16車の自動車生産の数から引き出さ自動車メーカーは、修飾された値を走行距離、収率車の平均バッチとして推定した場合。)


データ

変数と変数値
事実または変数として知られている現象の1説明された特徴の数は、上記標識、指標や統計は、名前が可変で要約します。
2.特定のパフォーマンス変数は、変数の値であるデータは可変であり、その性能が、また事実や数量ベースと呼ばれる目的のものを反映しています。
    例えば:それは変数の収入で、歳入のパフォーマンスが変動しました。
特に一緒に研究中に収集3.すべてのデータは、データセットと呼びます。
4.変数は決定変数に変数の値は、そのような従業員が立ち上がっとして確率変数(多くの不確定要因の影響を受け、(不確定要素、制御、解釈、はっきりしている要因によって影響を受けた)かどうかを判断します時間)。

尺度データ

4つの測定スケールのローからハイにデータを収集する際に必要な所定の距離スケールとスケールより与えられた公称スケール、スケール配列決定、測定の異なるスケールは、データ分析と処理の異なる方法を決定します。
1.公称スケール現象客観無秩序カテゴリーの測定値です。数学公称規模の主な特徴は、性別の居住者が男性であるように、「=」または「≠」、雌型計量、航空機は戦闘機、爆撃機、偵察機と他の測定、この値は非機会としてのみ使用されるありますコードシーケンスの分類。
2.シーケンシングスケールは、非数値測定対象現象整然としたカテゴリです。数学スケール配列決定の主な特徴は、「<」や「>」、例えば、住民満足度の測定は、非常に満足に分割満たし、一般に、満足し、非常に5つのカテゴリーに満足させることができます。これは、コードのみと秩序の分類としての価値の機会を使用していました。
3.固定距離スケールは、意味のある測定間隔数値目的現象です。これは正確な値で現象の量との差を反映して、所定の距離スケールの主な数学的特性は、「+」は「 - 」。集計指標として測定スケールから与えられます。
(0が存在しないことを意味するものではない)
。4.スケールは、2つの値よりも意味のある固定比測定対象現象です。与えられた数学的比率スケールの主な機能は、「X」「/」である
平均数における相対的な品質指標の数が一定割合の測定スケール(0 =存在しない)であるように
5データ分類
(1)、公称スケール、スケール配列決定データをまとめて、定性的データと呼びます。質的変数は、質的データと変数です。
(2)固定されたスケールから、定量的なデータセットは、データよりもスケールと呼ばれます。量的変数は、定量的なデータを持つ変数です。
         量的変数の値の連続的存在下または非存在下、連続変数および離散変数に量的変数。
         ①連続変数は連続的であり、我々はそれらを一覧表示することができない所定の領域に可変です。以下のような:弾痕の位置、軍用機の製品寿命。
         ②離散変数は断続的である、それを列挙することができる変数の値を参照します。例えば、製品の数。 

データの種類


断面データ、時系列データとパネルデータ:観察対象現象の角度に応じて、統計を分けることができます。
1.断面データは、また、得られた同じ時刻のデータに同じ一般的な観察の異なる単位を指す静的データ、として知られています。例えば、断面データの一部に省、自治体や自治区の2014年総所得。
2.また、動的データとして知られている時系列データは、その時系列データを取得するために一定期間に同じ一般的な観察を指します。例えば、中国の「十二五」総所得における年度中には、時系列データの順に属しています。
時間と空間のデータ断面を撮影しながら3パネルは、二次元データです。例えば2005-2014 GDPデータ30社の企業。パネルデータ30社の企業データの10年、300個の観測値の合計によって。一年からは見るために、それは30社の合計出力値の数です。

 

公開された619元の記事 ウォンの賞賛185 ビュー660 000 +

おすすめ

転載: blog.csdn.net/seagal890/article/details/104889978