計算最小二乗回帰分析

  • 最小二乗統計の回帰分析の直線は、最も広く使用され、最も一般的な方法。このブログは主に、プロセス多重線形回帰と線形回帰が類似している推定の過程で線形回帰での最小二乗推定の過程についてです。
  1. まず、何であるかについての話回帰分析は:回帰分析は、変数(従属変数、独立変数)数理統計学の因果分析です。独立変数と従属変数が実際の関係であるが存在する場合、それは我々が回帰式を構築する意味があります。そのため、値かどうかを予測する従属変数の独立変数を要因?どのように関連性、および問題は、回帰分析となっていますどのように大きな確信のこの相関度の判定が取り組まなければなりません。
  2. 相関分析の程度、一般的な要件との間の相関関係、大きさ(範囲[1,1]内のピアソン係数Rは)独立変数と従属変数に関連付けられた相関係数の程度を決定する場合。
  • 文章のために、決定:上述したが、回帰分析は、回帰式であるので、次に、切片bが存在しなければならない、および回帰係数(Y = aXを+ bは、線形回帰を参照)、重要なステップの回帰式であります言葉は、限り、我々は置くとして、bは回帰式を書き出すことができます見つけます。それでは、どのaとbを見つけるには?見つけるために使用する方法?回帰式を達成するための方法を使用し、どのような条件では、これら2つの変数の間の関係を記述するより良いに設立されましたか?

  • すべての最小二乗法は、定義を初めて目にある:最小二乗法(また、最小二乗法として知られている)数学的な最適化手法であり、それは最高の二乗誤差関数を最小化することにより、データマッチングを探します。最小二乗法を使用して容易に未知のデータを計算し、そしてそのような決定されたデータと、これらの実際のデータとの間の最小二乗誤差ということができます。

  • 以下に示すように、点は実際の値を表し、破線回帰式との間に確立された表し、真の値が破線赤線の代表的なエラー、エラー値- (残差)、即ち、誤差=真値。ここに画像を挿入説明
    要件に応じて、次に最小二乗法:二乗誤差を最小とします。我々は、平方誤差の辺の長さとみなすことができ、図1に示すように正方形と二乗誤差の面積を決定することは、最小化されます。
    ここに画像を挿入説明
    そして、全てのパターンの領域:(Y1 -Y1真値の予測値)^ 2 +(Y2 -Y2真値の予測値)^ 2 + ... +(乃至Yn乃至Yn真値の予測値)^ 2と最小。
    我々数式が表現される:ここに画像を挿入説明
    オープンzの関数式を:
    少し上記![ここに挿入した画像(https://img-blog.csdnimg.cn/20181219100008797.gif)図は、誇張された外観とすることができます!
    我々は、次に:
    ここに画像を挿入説明
    以下の簡単な式を与えるために、上記の式に:
    ここに画像を挿入説明
    次に、それぞれ、部分取り、Bの単純な方程式であります:偏微分が0に等しく、以下の通りであるように、オン
    ここに画像を挿入説明
    ここに画像を挿入説明
    最後に、式2N仕上げ、利用可能な検索A、式Bの両側分割後:
    ここに画像を挿入説明
    最小二乗法により回帰係数bを計算することであり、回帰式の切片をステップは、回帰分析を持っていた後に導出プロセスが、プロのブロガーとして、統計学的に言えば、それは回帰式を計算するだけの方法であると思いますが、最も重要なことは、我々はまた、このようなリターンを得るために、先に述べました方程式、どのようにそれが度を当てはめるのか?回帰モデルを見つけるための良い方法はありませんか?
    そして、どのような統計は、フィット感が良いか悪いかを判断するには?私たちは、一般的にR ^ 2を使用し、
    R ^ 2 = SSR / SST:結論与え 、R ^ 0と1の間の2値、1に近いほど、より良いフィット感を。
    回帰平方和の代わりにSSR:ここに画像を挿入説明
    SSTは、二乗偏差の和を表しますここに画像を挿入説明

    :SSE式2 ^ R&LTするためのテーブルもある
    R&LT ^ = 2 1-SSE / SST、
    から構成されている:SST(合計偏差)= SSR + SSE及びRから^ 2 = SSR / SSTS変換が。
    全ての点は、SSEが0であることを示し、回帰直線上の真の値である場合、R ^ 2は1に等しく、
    YはXとYの変化によって引き起こされることを100%の手段の変化は、他の要因に影響を与えない、完全にYの回帰直線の変化を説明することができます。R ^ 2が非常に低い場合、XとYとの間に線形関係がないかもしれないことを示します

  • 変数を除くと
    元に、複数の独立変数のそのタイプ、低の従属変数の解釈上のいくつかの変数ならば、我々はそう簡単な回帰モデルという、クラス変数を排除することができます。変数の必要性について、このステップだから、有意差検定変数有意差検定の考え方:数理統計学の使用はもちろん、ここで話すことはありませんが、あまりにも深い理論的な知識を含む、統計を学びます。私たちは次のような結論に注意してください。

  • T試験
    Xiが重要でない場合はYリニア意義から(単一)可変XiのためのT検定は、可変手段は、金型から取り出すことができます。

  • Fテスト
    F-テストはXのために使用されたがYリニア全体的な意義のすべての独立変数から見ました。

T検定は、P値統計値結果、F検定は、統計結果の有意F値は、これらの値は、一般的有意レベルと比較されることを確認することがわかり、それ以下の有意水準よりも前記クリアと、当然のことながら、より小さな有意(有意水準は0.05と0.01、それぞれ、式の2つの一般的に用いられる有意水準があり、手動で設定されています)。

リリース5元の記事 ウォン称賛16 ビュー10000 +

おすすめ

転載: blog.csdn.net/data_bug/article/details/85072615