共線性を解決するためのロジスティック回帰

説明変数は、高度に理論的な観察と相関している2つの説明変数が高度に相関していることは理論的には可能、必ずしも関連しない高度に関連しているが、必ずしも高度に相関観察、およびその逆。だから、マルチ共線は、基本的にデータの問題です。

多重共何カテゴリの理由があります。

1は、説明変数は、共通のタイムトレンドを受けることができます。

図2は、両方がトレンドに追随する傾向があり、別の説明変数のラグです。

収集されたデータの根拠は十分に広くないよう3、説明変数の一部が一緒に変更される可能性があります。

図4に示すように、特定の説明変数の存在との間のいくつかの近似線形関係。

判定:

1は、間違ったサイン係数の推定値を発見しました。

図2に示すように、いくつかの重要な説明変数tの値が低くはなく、ローサイドR

3、あまり重要で説明変数が削除されると、回帰結果が著しく変化。

検査;

図1に示すように、相関分析、相関係数は、多重共線の存在を示し、0.8以上である;しかし、低い相関係数を、および多重共線不在を表すことができません。

2、試験VIF。

図3に示すように、係数試験条件;

ソリューション:

図1は、データを増加させます。

図2は、モデルに特定の制約を課します。

3つまたは複数の同一直線上の変数を削除するには、

図4に示すように、適切な変形モデル。

5、主成分回帰

マルチ懲戒共直線プロセス:

1、多重共が広まっている、やや多重共は、措置をとることができます。

2、深刻な多重共、回帰分析と一般的に経験上、または通過基づきことがわかりました。影響係数兆候は、重要な説明変数tの値が非常に低いです。さまざまな状況に応じて必要な措置をとること。

3、唯一の予測モデルのために、限り、適合度は良好であるとして、多重共の問題に対処していない場合は、多重共モデルが予測された結果には影響を与えないことが多いが予測するために使用されているとき。

おすすめ

転載: www.cnblogs.com/ivyharding/p/11505475.html