応用回帰分析の最終試験の知識ポイントの概要

単項線形回帰では、残差 e iの期待値 E(e i )=_ 0 ; 回帰分析では、不均一分散性の問題がある場合は、重み付き最小二乗法で対処する必要があります; 重回帰分析では, |XX|≈0 の場合、_多重共線性が生じます。ここで、X は計画行列です。回帰分析で一般的に使用されるサンプル データは、時系列データと _断面データ_に分けられます。統計的関係を研究するための現代統計の 2 つの重要な分野は、 _回帰分析です。分析と相関分析。回帰分析は、変数間の相関分析関係を扱う数学的統計手法です。回帰分析の不均一分散性の問題は、次の 3 つの影響を引き起こします: (1) パラメータの推定値は不偏ですが、不偏最小分散線形不偏推定量。(2) パラメータの有意性テストが失敗します。(3)回帰式の適用効果が極めて不十分である。独立変数を使用した回帰モデルの構築が非常に重要なプロセスである理由3. 回答: (1)) いくつかの重要な変数が省略されている場合、回帰式の効果は確実に良くありません。(2) 考慮する独立変数が多すぎる場合、これらの独立変数のうち、一部の独立変数は問題の研究にとって重要ではないか、一部の独立変数のデータ品質が劣っている、または程度の差が大きい可能性があります。独立変数間の値が重なると、計算量が増加するだけでなく、得られる回帰式の安定性が非常に悪くなり、式の適用に影響を及ぼします。回帰モデルは通常、因子分析、変数_予測_および_制御_で使用されます回帰分析と相関分析の違いと関係は何ですか? 関係: 回帰分析と相関分析はどちらも、変数間の関係を研究する統計トピックです。相違点: a. 回帰分析では、変数 y は従属変数と呼ばれ、説明される特別な位置にあります。相関分析では、変数 x と変数 y は等しい位置にあります。つまり、研究変数 y と変数 x の間の近さの程度は、研究変数 x と変数 y の間の近さの程度と同じです。b. 相関分析に含まれる変数 y と変数 x はすべて確率変数です。回帰分析では、従属変数 y は確率変数であり、独立変数 x は確率変数または非ランダム決定変数の場合があります。c. 相関分析の研究は、主に 2 種類の変数間の線形相関の密接な程度を説明することです。回帰分析は、変数 y に対する変数 x の影響を明らかにするだけでなく、回帰式によって予測および制御することもできます。回帰モデルにおけるランダム誤差項 ε の重要性は何ですか? ε はランダム誤差項です。ランダム誤差項の導入により、変数間の関係がランダム方程式として記述されるため、ランダムな数学的手法を使用して y と x1、x2… との関係を研究できるようになります。 ..xp. 経済現象は客観的なものであるため複雑であり、限られた数の要因で経済現象を正確に説明することは困難です。ランダム誤差項は一般に、人間の能力の限界により考慮されないさまざまな偶然の要因を表現できます。理解とその他の客観的な理由。線形回帰モデルの基本的な仮定は何ですか? 線形回帰モデルの基本的な仮定は次のとおりです。 1. 説明変数 x1.x2….xp は非ランダムであり、観測値 xi1.xi2…..xip は定数です。2. 等分散と無相関の仮定は E(εi)=0, i=1,2…. Cov(εi,εj)=σ^2, 3. 正規分布の仮定は互いに独立しています。4. サンプルサイズの数が説明変数の数より大きい、つまり n>p であるのですが、なぜ回帰モデルをテストする必要があるのでしょうか? 私たちの回帰モデルの目的は、経済問題の研究に適用することですが、このモデルをすぐに予測、制御、分析するために使用するのは明らかに賢明ではないため、このモデルが本当に説明されている内容を明らかにしているかどうかを判断するテストに合格する必要があります。 . 変数と説明変数の関係。重線形回帰モデルの行列表現を記述し、重線形回帰モデルの基本的な仮定を与えます。答え: 行列は y = Xβ +ε で表されます 線形回帰モデルの基本的な仮定は、①説明変数 x1….xp は確率変数ではなく決定変数であり、rank(X)= p +1<n が必要です; ② ランダム誤差項 平均がゼロで分散が等しい、つまり E(εi) = 0; i=1,2,...n; cov(εi,εj)=(i,j =1,2,...n) ③ 正規分布の仮定は独立変数の選択のためのいくつかの基準です1.自由度は複素決定係数を調整して最大値に達します2. AICおよび BIC基準3.C(p) 統計量が最小であるなぜ回帰を確立するために独立変数を選択する必要があるのか​​ モデルにおける非常に重要な問題(1) いくつかの重要な変数が省略されている場合、回帰式の効果は確実に良くありません。(2) 考慮する独立変数が多すぎる場合、これらの独立変数のうち、一部の独立変数は問題の研究にとって重要ではないか、一部の独立変数のデータ品質が劣っている、または程度の差が大きい可能性があります。独立変数間の値が重なると、計算量が増加するだけでなく、得られる回帰式の安定性が非常に悪くなり、式の適用に影響を及ぼします。多重共線性は回帰パラメータの推定にどのような影響を及ぼしますか? 回答: 1. 完全な共線性の下ではパラメータ推定量は存在しない; 2. 近似共線性の下では OLS 推定量は効果的ではない; 3. パラメータ推定量の経済的意味は不合理である; 4. 変数の有意性検定は意味を失う; 5. モデルの予測は失敗します。サンプルサイズ n と独立変数の数 p の関係について説明します。それらはモデルのパラメーター推定にどのような影響を与えるのでしょうか?答え: 1 重線形回帰モデルでは、サンプル サイズ n と独立変数の数 p の関係は n>>p です。n<=p の場合、モデルのパラメーター推定に重大な影響を及ぼします。理由: 1. 重線形回帰モデルでは推定すべきパラメータβがp+1個あるため、サンプルサイズの数が説明変数の数より大きくないとパラメータを推定できません。2. 説明変数 X は決定的変数であり、rank(X)=p+1<n が必要です。これは、計画行列 X の独立変数列に相関がないこと、つまり行列 X がフルランク行列であることを示します。 。Rank(X)<p+1 の場合、説明変数間に線形相関があり、(XX)-1 は特異行列となり、s の推定が不安定になります。不均一分散性検定 残差グラフ解析法1. フィッティング値は横軸 2. Xは横軸 3. 時間または通し番号は横軸 順位相関係数法(スピアマンテスト法)、不均一分散性の一項消去法、重み付き最小値二乗法 (最も一般的に使用される)、BOX-COX 変換法、分散安定性変換法 不均一分散の影響は何ですか? (1) パラメータ推定器が効果的でない (2) 変数の有意性検定が無意味である (3) 回帰式の適用効果が極めて不十分である。一般に、モデルに不均一分散が生じると、パラメータOLSの推定値のばらつきが大きくなり、Yの予測誤差が大きくなり、予測精度が低下し、予測関数が破綻する。系列相関が生じる理由1. 重要な変数が省略されると系列自己相関が生成される 2. 経済変数のヒステリシスにより系列に自己相関が生じる 3. 誤った回帰関数の形式を使用して自己相関が生成される 4. クモの巣現象により自己相関が生じる5.データ処理とシーケンス相関によって引き起こされるエラー項目間の自己相関は、どのような重大な結果をもたらしますか?回答: 通常の最小二乗法を直接使用して、ランダム誤差項の系列相関を使用して線形回帰モデルの未知のパラメーターを推定すると、次の問題が発生します: (1) パラメーター推定器はまだ偏りはありませんが、効果的ではありません。パラメータ推定値の分散は、自己相関がない場合よりも自己相関がある場合の方が大きくなります。(2) 平均二乗誤差 MSE は、誤差項の分散を大幅に過小評価する可能性があります。 (3) 変数の有意性検定は意味を失います。変数の有意性検定では、統計はパラメーター分散の正しい推定に基づいています。パラメータの分散が著しく過小評価されると、t 値と F 値が過大になる可能性があり、つまり、回帰パラメータ統計検定と回帰式検定が有意であるという重大な誤った結論につながる可能性があり、しかし、それらは実際には重要ではありません。(4) シリアル相関がある場合、それは依然として不偏推定値ですが、特定のサンプルでは、​​推定器が実際の状況を著しく歪める可能性があります。つまり、最小二乗法はサンプリングの変動に非常に敏感になります。(5) モデルの予測と構造解析が失敗する。DWテストの長所と短所をまとめます。回答: 利点: (1) 広く使用されており、一般的なコンピュータ ソフトウェアで DW 値を計算できます; (2) 少量のサンプルに適しています; (3) 最初の相関関係の問題をテストするのに使用できます。 -ランダム撹乱項目の次数自己回帰形式。欠点: (1) DW テストには未判定領域が 2 つあり、DW 値がこの領域に入ると判定できなくなります。現時点では、サンプル サイズを増やすか、他の方法を選択するだけです。(2) DW 統計の上限テーブルと下限テーブルには n>15 が必要です。これは、サンプルが小さい場合、残差を使用して次の値を作成することが困難であるためです。自己相関の有無の判定 (3) DW テストは、高次の系列相関を持つランダムな項目のテストには適していません。5.6 フォワード法とバックワード法の長所と短所は何ですか? 回答: フォワード法の利点は、従属変数に影響を与える独立変数を、その重要性と計算量に応じて 1 つずつ選択できることです。小さいです。フォワード方式の欠点は、新しい変数の導入後の変更を反映できないことと、重要でなくても選択した変数を削除できないことです。バックワード法の利点は、従属変数に重大な影響を及ぼさない独立変数を有意性に従って 1 つずつ削除でき、残りの独立変数はすべて有意であることです。バックオフ法の欠点は、大量の計算から開始され、独立変数が減少すると、再度入力する機会がなくなることです。独立変数間に相関がある場合、順法と逆法で作成した回帰式は問題の度合いが異なります。5.7 段階回帰法の思考法について議論する。回答: 段階的回帰の基本的な考え方は、出たり来たりがあるということです。具体的な方法としては、変数を 1 つずつ導入し、独立変数を導入する際に、選択した変数を 1 つずつテストする必要があります。回帰式への変数の導入または変数の削除は段階的回帰ステップであり、毎回新しい変数を導入する前に、有意な変数のみが回帰式に含まれていることを確認するために各ステップで F 検定が実行されます。このプロセスは、有意な変数が回帰式に導入されなくなり、有意でない変数が回帰式から削除されなくなるまで繰り返されます。このようにして、順方向方法と逆方向方法の欠陥が回避され、最終的な回帰サブセットが最適な回帰サブセットであることが保証されます。多重共線性の診断方法を列挙し、簡単に説明します分散拡張係数法: 変数 back の分散を係数ネットワークで拡張すると、back 変数と他の独立変数の間に重大な多重共線性があることがわかります。特性根の決定方法: 1. 特性根分析; 2. 条件番号 (条件番号がモデルに強い多重共線性があることを示している場合)。直感的判断方法とは、回帰係数の符号が経済的有意性を満たしていない、独立変数間の相関係数が大きい、一部の重要な独立変数が経済的有意性を満たしていないなど、モデルの出力結果に基づいて直感的に判断する方法です。有意性検定など 多重共線性は回帰パラメータの推定にどのような影響を及ぼしますか? 回答: 1. 完全な共線性の下ではパラメータ推定量は存在しない; 2. 近似共線性の下では OLS 推定量は効果的ではない; 3. パラメータ推定量の経済的意味は不合理である; 4. 変数の有意性検定は意味を失う; 5. モデルの予測は失敗します。多重共線性はサンプルサイズの数 n と独立変数の数 p から生じますか? 回答: それは関連しており、サンプル サイズを増やしてもモデル内の多重共線性を排除することはできませんが、多重共線性の影響を適切に排除することはできます。一般に独立変数の数 p が大きいと多重共線性が生じやすいため、独立変数の数は小さく、かつ正確である必要があります。多重共線性を排除する方法1. 無関係な変数を提案する 2. サンプルサイズを増やす 3. 回帰係数の偏った推定リッジパラメータ k を選択する方法は何ですか?回答: 最適な k は、未知のパラメーター β と β に依存します。一般的な選択方法は次のとおりです: (1) リッジ トレース法: k の点を選択すると、各リッジ推定値が基本的に安定し、リッジ推定値の符号が妥当になります。回帰係数に矛盾はなく、絶対値が経済的意義に沿っており、残差二乗和も大きくなりすぎない (2) 分散拡大係数法:c(k)=(X'X+kI)-1X 'X(X'X+kI)-1、その対角要素 Cjj(k) はリッジ推定の分散拡張係数です。Let c jj(k)≤10; (3) 残差二乗和: SSE(k)<cSSEを満たす最大の t 値。リッジ回帰法で独立変数を選択する際に従うべき基本原則は何ですか? リッジ回帰の変数を選択するための通常の原則は次のとおりです。 1. リッジ回帰の計算では、標準化されたリッジ回帰係数のサイズを直接比較できるように、関係する行列が中心に配置され、標準化されていると想定します。標準化リッジ回帰係数が比較的安定しており、絶対値が小さい独立変数を削除することができます; 2. k の値が小さい場合、標準化リッジ回帰係数の絶対値はそれほど小さいわけではありませんが、不安定であり、急激に上昇する傾向があります。ゼロに近づける。また、リッジ回帰係数が不安定で振動がゼロに向かう傾向がある独立変数を削除することもできます; 3. 標準化されたリッジ回帰係数が非常に不安定である独立変数を削除します。不安定なリッジ回帰係数が複数ある場合、どれをどれだけ除去するかは、ある変数を除去した後のリッジ回帰の再解析の影響を考慮して決定する必要があります。リッジ回帰とリッジトレース法による k 値の選択の一般原理1.各回帰係数のリッジ推定は基本的に安定しています2.符号に無理のある回帰係数は最小二乗法により推定され、リッジ推定の符号は妥当なものになります 3 .回帰係数は不経済ではない 4の有意性の絶対値。残差二乗和はあまり増加しない

おすすめ

転載: blog.csdn.net/qq_56437391/article/details/125404642