07 統計モデル演習

SPSS を使用して分析および解決する

最初の質問

  1. 以下の表 1.1 は、1994 年から 2016 年までの中国の国内観光総支出 Y、GDP X1、鉄道走行距離 X2、高速道路走行距離 X3 のデータです。以下の質問をそれに応じて分析してください: (1) 単純な線形回帰モデルを確立し、それぞれ分析します
    。中国の国内観光総支出とGDP、鉄道走行距離、高速道路走行距離データとの関係。
    (2) 確立された回帰モデルをテストし、いくつかのモデル推定値のテスト結果を比較します。
国内旅費総額/MP GDP/億元 鉄道走行距離/10,000km 高速道路走行距離/10,000km
1994年 1023.5 48637.5 5.9 111.78
1995年 1375.7 61339.9 6.24 115.7
1996年 1638.4 71813.6 6.49 118.58
1997年 2112.7 79715 6.6 122.64
1998年 2391.2 85195.5 6.64 127.85
1999年 2831.9 90564.4 6.74 135.17
2000年 3175.5 100280.1 6.87 167.98
2001年 3522.4 110863.1 7.01 169.8
2002年 3878.4 121717.4 7.19 176.52
2003年 3442.3 137422 7.3 180.98
2004年 4710.7 161840.2 7.44 187.07
2005年 5285.9 187318.9 7.54 334.52
2006年 6229.7 219438.5 7.71 345.7
2007年 7770.6 270232.3 7.8 358.37
2008年 8749.3 319515.5 7.97 373.02
2009年 10183.7 349081.4 8.55 386.08
2010年 12579.8 413030.3 9.12 400.82
2011年 19305.4 489300.6 9.32 410.64
2012年 22706.2 540367.4 9.76 423.75
2013年 26276.1 595244.4 10.31 435.62
2014年 30311.9 643974 11.18 446.39
2015年 34195.1 689052.1 12.1 457.73
2016年 39390 743585.5 12.4 469.63

画像-20230721200241386

画像-20230721200345432

画像-20230721200352912

国内総生産

画像-20230721200605599

画像-20230721200451730

y ^ 1 = − 3228.021 + 0.05 x R 2 = 0.957 、 t = 21.68 \begin{aligned}\widehat{y}_{1}=-3228.021+0.05x\\ R^{2}=0.957,t=21.68 \end{整列}y 1=3228.021+0.05 ×R2=0.957 t=21.68

R 2 =0.957 は、構築されたモデルが全体的にサンプル データによく適合していることを示しています。

回帰係数 t の検定、t=21.7>t 0.025 (21)=2.08、傾き係数の有意性は、GDP が中国の総国内観光支出に重大な影響を与えていることを示しています。

鉄道走行距離

画像-20230721201207504

画像-20230721201222091

y ^ 2 = − 39438.731 + 6165.253 x R 2 = 0.971 、 t = 26.496 \begin{aligned} \widehat{y}_{2}=-39438.731+6165.253x \\ R^{2}=0.971,t=26.496 \end{整列}y 2=39438.731+6165.253 ×R2=0.971 t=26.496

R 2 =0.971 は、構築されたモデルが全体的にサンプル データによく適合していることを示しています。

t=26.496>t 0.025 (21)=2.08. 傾き係数の重要性は、鉄道の走行距離が国内観光支出の総額に大きな影響を与えることを示しています。

高速道路の走行距離

画像-20230721201636333

画像-20230721201644013

y ^ 3 = − 9106.166 + 71.639 x R 2 = 0.701 、 t = 7.04 \begin{aligned}\widehat{y}_{3}=-9106.166+71.639x\\ R^{2}=0.701,t=7.04 \end{整列}y 3=9106.166+71.639 ×R2=0.701 t=7.04

R 2 =0.701 は、構築されたモデルが全体的にサンプル データによく適合していることを示しています。

t=7.04>t 0.025 (21)=2.08. 傾き係数の有意性は、道路走行距離が国内観光支出総額に大きな影響を与えていることを示しています。

質問2

  1. 21世紀に入ってから、中国の家庭用自動車は急速に成長した。家庭用自動車の所有は、経済成長、公共サービス、市場価格、交通事情、社会環境、政策要因の影響を受けます。いくつかの主要な要因と家庭用自動車の台数との定量的な関係を調べるために、「100 世帯が所有する家庭用自動車の台数」、「1 人当たりの地域総生産」、「都市人口の割合」などの変数を選択しました。 2016 年の全国すべての州の「消費者物価指数」 地区と都市の関連データは表 1.2 のとおりです。次の質問を分析してみましょう: (1) 国民が所有する家庭用自動車の台数の計量経済モデルを確立
    する100 世帯を対象にパラメータを推定し、モデルをテストします。テスト結果の根拠は何ですか? (
    2) モデルのパラメータを分析します。推定結果の経済的意義について、モデル推定テストの結果をどのように解釈しますか?
    (3) ) モデルをどのように改善する必要があると思いますか?
エリア 100世帯当たりの家庭用自動車所有台数 一人当たりGDP/万元 都市人口の割合/% 消費者物価指数 (前年 = 100)
北京 47.3 11.81 86.5 101.4
天津 43.1 11.45 82.93 102.1
河北省 35.3 4.29 53.32 101.5
山西省 24.6 3.54 56.21 101.1
内モンゴル 34.1 7.19 61.19 101.2
遼寧省 24.2 5.08 67.37 101.6
吉林省 21.4 5.41 55.97 101.6
黒竜江省 14.2 4.05 59.2 101.5
上海 29.3 11.64 87.9 103.2
江蘇省 37.9 9.67 67.72 102.3
浙江省 45.2 8.45 67 101.9
安徽省 18.7 3.94 51.99 101.8
福建省 26.5 7.44 63.6 101.7
江西省 21.5 4.03 53.1 102
山東省 44.1 6.84 59.02 102.1
河南省 23.7 4.25 48.5 101.9
湖北省 17.6 5.55 58.1 102.2
湖南省 21.4 4.62 52.75 101.9
広東省 29.4 7.35 69.2 102.3
広西チワン族自治区 22.2 3.79 48.08 101.6
海南 18.1 4.42 56.78 102.8
重慶 19.6 5.82 62.6 101.8
四川省 20.4 3.99 49.21 101.9
貴州省 21.2 3.31 44.15 101.4
雲南省 28.7 3.1 45.03 101.5
チベット 23.3 3.48 29.56 102.5
陝西省 19.9 5.09 55.34 101.3
甘粛省 18 2.76 44.69 101.3
青海省 30.5 4.34 51.63 101.8
寧夏回族自治州 30.1 4.69 56.29 101.5
新疆 25.2 4.02 48.35 101.4

画像-20230722141940623

画像-20230722141945032

画像-20230722141952356

(1) モデルの確立: y=612.785+4.812x 1 -0.445x 2 -5.768x 3

モデルのチェック:

  1. R 2 =0.62、修正 R 2 =0.578、1 に近く、サンプルの適合が良好であることを示します
  2. F检验:F=14.7>F0.05(3,27)=2.97,拒绝原假设,说明“人均地区生产总值”、“城镇人口比重”、“居民消费价格指数”对“百户拥有家用汽车量”有显著影响
  3. T检验:t0.025(27)=2.052,在模型系数中,t的值分别为2.435、4.696、-2.194、-2.337,四个的绝对值均大于2.052。同时,四个变量的显著性值P均小于0.05。因此可以判断“人均地区生产总值”、“城镇人口比重”、“居民消费价格指数”对“百户拥有家用汽车量”有显著影响

检验依据:

  1. 可决系数越大,说明拟合程度越好。
  2. F 的值与临界值比较,若大于临界值,则否定原假设,回归方程是显著的; 若小于临界值,则接受原假设,回归方程不显著。
  3. t 的值与临界值比较,若大于临界值,则否定原假设,系数都是显著地:若小于临界值,则接受原假设,系数不显著。
  4. 显著水平与p值比较,若大于p值,则可在显著性水平下拒绝原假设,系数显著:若小于p值,则接受原假设,系数不显著。

(2)模型估计结果说明,在假定其他变量不变的情况下,人均地区生产总值每增长1万元,百户拥有家用汽车量增加4.812辆;城镇人口比重每增长1%,百户拥有家用汽车量减少0.445辆;居民消费价格指数增长1个百分点,百户拥有家用汽车量减少5.768辆。

(3)模型改进

y=28.35+4.683x1-0.399x2-2.55*10-44ex3

y = 28.35 + 4.683 x 1 − 0.399 x 2 − 2.55 × 1 0 − 44 e x 3 \begin{aligned}y=28.35+4.683x_{1}-0.399x_{2}-2.55\times 10^{-44} e^{x_{3}}\end{aligned} y=28.35+4.683x10.399x22.55×1044ex3

画像-20230722144803986

image-20230722144808929

image-20230722144812710

模型改进后R2=0.636,修正后的R2=0.596,样本拟合度更高

第三题

  1. 5个水稻品种的产量比较实验,随机区组设计,4次重复,获得每个小区产量资料如下表1.3,试分析这5个水稻品种间产量水平有无明显差异。
品种 区组(重复)
1 2 3 4
1 61 57 55 56
2 53 52 50 51
3 52 58 55 57
4 58 56 53 53
5 53 51 54 55

对原始数据集进行调整

X Y1
61 1
57 1
55 1
56 1
53 2
52 2
50 2
51 2
58 4
56 4
53 4
53 4
53 5
51 5
54 5
55 5
52 3
58 3
55 3
57 3

image-20230721222522907

image-20230721222547147

image-20230721222552328

image-20230721222556542

image-20230721222602165

image-20230721222605279

在方差齐性检验表中,显著性均大于0.05,因此满足方差齐性这一前提条件。

在ANOVA表中,F对应的显著性0.022小于0.05,因此拒绝原假设,认为五组数据中,至少有一组数据与其它几组数据之间存在显著性差异的。

在多重比较表中,分析LSD下的比较结果得出结论:

品种1的产量显著高于品种2、5;品种2的产量显著低于品种1、3、4

品种1和品种3、4无显著差异;品种2和品种5无显著差异;品种5和品种2、3、4无显著差异

第四题

  1. 教師は、オーディオ、ビデオ、コンピューターの使用など、歴史を教える新しい方法を模索しています。彼は、これらの新しいテクノロジーが、より才能のある学生と同じように平均的な学生に影響を与えるかどうかを知りたいと考えていました。普通の学生 12 名と才能のある学生 12 名をランダムに 3 つのグループに分け、学期末に全員が同じ最終試験​​を受けました。結果は以下の表 1.4 に示されています。2 因子 ANOVA を試し、結果の ANOVA 表を生成し、結果を分析してレポートします。
分類 伝統的な手法 オーディオとビデオ コンピューター
普通の学生 72 69 63
83 66 72
96 78 78
79 64 59
才能のある生徒が増える 83 96 89
95 87 93
89 93 86
98 86 95

元のデータセットの調整

バツ Y1 Y2
72 1 1
69 1 2
63 1 3
83 1 1
66 1 2
72 1 3
96 1 1
78 1 2
78 1 3
79 1 1
64 1 2
59 1 3
83 2 1
96 2 2
89 2 3
95 2 1
87 2 2
93 2 3
89 2 1
93 2 2
86 2 3
98 2 1
86 2 2
95 2 3

image-20230722161228148

image-20230721224059966

image-20230721224106231

Levine の誤差分散の等価検定表によると、有意値はすべて 0.05 より大きいため、分散の均一性の条件が満たされています。

被験者間効果テスト表を分析すると、次の結論が導き出されます。

  1. Y1 のテスト統計値、F=37.423、P<0.001<0.05 は、生徒に才能があるかどうかが生徒の成績に大きな影響を与えることを示しています。
  2. Y2 のモニタリング統計、F=2.838、P=0.085>0.05 は、指導方法の変更が生徒の成績に重大な影響を与えていないことを示しています。
  3. Y1*Y2 のモニタリング統計、F=2.384、P=0.121>0.05 は、生徒の才能の有無と指導方法の間に相互作用がない可能性があることを示しています。

上記の分析と記述統計表に基づいて、次の結論を導き出します。

より才能のある生徒の成績は、普通の生徒の成績よりも著しく高い 指導方法が生徒の成績に大きな影響を与えるかどうかは結論づけることはできないが、既存のデータの分析では、従来の指導方法を使用した生徒の成績の方が優れている新入生よりも指導方法が異なります。

おすすめ

転載: blog.csdn.net/qq_61228493/article/details/131873566