R多元线性回归分析

MechaCAr 项目的目的是审查生产数据以获得可能有助于制造团队的见解:

预测 MPG 的线性回归。执行多元线性回归分析以确定数据集中的哪些变量可以预测 MechaCar 原型的 mpg。
悬挂线圈的汇总统计。从制造批次中收集有关悬挂线圈的每平方英寸磅数 (PSI) 的汇总统计数据
悬架线圈的 T 检验。运行 t 检验以确定制造批次在统计上是否与平均总体不同
设计一项研究,将 MechaCar 与竞争对手进行比较。设计一项统计研究,将 MechaCar 车辆的车辆性能与其他制造商的车辆进行比较。

- Linear Regression to Predict MPG

image

根据我们的结果,变量:Intercept (5.08e-08)、vehicle_length (2.60e-12)、ground_clearance (5.21e-08) 为数据集中的 mpg 值提供了非随机量的方差,因为它们的 pr( >|t|)< 0.05。因此,它们对 mpg 值有重大影响。

此外,我们的线性回归分析的 pr(>|t|) 为 5.08 x 10-8,远小于我们假设的显着性水平 0.05%。因此,我们可以声明有足够的证据来拒绝我们的原假设,这意味着我们的线性模型的斜率不为零。

根据计算的 r 平方值为 0.7149,这意味着大约 71%。因此,可以预测线性模型。

- Summary Statistics on Suspension Coils

lot_summary 数据框如下:

image

lot_summary 数据框如下:

image

此外,MechaCar 悬挂线圈的设计规范规定悬挂线圈的差异不得超过每平方英寸 100 磅。因此,由于方差约为 62,这意味着当前的制造数据总共满足所有制造批次的此设计规范。

但批次 3 的方差约为 170,这意味着它不符合设计规范。

- T-Test on Suspension Coils

T
T 检验允许确定所有制造批次和每个批次是否与 1,500 PSI 的总体平均值有统计学差异。

根据所有制造批次计算的 p 值 1 高于 0.05。所以,拒绝原假设是不对的。均值是 1498,与总体均值很接近。image

对于制造批次 1,1.58 x 10-11 的 p 值低于 0.05。所以,拒绝原假设是正确的。平均值为 1500,与总体平均值相同。

image

对于制造批次 2,0.006 的 p 值低于 0.05。所以,拒绝原假设是正确的。均值是 1500.02,接近总体均值。

image

对于制造批次 3,0.1589 的 p 值高于 0.05。所以,拒绝原假设是不对的。均值是 1496.14,与总体均值很接近。

image

- Study Design - MechaCar vs Competition

将 MechaCar 车辆的性能与其他制造商的车辆的性能进行比较的统计研究如下。消费者会对成本、城市或高速公路燃油效率、马力、维护成本或安全等级等几个指标感兴趣。

零假设,因为 MechaCar 与竞争的指标之间没有差异。替代假设,因为 MechaCar 与竞争的指标之间存在差异。

要检验假设应使用 T 检验,就好像 p 值小于显着性水平一样,则拒绝原假设。

运行统计测试需要使用成本、城市或高速公路燃油效率、马力、维护成本、安全评级等数据。

资料下载:https://download.csdn.net/download/weixin_54707168/61645749

Guess you like

Origin blog.csdn.net/weixin_54707168/article/details/121886308