求回归方程

前言

直接计算

只要理解给定公式的含义,分布计算即可;


数据处理

如果数据不做处理,根本无法计算;

例5 【对统计大数据的预处理】【2019高三理科数学第二次月考第18题】某地随着经济发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年底余额),如下表1:

月份\(x\) 2011 2012 2013 2014 2015
储蓄存款\(y\)(千亿元) 5 6 7 8 10

为便于计算,将上表做一处理,令\(t=x-2010\)\(z=y-5\),得到下表2:

时间代号\(t\) 1 2 3 4 5
\(z\) 0 1 2 3 5

附可能用到的公式:线性回归直线为\(\widehat{y}=\widehat{b}x+\widehat{a}\)

\(\widehat{b}=\cfrac{\sum\limits_{i=1}^n{(x_i-\bar{x})(y_i-\bar{y})}}{\sum\limits_{i=1}^n{(x_i-\bar{x})^2}}=\cfrac{\sum\limits_{i=1}^n{x_iy_i-n\cdot\bar{x}\cdot\bar{y}}}{\sum\limits_{i=1}^n{x_i^2-n\cdot\bar{x}^2}}\)

\(\widehat{a}=\bar{y}-\widehat{b}\cdot\bar{x}\).

(1)求\(z\)关于\(t\)的线性回归方程。

分析:需要先注意\(z\rightarrow y\;\;\)\(t\rightarrow x\;\;\),然后将所给的公式翻译为关于\(z\)\(t\)的公式,这涉及到数学素养,公式的正向迁移。

由表格可知,\(\bar{t}=3\)\(\bar{z}=2.2\)\(\sum\limits_{i=1}^5{t_iz_i}=45\)\(\sum\limits_{i=1}^5{t_i^2}=55\)

\(\widehat{b}=\cfrac{\sum\limits_{i=1}^n{t_iz_i-n\cdot\bar{t}\cdot\bar{z}}}{\sum\limits_{i=1}^n{t_i^2-n\cdot\bar{t}^2}}\)

\(=\cfrac{45-5\times 3\times 2.2}{55-5\times 9}=1.2\)

\(\widehat{a}=\bar{z}-\widehat{b}\cdot\bar{t}=2.2-3\times 1.2=-1.4\)

\(\hat{z}=1.2t-1.4\)

(2)通过(1)中的方程,求出\(y\)关于\(x\)的线性回归方程。

分析:将\(t=x-2010\)\(z=y-5\)代入\(\hat{z}=1.2t-1.4\)

得到\(y-5=1.2\times (x-2010)-1.4\)

\(\hat{y}=1.2x-2408.4\)

(3)用所求的线性回归方程预测,到\(2020\)年底,该地的储蓄存款余额可达到多少?

分析:当\(x=2020\)时,代入\(\hat{y}=1.2x-2408.4\)

得到\(\hat{y}=1.2\times 2020-2408.4=15.6(千亿元)\)

相关链接:数据预处理的不同思路,数据预处理

高阶应用

例8 【2015新课标Ⅰ第19题】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费\(x\)(单位:千元)对年销售量\(y\)(单位:t)和年利润\(z\)(单位:千元)的影响,对近8年的年宣传费\(x_i\)和年销售量\(y_i\)(\(i=1,2,…,8\))数据作了初步处理,得到下面的散点图及一些统计量的值。

\(\bar{x}\) \(\bar{y}\) \(\bar{w}\) \(\sum\limits_{i=1}^{8}{(x_i-\bar{x})^2}\) \(\sum\limits_{i=1}^{8}{(w_i-\bar{w})^2}\) \(\sum\limits_{i=1}^{8}{(x_i-\bar{x})(y_i-\bar{y})}\) \(\sum\limits_{i=1}^{8}{(w_i-\bar{w})(y_i-\bar{y})}\)
\(46.6\) \(563\) \(6.8\) \(289.8\) \(1.6\) \(1469\) \(108.8\)

表中\(w_i=\sqrt{x_i}\)\(\bar{w}=\cfrac{1}{8}\sum\limits_{i=1}^{8}{w_i}\)

附:对于一组数据\((u_1,v_1)\)\((u_2,v_2)\)\(\cdots\)\((u_n,v_n)\),其回归直线\(v=\alpha+\beta u\)的斜率和截距的最小二乘估计分别为\(\hat{\beta}=\cfrac{\sum\limits_{i=1}^{8}{(u_i-\bar{u})(v_i-\bar{v})}}{\sum\limits_{i=1}^{n}{(u_i-\bar{u})^2}}\)\(\hat{\alpha}=\bar{v}-\hat{\beta}\bar{u}\)

(Ⅰ)根据散点图判断,\(y=a+bx\)\(y=c+d\sqrt{x}\)哪一个适宜作为年销售量\(y\)关于年宣传费\(x\)的回归方程类型?(给出判断即可,不必说明理由)

分析:由散点图可以分析,\(y=c+d\sqrt{x}\)更适宜作为年销售量\(y\)关于年宣传费\(x\)的回归方程类型,图中的变量呈现曲线回归。

(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立\(y\)关于\(x\)的回归方程;

分析:令\(w=\sqrt{x}\),先建立\(y\)关于\(w\)的线性回归方程,

由于\(\hat{d}=\cfrac{108.8}{1.6}=68\)

\(\hat{c}=\bar{y}-\hat{d}\bar{w}=563-68\times 6.8=100.6\)

所以\(y\)关于\(w\)的线性回归方程为\(\hat{y}=100.6+68w\)

\(y\)关于\(x\)的线性回归方程为\(\hat{y}=100.6+68\sqrt{x}\).

(Ⅲ)已知这种产品的年利润\(z\)\(x\)\(y\)的关系为\(z=0.2y-x\),根据(Ⅱ)的结果回答下列问题:

(i)年宣传费\(x=49\)时,年销售量及年利润的预报值是多少?

分析:由(Ⅱ)知,年宣传费\(x=49\)时,年销售量的预报值\(\hat{y}=100.6+68\sqrt{49}=576.6\)

年利润\(z\)的预报值\(\hat{z}=0.2\times 576.6-49=66.32\)

(ii)年宣传费\(x\)为何值时,年利润的预报值最大?

分析:由(Ⅱ)知,年利润\(z\)的预报值\(\hat{z}=0.2\times (100.6+68\sqrt{x})-x\)

\(=-x+13.6\sqrt{x}+20.12=-[(\sqrt{x})^2-13.6\sqrt{x}]+20.12\)

\(\sqrt{x}=\cfrac{13.6}{2}=6.8\)时,即当\(x=46.24\)时年利润的预报值最大。

猜你喜欢

转载自www.cnblogs.com/wanghai0666/p/12696272.html