前言
直接计算
只要理解给定公式的含义,分布计算即可;
数据处理
如果数据不做处理,根本无法计算;
月份\(x\) | 2011 | 2012 | 2013 | 2014 | 2015 |
---|---|---|---|---|---|
储蓄存款\(y\)(千亿元) | 5 | 6 | 7 | 8 | 10 |
为便于计算,将上表做一处理,令\(t=x-2010\),\(z=y-5\),得到下表2:
时间代号\(t\) | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
\(z\) | 0 | 1 | 2 | 3 | 5 |
附可能用到的公式:线性回归直线为\(\widehat{y}=\widehat{b}x+\widehat{a}\),
\(\widehat{b}=\cfrac{\sum\limits_{i=1}^n{(x_i-\bar{x})(y_i-\bar{y})}}{\sum\limits_{i=1}^n{(x_i-\bar{x})^2}}=\cfrac{\sum\limits_{i=1}^n{x_iy_i-n\cdot\bar{x}\cdot\bar{y}}}{\sum\limits_{i=1}^n{x_i^2-n\cdot\bar{x}^2}}\),
\(\widehat{a}=\bar{y}-\widehat{b}\cdot\bar{x}\).
(1)求\(z\)关于\(t\)的线性回归方程。
分析:需要先注意\(z\rightarrow y\;\;\),\(t\rightarrow x\;\;\),然后将所给的公式翻译为关于\(z\)和\(t\)的公式,这涉及到数学素养,公式的正向迁移。
由表格可知,\(\bar{t}=3\),\(\bar{z}=2.2\), \(\sum\limits_{i=1}^5{t_iz_i}=45\), \(\sum\limits_{i=1}^5{t_i^2}=55\),
故\(\widehat{b}=\cfrac{\sum\limits_{i=1}^n{t_iz_i-n\cdot\bar{t}\cdot\bar{z}}}{\sum\limits_{i=1}^n{t_i^2-n\cdot\bar{t}^2}}\),
\(=\cfrac{45-5\times 3\times 2.2}{55-5\times 9}=1.2\),
\(\widehat{a}=\bar{z}-\widehat{b}\cdot\bar{t}=2.2-3\times 1.2=-1.4\)。
故\(\hat{z}=1.2t-1.4\)。
(2)通过(1)中的方程,求出\(y\)关于\(x\)的线性回归方程。
分析:将\(t=x-2010\),\(z=y-5\)代入\(\hat{z}=1.2t-1.4\),
得到\(y-5=1.2\times (x-2010)-1.4\),
即\(\hat{y}=1.2x-2408.4\)。
(3)用所求的线性回归方程预测,到\(2020\)年底,该地的储蓄存款余额可达到多少?
分析:当\(x=2020\)时,代入\(\hat{y}=1.2x-2408.4\),
得到\(\hat{y}=1.2\times 2020-2408.4=15.6(千亿元)\)。
相关链接:数据预处理的不同思路,数据预处理
高阶应用
\(\bar{x}\) | \(\bar{y}\) | \(\bar{w}\) | \(\sum\limits_{i=1}^{8}{(x_i-\bar{x})^2}\) | \(\sum\limits_{i=1}^{8}{(w_i-\bar{w})^2}\) | \(\sum\limits_{i=1}^{8}{(x_i-\bar{x})(y_i-\bar{y})}\) | \(\sum\limits_{i=1}^{8}{(w_i-\bar{w})(y_i-\bar{y})}\) |
---|---|---|---|---|---|---|
\(46.6\) | \(563\) | \(6.8\) | \(289.8\) | \(1.6\) | \(1469\) | \(108.8\) |
表中\(w_i=\sqrt{x_i}\),\(\bar{w}=\cfrac{1}{8}\sum\limits_{i=1}^{8}{w_i}\),
附:对于一组数据\((u_1,v_1)\),\((u_2,v_2)\),\(\cdots\),\((u_n,v_n)\),其回归直线\(v=\alpha+\beta u\)的斜率和截距的最小二乘估计分别为\(\hat{\beta}=\cfrac{\sum\limits_{i=1}^{8}{(u_i-\bar{u})(v_i-\bar{v})}}{\sum\limits_{i=1}^{n}{(u_i-\bar{u})^2}}\),\(\hat{\alpha}=\bar{v}-\hat{\beta}\bar{u}\),
(Ⅰ)根据散点图判断,\(y=a+bx\)与\(y=c+d\sqrt{x}\)哪一个适宜作为年销售量\(y\)关于年宣传费\(x\)的回归方程类型?(给出判断即可,不必说明理由)
分析:由散点图可以分析,\(y=c+d\sqrt{x}\)更适宜作为年销售量\(y\)关于年宣传费\(x\)的回归方程类型,图中的变量呈现曲线回归。
(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立\(y\)关于\(x\)的回归方程;
分析:令\(w=\sqrt{x}\),先建立\(y\)关于\(w\)的线性回归方程,
由于\(\hat{d}=\cfrac{108.8}{1.6}=68\),
则\(\hat{c}=\bar{y}-\hat{d}\bar{w}=563-68\times 6.8=100.6\),
所以\(y\)关于\(w\)的线性回归方程为\(\hat{y}=100.6+68w\),
即\(y\)关于\(x\)的线性回归方程为\(\hat{y}=100.6+68\sqrt{x}\).
(Ⅲ)已知这种产品的年利润\(z\)与\(x\)、\(y\)的关系为\(z=0.2y-x\),根据(Ⅱ)的结果回答下列问题:
(i)年宣传费\(x=49\)时,年销售量及年利润的预报值是多少?
分析:由(Ⅱ)知,年宣传费\(x=49\)时,年销售量的预报值\(\hat{y}=100.6+68\sqrt{49}=576.6\),
年利润\(z\)的预报值\(\hat{z}=0.2\times 576.6-49=66.32\)。
(ii)年宣传费\(x\)为何值时,年利润的预报值最大?
分析:由(Ⅱ)知,年利润\(z\)的预报值\(\hat{z}=0.2\times (100.6+68\sqrt{x})-x\)
\(=-x+13.6\sqrt{x}+20.12=-[(\sqrt{x})^2-13.6\sqrt{x}]+20.12\)
当\(\sqrt{x}=\cfrac{13.6}{2}=6.8\)时,即当\(x=46.24\)时年利润的预报值最大。