回归(Regression)
”回归到中等“
房价预测:
- 回归分析(regression analysis)用来建立方程模拟两个或者多个变量之间如何关联
- 被预测的变量叫做:因变量(dependent variable),输出(output)
- 被用来进行预测的变量叫做:自变量(independent variable),输入(input)
- 一元线性回归包含一个自变量和一个因变量
- 以上两个变量的关系用一条直线来模拟
- 如果包含两个以上的自变量,则称作多元回归分析(multiple regression)
\[ a_\theta(x) = \theta_0 + \theta_1x \]
这个方程对应的图像是一条直线,称作回归线。其中,\(\theta_1\)为回归线的斜率,\(\theta_0\)为回归线的截距.\(x\)是因为只有一个自变量。
一元线性回归——正相关:
一元线性回归——负相关:
一元线性回归——不相关:
求解方程系数:
判断哪一条线最好:
代价函数(Cost Function)
- 最小二乘法
- 真实值y,预测值\(h_\theta(x)\),则误差平方为\((y -h_\theta(x))^2\)
- 找到核视的参数,使的误差平方和:
\[ j(\theta_0,\theta_1) = \frac{1}{2m}\sum_(i = 1)^m(y^i - h_\theta(x^i))^2 最小 \]