前言

之前介绍的主要是线性回归的方法，本篇主要讲述一些非线性回归的方法，主要基于的方法是基函数（basic functions），即拟合模型：
$y_{i}=\beta_{0}+\beta_{1} b_{1}\left(x_{i}\right)+\beta_{2} b_{2}\left(x_{i}\right)+\beta_{3} b_{3}\left(x_{i}\right)+\ldots+\beta_{K} b_{K}\left(x_{i}\right)+\epsilon_{i}$
其中， $b_1(\cdot),b_2(\cdot),\cdots,b_K(\cdot)$ 称作基函数。

多项式回归（polynomial regression）

若 $b_j(x_i)=x_i^j$ ，那么
$y_{i}=\beta_{0}+\beta_{1} x_{i}+\beta_{2} x_{i}^{2}+\beta_{3} x_{i}^{3}+\ldots+\beta_{K} x_{i}^{K}+\epsilon_{i}$
称作多项式回归。

阶梯函数（step function）

若 $b_j(x_i)=I(c_j\leq x_i\leq c_{j+1})$ ，那么
$y_{i}=\beta_{0}+\beta_{1} C_{1}\left(x_{i}\right)+\beta_{2} C_{2}\left(x_{i}\right)+\beta_{3} C_{3}\left(x_{i}\right)+\ldots+\beta_{K} C_{K}\left(x_{i}\right)+\epsilon_{i}$
其中
$\begin{aligned} C_{0}(X) &=I\left(X<c_{1}\right) \\ C_{1}(X) &=I\left(c_{1} \leq X<c_{2}\right) \\ C_{2}(X) &=I\left(c_{2} \leq X<c_{3}\right) \\ & \vdots \\ C_{K-1}(X) &=I\left(c_{K-1} \leq X<c_{K}\right) \\ C_{K}(X) &=I\left(c_{K} \leq X\right) \end{aligned}$
$I(\cdot)$ 是示性函数。 $I\left(c_{K} \leq X\right)=1$ 当且仅当 $c_{K} \leq X$ ，否则 $I\left(c_{K} \leq X\right)=0$

回归样条函数（regression splines）

当基函数是 $x,x^2,x^3,h(x,\xi_1),h(x,\xi_2),\cdots,h(x,\xi_K)$ 时，其中
$\xi)=(x-\xi)_{+}^{3}=\left\{\begin{array}{cl} (x-\xi)^{3} & \text { if } x>\xi \\ 0 & \text { otherwise } \end{array}\right.$
$\xi$ 称作节点（knots），这里一共有 $K$ 个节点。拟合出来的函数是一个分段函数，一共有 $K + 1$ 段，每一段上是一个三次函数，整个函数连续，且一阶导数和二阶导数均连续。如果在两端边界的二阶导数均为0，那么这是自然样条（natural spline）。
节点的数目：可以用交叉验证的方式，确定较优的节点数。
节点的位置：可以将节点选在等分的位置。

光滑样条函数（smoothing splines）

光滑样条函数 $g$ ，是使得下式最小的函数：
$\sum_{i=1}^{n}\left(y_{i}-g\left(x_{i}\right)\right)^{2}+\lambda \int g^{\prime \prime}(t)^{2} d t$
前一项是RSS，后一项是惩罚项，这里可以视作函数的光滑性， $\lambda$ 是参数， $\lambda$ 越大，得到的 $g$ 越光滑。
如此得到的 $g$ 是一个分段三次函数，在每个节点处一阶和二阶导数均连续。

局部回归（local regression）

局部回归的思想是用目标点附近的点来进行拟合。记目标点为 $x_0$ ，算法如下：

找出 $x_0$ 附近最近的 $k$ 个训练点。
给这些点分配权重 $K_{i0}=K(x_i,x_0)$ ，最远的点权重为 0，最近的点权重最大。所有其他以外的点，权重为 0
用一个加权最小二乘回归进行拟合： $\sum_{i=1}^nK_{i0}(y_i-\beta_0-\beta_1x_i)^2$
$x_0$ 处的拟合值为 $\hat{f}(x_0)=\hat\beta_0+\hat\beta_1x_0$

有几点需要考虑

如何定义权重函数 $K$
上述算法第三步，是用线性回归，还是二次回归，或者其他
如何确定第一步中的 $k$

广义加性模型（generalized additive model）

一般的线性回归模型：
$y_{i}=\beta_{0}+\beta_{1} x_{i 1}+\beta_{2} x_{i 2}+\cdots+\beta_{p} x_{i p}+\epsilon_{i}$
广义加性模型将 $\beta_{j} x_{i j}$ 替换成了一般的 $f_j(x_{ij})$ :
$\begin{aligned} y_{i} &=\beta_{0}+\sum_{j=1}^{p} f_{j}\left(x_{i j}\right)+\epsilon_{i} \\ &=\beta_{0}+f_{1}\left(x_{i 1}\right)+f_{2}\left(x_{i 2}\right)+\cdots+f_{p}\left(x_{i p}\right)+\epsilon_{i} \end{aligned}$
优点：

比标准的线性回归模型更好地进行非线性建模，不需要对自变量进行变换。
预测更准确
由于加性，可以检测 $Y$ 与每一个自变量 $X_j$ 的关系，所以可以用来进行推断。

缺点：受制于加性的局限，忽视了自变量之间的相互作用。

ISLR读书笔记十三：非线性回归

非线性回归

前言

多项式回归（polynomial regression）

阶梯函数（step function）

回归样条函数（regression splines）

光滑样条函数（smoothing splines）

局部回归（local regression）

广义加性模型（generalized additive model）

猜你喜欢

ISLR读书笔记十三：非线性回归

非线性回归

前言

多项式回归（polynomial regression）

阶梯函数（step function）

回归样条函数 （regression splines）

光滑样条函数（smoothing splines）

局部回归（local regression）

广义加性模型（generalized additive model）

猜你喜欢

回归样条函数（regression splines）