数学建模之拟合算法理论笔记

插值与拟合的差别:
插值算法中,得到的多项式f(x)要经过所有样本点。但是如果样本点太多,那么这个多项式次数过高,会造成龙格现象。
尽管我们可以选择分段的方法避免这种现象,但是更多时候我们倾向于得到一个确定的曲线,尽管这条曲线不能经过每一个样本点,但是只要保证误差足够小即可。
拟合算法:与插值算法不同,在拟合问题中不需要曲线一定经过给定的点,拟合问题的目标是寻求一个函数(曲线),使得该曲线在某种准则下与所有的数据点最为接近,即曲线拟合的最好(最小化损失函数)。
什么时候用插值什么时候用拟合?
当样本比较大的时候(一般样本n大于30),用拟合,但是当样本n比较小的时候用插值。
一个小栗子
在这里插入图片描述
编写代码绘出散点图,进而观察数据进行拟合。
在这里插入图片描述
根据散点图,确定拟合曲线。假设我们的拟合曲线为y=kx+b;
但是当k和b取何值时,样本点和拟合曲线最为接近。
但是我们如何去定义这个接近呢?两种定义方法如下:
在这里插入图片描述
y^是拟合值。
在这里插入图片描述
以上所有点到直线的距离最小,来使得k,b最小。
上面第一种定义有绝对值,不容易求导,因此计算比较复杂。所以在实际中我们往往使用的是第二种定义,第二种定义也就是最小二乘的思想,也就是真实值和拟合值的所有的差值之和最小。
那么如何求解最小二乘呢?
在这里插入图片描述
如何评价拟合的好坏呢?
在这里插入图片描述
证明SST=SSE+SSR
在这里插入图片描述
R的平方越接近1,说明误差平方和越接近0,误差越小,说明拟合越好。
注意:R的平方只能用于拟合函数是线性函数时,拟合结果的评价。线性函数和其他函数(指数函数)比较拟合的好坏,直接看SSE即可。R的平方可能是负数。
使用拟合工具箱来进行拟合。
在窗口中输入cftool,打开拟合工具箱。
评价拟合模型的好坏:
主要
1.看指数平方和:SSE的值越小越好。
2.拟合的简洁性原则。就是尽量保证拟合的函数简洁更好。

具体过程如图:
在这里插入图片描述
在这里插入图片描述
自己模拟数据进行演示:
在这里插入图片描述

发布了110 篇原创文章 · 获赞 72 · 访问量 21万+

猜你喜欢

转载自blog.csdn.net/qq_40605167/article/details/100607220