数学建模(四)、拟合算法

拟合算法和插值算法的选择

插值算法中,得到的多项式 f (x) 要经过所有样本点。但是如果样本点太多,那么这个多项式次数过高,会造成龙格现象。尽管我们可以选择分段的方法避免这种现象,但是更多时候我们更倾向于得到一个确定的曲线,尽管这条曲线不能经过每一个样本点,但只要保证误差足够小即可,这就是拟合的思想。 (拟合的结果是得到一个确定的曲线)

拟合算法和插值算法使用选择条件:
当样本点多余 30 个时,用拟合而不用插值算法。

求解拟合曲线

找出 y 和 x 之间的拟合曲线
在这里插入图片描述
第一步:根据已知数据做散点图
根据散点图看点的走势
在这里插入图片描述
第二步:由散点图可知,可以用一条线性直线拟合数据
于是,设
y = k x + b y=kx+b
接下来只需要求出k,b为何值时,样本点和拟合曲线最接近。
在这里插入图片描述
第三步:使用最小二乘法求解最合适的 k 和 b
在这里插入图片描述
第一种带绝对值求解不方便,不容易求导,因此计算比较复杂。

在实际建模中,通常使用第二种方法

求解最小二乘法
在这里插入图片描述
代码实现

clear;clc
load  data1
plot(x,y,'o')
% 给x和y轴加上标签
xlabel('x的值')
ylabel('y的值')
n = size(x,1);
k = (n*sum(x.*y)-sum(x)*sum(y))/(n*sum(x.*x)-sum(x)*sum(x))
b = (sum(x.*x)*sum(y)-sum(x)*sum(x.*y))/(n*sum(x.*x)-sum(x)*sum(x))
hold on % 继续在之前的图形上来画图形
grid on % 显示网格线
  
f=@(x) k*x+b;
fplot(f,[min(x)-1,max(x)+1]);
legend('样本数据','拟合函数','location','SouthEast')

在这里插入图片描述

评价拟合的好坏

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
matlab代码实现

y_hat = k*x+b; % y的拟合值
SSR = sum((y_hat-mean(y)).^2)  % 回归平方和
% mean()用于求均值
SSE = sum((y_hat-y).^2) % 误差平方和
SST = sum((y-mean(y)).^2) % 总体平方和
SST-SSE-SSR
R_2 = SSR / SST

实验结果:
在这里插入图片描述

分析:实验选择一阶线性函数做数据拟合,SSE 和 R 平方没有对比项,但 SSE 误差平方和较小,可做拟合曲线。

matlab中的曲线拟合工具箱

在这里插入图片描述
在这里插入图片描述

函数选择原则:
当散点图走势是直线,优先选线性拟合,评价指标为 SSE 和 R 平方,SSE 越小越好,R 平方越大越好。
其他的函数选择条件是 SSE 越小越好,且不是线性拟合时不能用 R 平方来评价。
其他:函数形式应当越简单越好。

猜你喜欢

转载自blog.csdn.net/weixin_44511195/article/details/106942199