matlab实现线性回归成绩预测

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/caozixuan98724/article/details/82903912

目的

1. 熟悉matlab基本语法。

2. 使用matlab进行绘图。

3. 复习线性回归于梯度下降。

数据集

与之前的文章,朴素贝叶斯实现成绩等级分类相同,也是某市一模考试成绩(只保留了语文英语数学和总分)

假设函数

等号的左侧代表预测的成绩,左侧(θ0,θ1,θ2,θ3)代表参数,考虑到成绩的实际情况,可以将θ0定义为0,因此要求的参数列表为(θ1,θ2,θ3)。x1,x2,x3分别代表语文成绩,英语成绩和数学成绩。

损失函数

使用梯度下降算法进行迭代

matlab代码

gradient_descent.m

[num,grades_matrix,row] = xlsread('d:/mlGrades/1.xls',1,'A2:D4000');
grades_matrix = str2double(grades_matrix);
parameters = [0,0,0];
step = 0.0000003;
points = [];
for i = 1:1500
    grades_total = grades_matrix(i,:);
    chinese = grades_total(1);
    english = grades_total(2);
    math = grades_total(3);
    total = grades_total(4);
    grades = [chinese english math];
    parameters = parameters - step*(parameters*grades'-total).*grades;
    total_predict = parameters*grades';
    points(end+1)=total - total_predict;
end
plot(points)

这里面的代码简单解释一下,xlsread的返回有三个值,num代表excel文件中的数字矩阵,grades_matrix代表excel中的文字矩阵,row代表当前行。

这里面出现的问题是无论我怎么设置,xlsread这个函数都会把表中的数字识别为字符串,因此需要str2double把字符串矩阵转化为向量矩阵。

在matlab中,*代表矩阵正常的相乘,.*代表矩阵元素与元素直接相乘,grades'代表grades矩阵的转置。

plot函数用于绘图。

结果

可以看到经过大约五百次左右的迭代后,实际值与预测值的差值在0左右波动,达到了最终的目的。

结论

最后得到的三个参数的值分别为1.5460(语文),1.5583(英语),1.8500(数学)。

这说明了什么呢?对于理科生来说,数学当然是最最最最重要的啦٩(๑>◡<๑)۶ 

代码和数据集稍后整理发布到github上去。

猜你喜欢

转载自blog.csdn.net/caozixuan98724/article/details/82903912