一、机器学习中,回归问题的六大评价指标是什么?
回归问题五大评价指标分别为
皮尔逊相关系数,
解释方差分数(explained_varience_score),
平均绝对误差(mean_absolute_error),
均方差(mean_square_error),
r2分数(r2_score)
和 调整r2分数(r2_score_adjust)
二、六大评价指标都代表什么含义?如何进行模型评价?
2.1 皮尔逊相关系数(pearsonr)
值的范围为 [-1,1],
值的意义是 描述两个变量之间的线性相关性,既不考虑两个变量的线性相关性的斜率,
也不考虑两个变量的非线性相关性,只考虑两个变量线性相关性的程度;越接近1,说明模型性能越好。
公式:
2.2 解释方差分数(explained_varience_score)
值的范围为 [0,1],
值的意义是 描述自变量对因变量方差变化的解释性程度;即特征对目标值在模型中的拟合程度;
越接近1,说明模型性能越好。
公式:
2.3 平均绝对误差(mean_absolute_error)【注:又称L1范数】
值的范围[0, +∞],
值的意义是 描述预测结果对目标值的接近程度;
值越小,说明模型性能越好。
缺点为不能做损失函数,因为不可导,不能求梯度。
公式:
2.4 均方差(mean_square_error) 【注:又称L2范数】
值的范围[0, +∞],
值的意义是 描述预测结果对目标值的接近程度;
值越小,说明模型性能越好。
可以作为算是函数,一阶可导,可以求梯度。
公式:
2.5 r2分数(r2_score)
值的范围[-∞, 1],
值的意义是 描述因变量的变化被自变量通过回归模型解释的比例,是定性评价,非定量评价;
值越接近1,说明模型性能越好。
值为0,说明通过回归模型预测的目标值为样本目标值的均值,即拟合效果不好。
可以为负值,同样说明拟合效果不好。
另外,r2分数会随着样本量的增加而增加,所以不能直接应用于不同回归模型的性能比较。
公式:
2.6 调整r2分数(r2_score_adjust)
值的范围是[-∞, 1]],
值的意义是 描述因变量的变化被自变量通过回归模型解释的比例,是定性评价,非定量评价;
值越接近1,说明模型性能越好。
因为加入了模型参数量和样本个数的惩罚系数,所以能直接应用于不同回归模型的性能比较。
公式:
总结
以上就是六种常见的回归模型评价指标,希望对你有所帮助
引用文章链接:
- 百度皮尔逊相关系数https://baike.baidu.com/item/%E7%9A%AE%E5%B0%94%E9%80%8A%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/12712835