深入了解机器学习(Descending into ML):训练与损失 - 代码天地

深入了解机器学习(Descending into ML):训练与损失

其他 2019-01-16 00:27:47 阅读次数: 0

简单来说，训练模型表示通过有标签样本来学习（确定）所有权重和偏差的理想值。在监督式学习中，机器学习算法通过以下方式构建模型：检查多个样本并尝试找出可最大限度地减少损失的模型；这一过程称为经验风险最小化。

损失是对糟糕预测的惩罚。也就是说，损失是一个数值，表示对于单个样本而言模型预测的准确程度。如果模型的预测完全准确，则损失为零，否则损失会较大。训练模型的目标是从所有样本中找到一组平均损失“较小”的权重和偏差。例如，图 3 左侧显示的是损失较大的模型，右侧显示的是损失较小的模型。关于此图，请注意以下几点：

红色箭头表示损失。
蓝线表示预测。

图 3. 左侧模型的损失较大；右侧模型的损失较小。

请注意，左侧曲线图中的红色箭头比右侧曲线图中的对应红色箭头长得多。显然，相较于左侧曲线图中的蓝线，右侧曲线图中的蓝线代表的是预测效果更好的模型。

您可能想知道自己能否创建一个数学函数（损失函数），以有意义的方式汇总各个损失。

平方损失：一种常见的损失函数

接下来我们要看的线性回归模型使用的是一种称为平方损失（又称为 L₂ 损失）的损失函数。单个样本的平方损失如下：

= the square of the difference between the label and the prediction

=(observation - prediction(x))²

=(y - y')²

均方误差 (MSE) 指的是每个样本的平均平方损失。要计算 MSE，请求出各个样本的所有平方损失之和，然后除以样本数量：

其中：

(x, y) 指的是样本，其中x
- x指的是模型进行预测时使用的特征集（例如，温度、年龄和交配成功率）。
- y指的是样本的标签（例如，每分钟的鸣叫次数）。
prediction(x)指的是权重和偏差与特征集结合的函数。
D指的是包含多个有标签样本（即(x,y)）的数据集。
N指的是 D中的样本数量。

虽然 MSE 常用于机器学习，但它既不是唯一实用的损失函数，也不是适用于所有情形的最佳损失函数。

猜你喜欢

转载自blog.csdn.net/zuoweijie_/article/details/79656814

深入了解机器学习 (Descending into ML)：训练与损失

深入了解机器学习(Descending into ML):训练与损失

2 深入了解机器学习 (Descending into ML)：线性回归

AI - MLCC - 02 - 深入了解机器学习 (Descending into ML)

深入了解机器学习(Descending into ML):线性回归

机器学习速成课程MLCC（2）--深入了解机器学习 (Descending into ML)

谷歌机器学习速成课程笔记 3（Descending into ML-深入了解机器学习）

(180904)Descending into ML：线性回归和训练与损失---- Google 机器学习速成课程笔记

深入了解机器学习之降低损失：迭代方法

深入了解机器学习之降低损失 (Reducing Loss)：梯度下降法

深入了解机器学习

机器学习速成笔记（二）：训练与损失

【深入了解pytorch】PyTorch迁移学习：加速训练与提高性能的利器

深度学习中的训练和验证损失

机器学习入门：深入了解机器学习

【深入了解pytorch】PyTorch训练和评估模型

【深入了解PyTorch】PyTorch模型部署：从训练到生产

在Mac上训练机器学习模型，苹果WWDC发布全新Create ML、Core ML 2

绘制学习模型的训练损失和验证损失图形、绘制训练精度和验证精度图形

【ML】常用损失函数

苹果Create ML 全新core 机器学习教程在Mac上训练机器学习模型

2.谷歌《机器学习速成课程》笔记---深入了解机器学习（线性回归）

从零开始机器学习-5 深入了解机器学习

【深入了解PyTorch】神经网络与模型训练过程详解

【深入了解PyTorch】PyTorch分布式训练：多GPU、数据并行与模型并行

“深入了解卷积神经网络（CNN）：工作原理、优点、应用和训练方法“

【官方】Unity 机器学习 ML-Agents （五）从头创建一个训练环境

玩转Unity中的ML-Agents 机器学习（三）：BallacceBall 案例训练

机器学习实践：TensorFlow最后一个epoch训练损失函数显著增大

【深入了解pytorch】使用PyTorch构建神经网络模型：定义结构、选择激活函数和损失函数

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)