Contrastive Loss

background：
最直接的想法是我们假设存在一个损失函数，它满足如下的基本准则

相似样本的坐标被放的越来越远，不似样本之间的距离越来越大，但训练的目标却仿佛永远无法达到 … 这是因为训练目标没有边界。

在这里插入图片描述

核心含义：同类的样本要更近，不同类的样本要更远
- 正样本不用管，把负样本分开就行，最小化损失函数就是最大化决策边界和负样本的距离
  m。
- 近似样本之间的距离越小越好；不似样本之间的距离如果小于m，则通过互斥使其距离接近

如图所示，同类的点会被压缩收缩，边界区域内有不同类的点会被互斥到边界区域

在这里插入图片描述
论文：http://yann.lecun.com/exdb/publis/pdf/hadsell-chopra-lecun-06.pdf

Triplet Loss

Triplet Loss是一种用于训练深度学习中的Siamese网络或者三元组网络的损失函数。它的目标是使同一类别的样本之间的距离尽可能小，不同类别之间的距离尽可能大。

在这里插入图片描述

具体地，对于一个三元组（anchor，positive，negative），其中anchor是一个样本，positive是同一类别的样本，negative是不同类别的样本。

其中，d(a, p)表示anchor和positive之间的距离，d(a, n)表示anchor和negative之间的距离，margin是一个预先设定的常数，用于控制不同类别之间的距离。

Triplet Loss的目标是使同一类别的样本之间的距离尽可能小，不同类别之间的距离尽可能大。

如果anchor和positive之间的距离小于anchor和negative之间的距离加上margin，那么这个三元组就是有效的，损失函数的值为0。
如果anchor和positive之间的距离大于anchor和negative之间的距离加上margin，那么这个三元组就是无效的，损失函数的值为d(a, p) - d(a, n) + margin。

在训练过程中，我们需要从样本集中选择大量的三元组，然后通过最小化所有有效三元组的损失函数来更新模型参数，从而使模型学习到更好的特征表示。

扫描二维码关注公众号，回复： 15160760 查看本文章