论文笔记：Triplet Network

其他 2018-10-30 17:42:39 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/hongbin_xu/article/details/83064290

原论文：DEEP METRIC LEARNING USING TRIPLET NETWORK

Triplet Network

1、四个问题

要解决什么问题？
- 实质上，Triplet Network是Siamese Network的一种延伸，要解决的问题与Siamese Network的基本一致。
- 与Siamese Network一样，适用于解决样本类别很多（或不确定），然而训练数据集的样本数又很少的情况（如人脸识别、人脸验证）。
用了什么办法解决？
- 思路：将图像映射到某个特征空间中，其中两幅图像输入CNN得到的特征向量之间的欧式距离即为相似度。
- 与Siamese Network不同的是，Triplet Network采用三个样本为一组：一个参考样本，一个同类样本，一个异类样本。
- 在contrastive loss的基础之上构建了一个新的loss函数，就是保持类内和类间距离有一个距离限制（margin）。
效果如何？
- 论文比较老了，是15年的，早就不是state-of-the-art的了。
- 在论文中给出的实验结果中，采用相似的CNN结构，使用triplet network的效果比siamese network好一些。
还存在什么问题？
- triplet network的训练是通过样本间的对比（类内/类间），而不是以往的通过标签（label）训练，前者相比于后者不一定能取得更好地效果。

2、论文概述

2.1、网络结构

在这里插入图片描述

Tripelet Network由3个相同的前馈神经网络（彼此共享参数）组成。
每次输入三个样本，网络会输出两个值：候选样本与同类样本，候选样本与异类样本，在embedding层的特征向量的L2距离。
假设输入为： $x$ ，候选样本； $x^-$ ，异类样本； $x^+$ ，同类样本。
一句话概括就是，这个网络对 $x^-$ 和 $x^+$ 相对于 $x$ 的距离进行了编码。

在这里插入图片描述

2.2、训练

在这里插入图片描述

$d_+$ 和 $d_-$ 分别是正样本对和负样本对在embedding层特征向量的欧氏距离。为了方便使用概率表示，又将其输入softmax函数，计算公式如上图。
目标是最小化 $d_+$ ，最大化 $d_-$ ，所以等价于令 $Loss(d_+, d-) \rightarrow 0$ 。

猜你喜欢

转载自blog.csdn.net/hongbin_xu/article/details/83064290

论文笔记：Triplet Network

Network In Network 论文笔记

【论文笔记】Pointer Network

论文：DEEP METRIC LEARNING USING TRIPLET NETWORK（Triplet Network）

论文笔记：Deep Residual Network

Distilling the Knowledge in a Neural Network 论文笔记

论文笔记：Pyramid Scene Parsing Network

ICCV 2017 《Chained Cascade Network for Object Detection》论文笔记

论文笔记：Residual Attention Network for Image Classification

SPP-Net（Spatial Pyramid Pooling Network）论文笔记

论文笔记：DRAW: A Recurrent Neural Network For Image Generation

DetNet: A Backbone network for Object Detection论文笔记

Relation Classification via Convolutional Deep Neural Network 论文笔记

论文笔记（9）--Residual Attention Network for Image Classification

Product Quantization Network for Fast Image Retrieval 论文笔记

论文笔记-Deep Affinity Network for Multiple Object Tracking

论文笔记：Convolutional Neural Network for Sentence Classification

论文笔记：Autoregression Convolutional Neural Network for Asynchronous Time Series

Benchmark Analysis of Representative Deep Neural Network Architecture论文笔记

论文笔记：Dueling Network Architectures for Deep Reinforcement Learning

论文笔记：Learning Deconvolution Network for Semantic Segmentation

《ShuffleNet: An Extremely Efficient Convolutional Neural Network for MobileDevices》论文笔记

【论文笔记】Social network structure and the achievement of consensus

论文笔记：Non-Local Neural Network

论文笔记：Contrastive Adaptation Network for Unsupervised Domain Adaptation

论文笔记（6）：Dual Attention Network for Scene Segmentation

论文笔记（4）：Residual Attention Network for Image Classification

《SELF-ADAPTIVE NETWORK PRUNING》论文笔记

[论文笔记]Dual Graph Convolutional Network for Semantic Segmentation

[论文翻译] Network In Network

今日推荐

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

使用Redis中间件解决商品秒杀活动中出现的超卖问题（使用Java多线程模拟高并发环境）

野指针及c++指针使用注意点

redis 3.0　新特性

(翻译)火狐操作系统javascript API

微信小程序开发入门

mysql数据查询之五子句(where、group by、having、order by和limit)

Codeforces Round #517 Div. 1翻车记

在caffe 中实现Generative Adversarial Nets（二）

企业级漏洞扫描工具

java byte数组与String互转

每日归档

更多

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)