【人脸识别】set-to-set：Multicolumn Networks - 代码天地

【人脸识别】set-to-set：Multicolumn Networks

其他 2020-03-02 19:07:16 阅读次数: 0

paper：Multicolumn Networks for Face Recognition

论文链接：https://arxiv.org/pdf/1807.09192.pdf

这是一篇set-to-set的paper，作者提出了一个Multicolumn Networks，想要同时学习视觉信息和内容信息。在原来的网络上加了“visual” quality 和 “content” quality 两个模块。

Approach

文章的整体结构如图所示。非常清晰明白：

输入一个base的多张图片，每张分别进backbone，得到feature。

对于visual模块，每张图片由FC层出来，学到一个质量系数alpha。然后将各个feature加权表示得到Vm。这个就是我们平时看到的每张图片的质量信息。

对于content模块，每个feature都和Vm做一个concat。也是通过一个FC层，学到一个beta，表示relative contribution。这个能够表示每个feature和平均feature的差异。

最后通过加权，得到Vd。也就是融合之后的feature。

这个是alpha的，通过FC加一个sigmod函数。

beta的做法也是一样的。

最后这样计算出来Vd

Experiments

网络结构如图所示：

IJB-A实验结果：

MN-v是指加了第一个模块，MN-vc是两个模块都加上，可以看到content提升的非常明显。

主要看beta学到的东西：

从第一行可以看出，较低直觉质量的图，可能拥有更好的重要性，比如图1-3.

第三行中，图3-2和3-3的直觉质量是差不多的，但是重要性差距也比较大。

作者加这个beta，主要是想说明并不绝对是视觉质量越高的图效果越好。

也就是说，有的comp是有很多信息的。像这里的beta就能反映一些comp和pose的信息。

发布了49 篇原创文章 · 获赞 41 · 访问量 3万+

私信关注

猜你喜欢

转载自blog.csdn.net/DL_wly/article/details/99057410

【人脸识别】set-to-set：Multicolumn Networks

Set Maximum Segment Size (MSS) in Redhat Linux for Networks & Hosts

人脸识别-论文阅读(8) : Attribute-Enhanced Face Recognition with Neural Tensor Fusion Networks

MTCNN（Multi-task convolutional neural networks）人脸对齐

MTCNN（Multi-task convolutional neural networks）人脸检测

人脸识别--Open set和Close set的区别

基于Dual Path Networks（DPN）的图像识别模型实践

[行为识别论文详解]TSN(Temporal Segment Networks)

行为识别 - TDN: Temporal Difference Networks for Efficient Action Recognition

深度学习-图像识别FPN(Feature Pyramid Networks)

吴恩达深度学习4.4笔记_Convolutional Neural Networks_人脸识别和神经风格转换

networks:hosts

The Convolutional Networks

LSTM Networks

Neural Networks

Highway Networks

人脸关键点: Wing Loss for Robust Facial Landmark Localisation with Convolutional Neural Networks

人脸关键点：MTCNN-Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks

Stacked Hourglass Networks for Human Pose Estimation (人体姿态识别之堆叠沙漏网络)

姿态识别（1）：DeepPose ： Human Pose Estimation via Deep Neural Networks

车牌识别 99% License-Plate-Detect-Recognition-via-Deep-Neural-Networks-accuracy-up-to-99.9

【CVPR2018，action recognition,动作识别】Appearance-and-Relation Networks for Video Classification

视频行为识别阅读[2]Temporal Segment Networks: Towards Good Practices for Deep Action Recognition[2016]

视频动作识别--Two-Stream Convolutional Networks for Action Recognition in Videos

车牌识别License-Plate-Detect-Recognition-via-Deep-Neural-Networks-accuracy-up-to

双流网络行为识别-Spatiotemporal Residual Networks for Video Action Recognition-论文阅读

Neural Networks and Deep Learning阅读笔记（1）手写字符识别

《Neural Networks and Deep Learning》读书笔记系列：1.识别手写字

【点云识别】Robust Point Clouds Processing using Nonlocal Neural Networks with Adaptive Sampling 论文笔记

【视频行为识别5】(双流网络)Two-stream Convolution Networks for Action Recognition in Videos(2014)

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)