Convolutional Neural Networks(week 4)-Special applications: Face recognition & Neural style transfer

(一)Face recognition 

一、What is face recognition?

人脸校验和人脸识别的区别:

二、One Shot Learning

在只有一张照片的前提下认出一个人

用两个图像的不同程度函数来判断是否是否是同一个人,如果团队中加入新的员工,则可以在数据库中加入其照片

即解决的是单样本One shot learning的问题

三、Siamese Network

函数d:输入为两张人脸图片、输出为两张图片的不同程度

实现方法是siamese network孪生网络架构

四、Triplet Loss

梯度下降的三元组损失函数,

其中的α代表d(a,p)与d(a,n)之间的差距,希望两者的差距越大越好

triplet因为其输入为3张照片而得名,即锚照片、正照片和负照片(A,P,N)

做系统中,深度学习领域有很普遍的命名算法的方式,如XXXnet或DeepXXX

用1百万张照片的数据库都极为普遍,有公司用1千万甚至1亿张来训练这些系统,数据量是巨大的

但有公司将大型的神经网络发布到了网上,即可不用从0开始训练这些网络

不建议从0开始自己做,可以下载他人的模型进行训练

五、Face Verification and Binary Classification

除了使用triplet学习深度网络中的参数外,另一种二元分类也可以直接进行参数的学习

(二)Neural style transfer

一、What is neural style transfer?

神经风格转移

为实现上述效果,需要查看卷积神经网络在不同层中提取的特征值,包括浅层和深层的特征值

二、What are deep ConvNets learning?

可视化地展示神经网络中隐藏单元所计算的东西

如上图,第一层主要在计算简单的边界

接下来会计算纹理、直到最后识别出具体的物品

三、Cost Function

为生成的图像设置代价函数,然后通过最小化代价函数生成你想要的图像

该论文较为简单,建议阅读

四、Content Cost Function

整个的代价函数,由内容代价函数和风格代价函数两部分组成

即按照元素将两个激活因子的差异平方进行求和,即隐藏层l中的图像C和图像G的隐藏因子

五、Style cost function

使用通道间的相关性作为量化风格的方式

ncXnc来记录每一对通道间的相关性,

问题是为啥是ncXnc呢?

六、1D and 3D Generalizations

猜你喜欢

转载自blog.csdn.net/weixin_38527856/article/details/87074325
今日推荐