畳み込みニューラルネットワーク(IV)の認識と変換スタイル

顔認識

1、ワンショット学習(学習):

顔認識は、のみのみサンプルを通じて学習することができ、画像によって行われます。

類似機能:

D(IMG1、IMG2)=画像間の相違度

認識タスク(検証):

もしD(IMG1、IMG2)≤τ:「同じ」。

他:「違います」

 

2、シャムネットワーク:

画像は、ニューラルネットワークを介してコード128畳み込み変換、「Xの符号化と呼ぶ(I)、」F(Xと呼ぶ(I) )。

 D(X (1)、X (2))= || F(X (1) - F(X (2))|| 2

 

3、三重項損失(ロストリプレット):

(1)背景:

データの各セットは、結果が「正」及び「負」と比較された3枚の画像であります

所望の結果:|| F(A) - F(P)|| 2 ≤|| F(A) - F(N)|| 2  、すなわちD(A、P)≤D (A、N)、

即|| F(A) - F(P)|| 2  - || F(A) - F(N)|| 2  ≤0。 

避けF(A)= F(P)= F(N)は、式を向上させる必要があります。

 || F(A) - F(P)|| 2  - || F(A) - F(N)|| 2  +α≤0、

即|| F(A) - F(P)|| 2  +α≤|| F(A) - F(N)|| 2

ここでαは、間隔(マージン)と呼ばれています。

 

(2)損失関数:

3つの画像A、P、N所与。

L(A、P、N)=最大{|| F(A) - F(P)|| 2  - || F(A) - F(N)|| +α、0}

=ΣL J(A (I)、P (I)、N (I) iは1からmまで実行)。

10,000千枚の個々の写真のトレーニングセット(一人10の平均値)。

 

(3)選択トリプル:

ランダムに選択されたトリプレット、D(A、P)+α≤条件は(A、N)~D場合、容易に満たすことができる、トレーニング効果を達成することができない、D(A、P)≈D(A、の選択を満たす必要がありますN)は、トライアド。

 

4、顔の検証と二分:

Y = 1の場合には、同一人物であると判定され、0のとき、Yは=、同一人物でないと判定されました。

 

移行のスタイル

1.スタイルの移行(スタイル転送)とは何ですか?

 

2、コスト関数:

J(G)=α* Jの含有量(C、G)+β* Jのスタイル(S、G)

内容代价函数 Jcontent[l](C,G) = 1/2 * || a[l][C] - a[l][G] ||2  

风格损失函数 Jstyle(S,G):

  style matrix风格矩阵,用于计算两个每一对激活项之间的相关系数:

  

   

   

   Jstyle(S,G) = ∑ λ[l] * Jstyle[l](S,G)

おすすめ

転載: www.cnblogs.com/orangecyh/p/11885553.html