不確実性を使用してドメイン アダプテーションの疑似ラベルを修正する

论文题目: ドメイン適応型セマンティック セグメンテーションの不確実性推定による擬似ラベル学習の修正

論文アドレス: https://arxiv.org/pdf/2003.03773.pdf

著者: Zhedong Zheng、Yi Yang

コード: https://github.com/layumi/Seg_Uncertainty

 

何:

  • この論文では、ドメイン転送問題における間違った擬似ラベル (Pseudo Label) の問題を研究し、この擬似ラベルの学習を修正するためのしきい値を自動的に設定する方法について説明します。

  • 以前の擬似ラベルは、多くの場合、人為的にしきい値 (Threshold) をカードすることによって、信頼性の高い擬似ラベル (擬似ラベル) を学習し、信頼性の低いラベルを無視します。しかし、この閾値(Threshold)を決めるのは難しい場合が多いです。

  • このしきい値をどのように設定するかを考えます。実際、このしきい値はソースとターゲットがどれだけ近いかによって決まることがわかります。ソース フィールドとターゲット フィールドがまったく同じであれば、しきい値は 0.999 に固定されることもあります。ほとんどのデータには非常に明確なラベルが付いています。その場合、すべてのサンプルをトレーニングに使用できます。しかし、ソース ドメインがターゲット ドメインと完全に異なる場合は、しきい値にどれだけ引っかかっていても役に立ちません。うるさい。

  • したがって、ドメイン適用の問題は、実際のシナリオでは、モデルに疑似ラベルを学習させるために、経験に基づいて事前にしきい値を設定することしかできないことがよくあることです。これは不合理です。カードが高すぎたり低すぎたりすると、モデルの学習に影響します。したがって、この論文では、閾値を自動的に学習するのと同等である、不確実性を閾値として使用することを提案します。

どうやって:

  • 実際、本質的な考え方は非常に単純で、セグメンテーション モデルで補助分類子を使用します (元々は勾配が消失するのを防ぐためにのみ使用されていました)。構造は下図のとおりです: 主分類器が res5c に接続され、補助分類器が res4b22 に接続されています (この記事では画像分割について学習します。画像分類を学習している場合は、InceptionNet シリーズにも対応できます) NASNet を含む分類問題。浅い補助分類器も必要です。)

  • 誤ったラベルのエラーが観察されるのは、多くの場合、2 つの分類器が異なる結果を予測する場合です (予測分散)。以下に示すように:

  • したがって、当然のことながら、クロスエントロピー損失の補正を行いました: ここで、D{kl} は、主分類器と補助分類器の予測結果間の KL 距離 (予測分散とも呼ばれます) です。差が大きい場合、距離は次のようになります。も大きい場合、Lrect はこの不確実なサンプルを罰しません (擬似ラベルが間違っている可能性が高いため)。後で +D_{kl} 項目がなく、モデルが遅延し、すべての疑似ラベルを不確実として記述する傾向がある場合、Lrect は 0 に等しくなります。これを回避するには、+D_{kl} を追加します。

  • それを見てみましょう。実際、元のしきい値は信頼度に基づいています。信頼度が高い場合、モデルはこの疑似ラベルを学習します。ここで信頼度を使用できますか? 答えはあまり良くありません。

  • 擬似ラベルのトレーニングは擬似ラベルの信頼性を高めるためのものだからです。どのサンプルが信頼できるかを判断することはまだ不可能です。最後の実験では、以下の図に示すように、信頼性と不確実性の比較も視覚化しました。 (使用する不確実性の本質は予測分散であり、間違った疑似ラベル領域とのより明らかな重複があります)

  • 同時に、私たちの方法は、セグメンテーション内の小さな領域を占めるいくつかのカテゴリに奇跡的な効果をもたらします。なぜなら、伝統的な方法は自信に応じてすべてに適合するからです。多くの場合、少数のカテゴリ (自転車 Bike と自転車乗り Rider) が不利になります。これは、信頼スコアが 0.7 または 0.8 にすぎず、ハードしきい値 0.9 に引っかかってしまうためです。

  • 最後に、私たちの方法は、一般的に使用される 2 つのベンチマーク (GTA5 -> Cityscapes および SYNTHIA -> Cityscapes) で改善できます。そしてそれは他の方法を補完するものです。小さなデータセットでも改善されていますが、カテゴリの数が比較的少ないため、改善は明らかではありません (Cityscapes -> Oxford RobotCar)。

 

読んでいただきありがとうございます~~「いいね!」とコメント転送を歓迎します

 


この記事には正誤表があり、arXiv で更新されたフォーミュラ 7 の KL ダイバージェンスにマイナス記号が追加されました。@王晋东不家さん、コメントとご協力ありがとうございます。

おすすめ

転載: blog.csdn.net/Layumi1993/article/details/105722545