人物検索の機能 Norm に関するディスカッション

論文のタイトル: 効率的な人物検索のための規範を意識した埋め込み

論文リンク: http://openaccess.thecvf.com/content_CVPR_2020/papers/Chen_Norm-Aware_Embedding_for_Efficient_person_Search_CVPR_2020_paper.pdf

コード: https://github.com/DeanChan/NAE4PS

この記事は、DiChen、shanshan zhang 先生、jianyang 先生、Bernt Schiele の CVPR2020 の作品で、最近勉強していて、Feature Norm について多くのインスピレーションを与えてくれました。私の理解が十分に深くないかもしれませんが、ヒスイを引き寄せるためにレンガを投げただけです。貴重なご意見をありがとうございます。歩行者再識別コラム ( https://zhuanlan.zhihu.com/personReid ) への投稿も歓迎します。

最初に余談をさせていただきますが、以前、球面の著者の 1 人である Zhiding Yu 氏は、特徴角度が最も重要であるが、特徴ノルムには多くの情報が反映されていないと語っていました。これについては、彼の最近の著作「Angular Visual Hardness」( https://arxiv.org/pdf/1912.02279.pdf )で詳しく説明されており、主な中心的な考え方は、モデルスコア (信頼スコア) が完全には一致していないということです。

https://wyliu.com/papers/ChenAVH_slides.pdf より

ここでは、最終モデルの信頼度をノルムと角度に分解します。

記事では、3つのヒートマップを比較して人を選びました。人々の選択は、モデルの信頼性と高い相関関係はなく、大きさ、つまりノルムとも高い相関関係はありませんが、角度と高い相関関係があることがわかります (下の図に示すように)。

何：

良い。本題に戻ります。この規範を意識した埋め込み研究の問題は、1 段階の人物検索です。相対的な 2 段階では、最初に歩行者を検出し、次に人物の再 ID 学習を実行します。

この記事では、ノルムと角度の解きほぐし、人物リードと歩行者の検出を同時に研究します。

ノルムを使用して検出結果を表現します（人間かどうか）

2. 角度を使用して人物を再識別する（つまり、歩行者を再識別するタスク）

どうやって：

損失: 以下に示すとおり

理想的には、色付きのものが reID の特徴であり、黒いものが検出された背景の特徴です。

リード部分は依然として OIM 損失 (クロスエントロピーのバリアント) を使用し、負のサンプルを導入しているため、色付きの特徴は比較的オープンです。
検出損失はスカラーに適用されますが、これが標準です。ここで、r が数値であることを強調する必要があります。人物の場合は 1 に、背景の場合は 0、つまりボールの中心に縮小します。したがって、黒い特徴は球の中心近くに集まっています。