疑似ラベルのセマンティックセグメンテーション

1.はじめに

教師付き学習の分野では、人類は大きな進歩を遂げたが、我々は多くのデータが必要であることを意味し、モデルを訓練するためにタグ付けされ、それはまた、これらのアルゴリズムは、最適なモデルパラメータを見つけるために、何度も何度もデータをスキャンする必要があります。偽造ラベルの - しかし、現実の生産活動は、標識されたデータの相対的な不足、非標識膨大な量のデータが十分に活用されていない、このポストは、半教師法の下で、プレーン紹介します。

2.疑似ラベルは何ですか

擬似ラベルは、トレーニングデータに予測に信頼性の高い試験データを追加することです。5つのステップについてダミーラベルを確立するプロセス:(1)モデルがトレーニングデータを用いて、タグ(2)は、未知の試験データセットを予測する;(3)訓練データの予測値信頼性の高い試験データ添加する工程;(4)の組み合わせの使用を新しいデータモデル電車や微調整モデルの第1のステップと、(5)は、テスト・データ・セットを予測する新しいモデルを使用します。

3.トレーニングプロセス

この投稿は、参照されTGS塩識別チャレンジプログラム上のチャンピオン。画像データにおける地震マーカーの欠如、標識されていない大量のデータを用いて、提案された半教師付き方法はこの方式。標識されていないトレーニングを使用して自己像は、提案された自己学習プロセスを交互にタグ付けされた学習モデルと疑似ラベル、モデルK輪列によってデータセットを拡張するために、反復プロセスです。図手順を詳述する以下の通りである:
ここに画像を挿入説明
一回の反復手順Kトレーニングプロセスから、2ラウンドのステップがある:()擬似拡張マークアップタグトレーニングモデル・データ・セットを使用しては、(b)は、ダミータグタグの付いていないデータを更新します。
最初のラウンドでは、モデルを訓練するだけGT(グランドトゥルース)タグを使用します。その後、我々は、擬似画像内の各ピクセルのためのテストセットのための最も可能性の高いクラスを割り当てることにより、すべてのタグなしデータをタグ予測しました。我々は確実に除外削除することによって、偽造ラベルの低い自信を持って予測することはできません。
次のラウンド、偽造ラベルやタグGTモデルが再訓練の当社初の共同使用、その後、すべての疑似ラベルラベルなしデータを更新するために新しいモデルを使用します。体重をリセットする権利のセルフトレーニングモデルの各ラウンドの前に擬似ラベルのエラーの蓄積の訓練のいくつかのラウンドの過程で重要であり、そしてません。
さらに、擬似生成されたラベルの堅牢性を向上させるために、単一の誤りモデルを過剰適合防ぐために、我々は異なる骨格構造のセットを持つ共同CNNsを訓練しました。この場合には、ダミーのタグは、重合及びダミータブに統合され、発現さ信頼性の事前の知識を使用して、各モデルの平均、積分によって生成されたすべての予測モデルの統合により得られます。

4.参考文献

畳み込みニューラルネットワークのアンサンブル[J]を用いて、地震画像における塩体の半教師セグメンテーション。
https://www.kaggle.com/c/siim-acr-pneumothorax-segmentation/discussion/107981;

公開された33元の記事 ウォンの賞賛3 ビュー5544

おすすめ

転載: blog.csdn.net/weixin_42990464/article/details/104414410