AI ベースのデータ拡張: トレーニング サンプルとしてデータを生成

視覚認識のための生成データのベンチマークと分析

大規模な事前トレーニング済み生成モデルが進歩し、視覚認識における効率的なデータ生成器としての可能性が広がります。この研究では、生成された画像の影響を詳しく調査し、主に外部データを使用するパラダイム (つまり、生成された画像、Web で取得された画像、生の画像) を比較します。

主な貢献は次のとおりです。 1) GenBench の構築: GenBench は、22 のデータセットと 2548 のカテゴリを備えた広範なベンチマークであり、さまざまな視覚認識タスクで生成されたデータを評価するように設計されました。2) CLER スコア: 既存のメトリック (FID、CLIP スコアなど) と下流の認識パフォーマンスの間の不十分な相関を解決するために、生成されたデータがトレーニング前の認識に役立つことを示すトレーニング不要のメトリックである CLER が提案されています。 . タスクの効率化。3) 新しいベースライン: 生成されたデータを同じ外部データ プールから取得したデータと比較することは、生成されたデータの固有の特性を解明するのに役立ちます。4) 外部知識の注入: テキスト逆マッピングを通じてカテゴリごとに特殊なトークンの埋め込みを微調整することにより、低解像度の参照画像を処理する場合を除き、17 個のデータセットのパフォーマンスが向上します。徹底的なベンチマークと分析は、視覚認識における生成データの可能性に焦点を当て、将来の研究に向けた重要な課題を特定します。

3d4c92d8bd08b23110a8603db0a70c9c.png

医療画像におけるデータ拡張のための深層学習アプローチ: レビュー

ディープラーニングは医用画像分析の一般的なツールとなっていますが、特に医療分野では、データ取得にコストがかかり、プライバシー規制によって制限される可能性があるため、利用できるトレーニング データが限られていることが依然として大きな課題となっています。データ拡張技術は、トレーニング サンプルの数を人為的に増やすことでこの問題に対処しますが、これらの技術では通常、限られた結果しか得られません。

この問題を解決するために、より多くの研究が、深い生成モデルを使用して、実際のデータ分布に適合する、より現実的で多様なデータを生成することを提案しています。このレビューでは、医用画像強調のための 3 つの深層生成モデル、つまり変分オートエンコーダー、敵対的生成ネットワーク、拡散モデルに焦点を当てます。

各モデルの現在の最先端技術について概説し、分類、セグメンテーション、クロスモーダル転送など、医用画像処理におけるさまざまな下流タスクの可能性について説明します。各モデルの長所と限界も評価され、将来の研究の方向性が提案されます。目的は、医用画像強化への深層生成モデルの適用に関する包括的な概要を提供し、医用画像分析における深層学習アルゴリズムのパフォーマンスを向上させるこれらのモデルの可能性を強調することです。

729369eead3a52c1cbf0a5b535f47bd8.png

公式アカウント「機械学習とAI生成の創造」に注目してください。もっと面白いことがあなたを待っています

寝転がって6万語!30方向130記事!CVPR 2023 の最も完全な AIGC 論文! 一気に読んで

安定拡散の簡単解説:AI塗装技術の潜在的な拡散モデルの解釈

制御可能なAIGC絵画生成アルゴリズムControlNetを徹底解説! 

クラシック GAN は次のように読む必要があります: StyleGAN

fb03b8b6399fd7760e6efeb258bcc6cd.png GANのシリーズアルバムを見るには私をクリックしてください~!

一杯のミルクティーでAIGC+CVビジョンのフロンティアになろう!

最新かつ充実の100まとめ!拡散モデルの生成 拡散モデル

ECCV2022 | 対立ネットワーク GAN 生成に関する論文まとめ

CVPR 2022 | 25 以上の方向性、最新の 50 の GAN 論文

 ICCV 2021 | 35 のトピックに関する GAN 論文の概要

記事数は110以上!CVPR 2021 で最も完全な GAN ペーパーコーミング

記事数は100以上!CVPR 2020 で最も完全な GAN ペーパーコーミング

新しい GAN の解体: デカップリング表現 MixNMatch

StarGAN バージョン 2: マルチドメイン ダイバーシティ イメージの生成

添付のダウンロード | 「Explainable Machine Learning」の中国語版

添付のダウンロード | 「TensorFlow 2.0 ディープ ラーニング アルゴリズムの実践」

添付のダウンロード | 「コンピューター ビジョンにおける数学的手法」シェア

「深層学習に基づく表面欠陥検出手法の検討」

ゼロショット画像分類の調査: 10 年間の進歩

「ディープニューラルネットワークに基づく少数ショット学習の調査」

『礼書・薛記』には、「友なしで一人で学ぶのは孤独で無知だ」という言葉がある。

ミルク ティー カップをクリックして、AIGC+CV ビジョンのフロンティア ウェイバーになりましょう! 、  AI によって生成された創造物とコンピューター ビジョンの 知識の惑星に参加してください。

おすすめ

転載: blog.csdn.net/lgzlgz3102/article/details/131950442
おすすめ