綿密な研究エンジニア必見は、以下を参照してください。超解像再構成の簡単な方法は、咲いてました


著者|ヨンジュン郭、建チェンなど

翻訳|劉チャン

制作| AI技術のベースキャンプ(ID:rgznai100)

低解像度(LR)画像から画像間の高解像度(HR)非線形写像関数に、ニューラルネットワークの深さは、学習によって、画像超解像(SR)タスク上で良好なパフォーマンスを達成しました。

しかし、既存のSR法2つの欠点:無限HR画像を見つけるのが困難になり、同じLR画像にダウンサンプリングすることができますがありますので、最初は、写像関数HRの画像LRから学ぶことは、通常、不良設定問題であり、優れたソリューション。画像劣化の方法は、一般的に未知であるので、第二、LR-HRデータの組は、実際には適用されないことがあります。このより一般的なケースでは、従来のSRモデルは、一般的に貧しいパフォーマンスを生み出します。

上記課題を解決するために、我々は、LRデータに追加の制約を導入することにより、解空間を削減するために機能する、デュアル回帰法を提案します。

具体的には、LRにHR画像からマッピングの学習に加えて、方法は、本明細書カーネル推定のための追加のデュアルリターンマップを学習し、再構成されたLR画像をダウンサンプリングすることにより、閉じたループを形成する、追加の監視を提供することができます。

デュアルホーミングプロセスはHR画像に依存しないため、より多くのポイントを、ので、私たちはLR画像から直接学ぶことができます。この意味で、我々は簡単なYouTubeのオリジナルビデオとして、SRモデル実際のシーンに適応することができます。実験結果は、提案した方法は、既存の方法よりも優れていることを示し、実際の現場でより良い結果を達成することができます。

入門

深ニューラルネットワーク(DNN)メソッドは、画像分類、ビデオなどの理解など、多くの実用的な用途での主力となっています。

最近、画像の超解像(SR)は、人気のある方向となっており、それは高解像度(HR)画像間の非線形写像を低解像度(LR)画像から学習する主です。多くの超解像再構成法は、学習の深さに基づいて提案されています。しかし、これらの方法は、2つの主要な制限があります。

可能HR画像の無限の数がダウン同じLR画像を得るためにサンプリングすることができるがあるため、最初は、マッピングHR画像LRから学ぶことは、通常は不良設定問題です。これは、解空間LR HR画像へのマッピングが大きくなる原因となります。それは、このような大規模な空間での優れたソリューションを学ぶことは困難である、モデルの性能が制限されます。SRの性能を向上させるために、モデルは、モデルの複雑さを増加させることによって効率的に例えばEDSR、DBPNとRCANを設計することができます。しかしながら、これらの方法は、大きな解空間の問題は、それによって(図1参照)限られた性能超解像度、無細かいテクスチャーをもたらす、依然として存在します。したがって、SRモデルのパフォーマンスを改善するためのソリューション空間マッピング機能を削減する方法を、より重要な課題となっています。

あなたがペアデータを得ることができない場合に、第2は、より良いSRモデルを得ることは困難です。LRのSR法の大多数のビューがトレーニングデータ対、すなわちHR画像やバイキュービックダウングレードに依存しているためです。しかし、現実には通常以上の不対のデータです。また、現実の世界は、必ずしも特定の方法(例えば、二から三回)をダウンサンプリングして得られたLR画像の同一の分布を有していません。したがって、SRモデルは、実際のシナリオは非常に挑戦されて処理することができます。その他のポイントに、私たちは直接、多くの場合、一般化の深刻な問題につながる、とは、パフォーマンスの低下をもたらす、既存のSRモデル実世界のデータに適用される場合。そのため、効果的に不対SRモデルは、実際の用途に適合させるためにデータを使用する方法がより重要な課題です。

本論文では、新しいデュアル回帰法を提案し、プログラムは、SRの性能を向上させる閉ループを形成しています。

最初の問題を解決するために、本論文では、超解像画像が再構成されたLR画像入力できるようにすることを、可能な解空間を減少させるために追加の制約を導入します。

LR→HRからのマッピングが最適であれば理想的には、それはダウン同じ入力LR画像を得るための超解像画像をサンプリングすることができます。このような制約の下で、我々は、それによって、関数空間の可能性を低減、ダウンサンプリングコアを推定することができ、より良いHRにLRから地図を見つけます。したがって、(比較の図1を参照)、良好なモデルSRを得ることが容易になります。

リターンLR画像をHR画像に依存しないため、第二の問題を解決するために、私たちの方法は、LR画像から直接学ぶことができます。このように、提案した方法は、簡単にSRモデルに調整することができるようにYouTubeのオリジナルビデオとして、LRデータの現実の世界に適用されます。実験は、本明細書に記載の方法はSOTAの方法に比べて優れていることを示しています。

次のように本論文の貢献は要約されています。

  • 追加の制約は、閉ループのマッピングを形成するために、デュアル回帰法を提案し導入することにより、モデルSR性能を向上させることができます。また、この記事では、理論的には、さらに、スキームは、従来の方法よりも優れていることが確認されたプログラムの汎化能力を分析します。

  • 本論文超解像のより一般的な場合、LRのHRデータを該当する実際のデータがない場合。提案されたデュアル回帰法を使用して、簡単に奥行きモデルは、YouTubeにオリジナルビデオとして実世界のデータに適用される調整することができます。

  • トレーニングデータを使用すると、ペアと対になっていないデータは、この論文で提案したデュアル回帰法では超解像画像の妥当性を証明するために、実際のシーンSR実験の多くを行っ。

方法

本論文でプレゼント超解像(SR)再構成を達成するためにペアと対になっていないトレーニングデータに対処するためのデュアル回帰法。図に示した全体的なトレーニングプログラム。

ペアリングのためのトレーニングデータは、主にLRデータに追加の制約を導入することにより、HRへのマッピングLRを学習に加えて、紙も、超解像画像LR画像から逆マッピングを学びました。実際には、二重の回帰モデルとして定式化著者SRの問題は、二つの回帰タスクが含まれます。以下に示す損失関数は、二つの部分、Pネットワークの損失、ネットワークの損失Dから成り、推奨量は0.1に設定されています。

不対のためのトレーニングデータを、著者はまた検討し、より一般的なSRの場合、対応する実シーンを、該当するHRデータは、訓練のために使用することはできませんがあります。そこで、著者らは、効果的なトレーニング方法を提案し、あなたは学習アルゴリズムに示すように、より、新しいSRモデルLRデータに適応することができ、次の通りです。

これは、不対データ列Dネットワークを使用して、Pトレーニングデータネットワークのペアを使用して、半教師付き学習法です。目的関数は、タグデータを使用する場合、ラベル、1SP 1を使用してデータがない場合、1SPが0であり、以下の通りです。

超解像ネットワーク設計Uネットに基づいて、以下に示すように、ネットワークの全体的な構造。元のネットワークとデュアルネットワーク:本論文のDRNモデルは、2つの部分から構成されています。著者はまた、詳細は論文で見つけることができ、ここに入らない、詳細な理論的な正当性を与えます。

実験

タスクの超解像画像のペアのデータと実際のデータ対になっていないケースバイキュービックに広範囲の比較実験を行いました。すべての実装は、PyTorchフレームワークに基づいています。5つの試験データセットはSET5、SET14、BSDS100、URBAN100とMANGA109を含む基準データセットです。評価は、一般的にPSNRやSSIMを使用しています。トレーニングセットはDIV2KとFlickr2Kデータセットです。

著者の最初のショー4倍と8倍SRのモデルとサイズのパフォーマンスの比較。実験では、著者らは、二つのモデル、すなわち、大小のモデルDRN-SモデルDRN-Lを提案します。方法コントラスト結果は、オープンソース・コードまたは元の紙のそれらの前のトレーニングモデルから得られます。結果は以下の通りであります

また、4倍及び8倍超解像超解像を提供し、グラフは、各方法の性能を比較します。

著者らはまた、2つのPネットワークとDネットワーク損失関数との間の重い重量の影響を研究しました。そして、学習の二重の影響を調達するかどうか。以下の表に示すように。

最後に、著者は、単に視覚的な結果を表示するために、実際の場面で再建の効果を比較しました。また、効果は、本明細書に記載の最適であることがわかる補間方法の異なる使用の効果を比較しました。 

結論

本論文では、ペアと対になっていないデータのための二重回帰法を提案します。対になったデータに、解空間の制約は、再生LR画像を介して導入され、著しくモデルSRの性能を向上させることができます。また、この記事では、対になっていないデータに焦点を当て、そのようなYouTubeのオリジナルのビデオから、実際のデータの二重回帰法に適用されます。ペアと不対データのための実験の多くは、本明細書に参照方法を記載された方法よりも優れていることが判明しました。

論文住所:

https://arxiv.org/pdf/2003.07018.pdf

【終わり】

今日午後8時、我々は新しいウイルスクラウン軌道を追求する方法Sophon KG、AI技術の使用を考慮すると、知識マップを作成するためのツール、親族によって、密接な接触とタイムリーな分離を識別するために、同僚や友人のネットワークを例を確認、および特性自社のネットワークおよびウイルスの可能な外部の密接な接触を見つけるためにトラック活動の確定例、「攻撃環境を。」

推奨読書 

154のワンAIの開発者はどのように我々は中国AIを追い越すために回すことができる、あなたに伝えるためにデータを使用するには?

中国のUAV「古い大砲の子」回顧録

ライブデビュービブラート過熱:3時間1.1億、マイクロソフトの3画面の暴露は、マシンの特許を折りたたみ、Linuxのミント20は唯一の64ビット版を提供

「デッドキャリー」高並流、大麦グラブ票技術ニルヴァーナ道路

ビットコインは、次の「ビットコイン」は仮面の男を作成することを作成するには、「マスクされた男たち」から?

続け展開とベスト・プラクティスでは、コンテナの上に構築されました

あなたは、私が好きなよう真剣に、すべてのポイントを見て

元読み取るためにクリックして新聞に関与し、名前を!

リリース1910元の記事 ウォンの賞賛40000 + ビュー1768万+

おすすめ

転載: blog.csdn.net/csdnnews/article/details/105283512