ディープラーニングターゲット検出シリーズのYOLOV3

1.ゴシップ

          著者は、yolov3は他にもやるべきことがたくさんあるので、テクニカルレポートと同等であると述べました。したがって、yolov3は元のyoloバージョンと同等であり、既存の高度なテクノロジーを統合して改善します。しかし、業界のフィードバックに関しては、それでも非常に良いです。これは、他の人が一生ではできないことを何気なく行う人がいることを意味します。しかし、この論文のより大きな重要性は、立ち止まって考えてみましょう。これ何を意味するの  でしょうか。言い換えれば、これは人間社会に何をもたらすのでしょうか。歴史の中で、偉大な神々がこの車の車輪を発明しました、そして私たちはそれを前進させる責任があります。しかし、前方に大きなファイヤーピットがある場合はどうなりますか?押し続けますか?偉大なる神は私が辞めることを明らかにしました!だから、紙は終わります 私たちは世界にそんなに借りていますおそらく誰もが、テクノロジーは目的を達成するための単なるツールであると勝手に考えるべきではありません。日本の対中侵略戦争の時と同じように、良心のある人は、家族を養うために自分の国や人を裏切ったとは言えません。私は人間の外に存在する手(または複数のペア)、彼が私たちのためにどのような計画を持っているのかわかりません。私はまた、それらの本に書かれている内容、いわゆる文明と開発を放棄します(人々が愚かになるためにより多くの時間を費やすことができるようにするためだけですか?)。制御できない要因はたくさんあるかもしれませんが、私にとって、私がする唯一のことは、不義のための道具にならないことです!これは無力な小さなとしての最後の忍耐であり、彼らの良心に固執するすべての人に敬意を表しています!

2.yolov3

              yolov3の場合、2つの最も重要なポイントはdarknet53とFPNである必要があります

        1.darknet53

                    Darknet53は、darknet19に基づいて設計されたネットワーク構造のセットです。まず、ネットワーク構造から、darknet53はdarknet19とresnetの組み合わせに相当することがわかります。

         

            以下はdarknet53の効果を反映しています。19と比較すると、速度は大幅に低下しますが、精度は3%向上します。これは大きな成果であり、リアルタイム検出の必要性よりもはるかに高速です。resnetと比較すると、2つの精度に大きな違いはありませんが、速度はresnetの2倍になります。したがって、使用可能なモデルの観点から、これは間違いなく優れたネットワーク構造設計です。

 

                           

       2.FPN

                    FPNは別の別の論文です。ここでのネットワーク設計はFPNの概念を反映しているだけなので、関連する知識を説明しましょう。YOLOV2には、いわゆるパススルーレイヤーがあることは誰も知っています。このレイヤーは、最後のプーリングの前にフィーチャ26 * 26をステッチし、最後の出力フィーチャ13 * 13をステッチしてから出力します。しかし、この種のスプライシングは限定的で粗雑であり、入力画像はまだフィーチャマップから遠く離れています。FPNは、この高レベルと低レベルの情報融合のアイデアを極限まで取り入れています。次の図に示すように、fpnが高レベルの情報をアップサンプリングし、それを低レベルの機能とマージすることがわかります。この低レベルの機能には、より多くのセマンティック情報があります。そして最後の3つのレイヤーには対応する出力があります。

                    yolov3は、最初に元の9つのアンカー(10×13)、(16×30)、(33×23)、(30×61)、(62×45)、(59×119)のサイズをクラスター化することがわかっています。 、(116×90)、(156×198)、(373×326)。サイズを調整すると、フィーチャマップのサイズが大きくなるほど、各レイヤーは3つのサイズに対応します。

             

 

     3.パフォーマンス

                yolov3は全体として変更が少ないことがわかりますが、市場での現在の主流の位置は、モデルがどれほど優れているかを示すのに十分です。下の図は、yolov3の測定された効果を反映しています。高精度を維持することを前提として、彼はすでに他のネットワークを速度の点ではるかに遅れていることがわかります。もちろん、yolov3は完全ではありません。IOUのしきい値が0.5〜0.95の場合、精度が低下します。しかし、0.5iouと0.3iouの違いは人間の目には非常に小さいと説明する人もいます。誰もがそれを見ることができないので、盲目的に高いiouを追求することは実際にはあまり意味がありません。

 

3.まとめ

      この記事では、v2と比較したyoloV3の変更を紹介し、darknet53ネットワークを再設計し、機能融合のためのFPNのアイデアを利用します。理解するのは比較的簡単です。誰もが奨励しています。V3の作者のように、私も対処すべき厄介なことがたくさんありますが、グラフィックスの世界からもAIサークルからも撤退することはありません。もちろん、それは私がAIをどれだけ愛しているかという理由ではなく、私のような小さなキャラクターがやめるという言葉にふさわしくないように思われるからです。

      エミネムの歌はお互いを励まし合い、目の前に現れるあらゆる機会を大切にし、星を見上げ、足を地面につけておくために自分を失います...               

                         見て、あなたが一発、または一回の機会があったかどうか

                               あなたが今まで望んでいたすべてをつかむために、一瞬

                                         キャプチャしますか、それとも単にスリップさせますか?             

エミネム-オスカーを受賞した最初のラップソング、映画「8マイル」のテーマソング、そしてグラミーで最高のラップソング

 

 

 

 

 

 

 

おすすめ

転載: blog.csdn.net/gaobing1993/article/details/108417974