ターゲットの検出およびNAS

まず、NASNetの目標検出

スケーラブルな画像認識のための学習譲渡アーキテクチャ

二、NASNet

ネットワーク構造の自動生成

ここに画像を挿入説明
上記のように、コントローラRNNは、R Pでスケーリング収束精度R、更新されたRNN勾配制御を達成するように訓練された構造のAサブネットワークを有する、予測構造Aから確率pを用いて空間を探索します。

2、重複思想を用いresnetインセプションブロック構造を使用して

ここに画像を挿入説明
紙は、RNNコントローラはまた、非常に異なると、元のNASの場所である基本単位畳み込みセルを、学ぶために取得すること、(例えばResNetとGoogleNetなど)、現在の主流の考え方繰り返して積層優れたネットワーク構造の上に描画します。紙これらの2個の細胞に示されるように、畳み込みセルを積層して全体のネットワーク構造を構築するためには、図1のネットワーク構造上のデータの異なるセットに基づいて構築されています。
  任意のサイズのものとすることができるスケーラブルなネットワークアーキテクチャと画像の構造を生成するために、この論文に基づく設計は、2個の主なconvlolution細胞を含みます。

  • セルノーマル:入力特徴マップのサイズを変更せずに畳み込み、
  • セルの削減:入力特徴マップの長さと幅は、それがストライドのサイズを大きくすることによって、サイズを小さくすることで、元の畳み込みの半分に減少しています。

最後に、コントローラは、両方のRNNセルを予測するために使用されます。

図3は、大規模なデータセットへのネットワーク移行を学んで生成された転送を使用することで、新たな探索空間を提案しています

ここに画像を挿入説明
一个convolution cell由B个block组成,那么一个block又是什么呢,如上图所示,对于每个block来说RNN控制器有5个预测步骤也有5个输出的预测值。每个block的输入是前面的两个block的最后的输出。

预测步骤一共是5个步骤:

  1. 从h_i​,h_i−1​或从隐状态的集合中选择一个隐藏的状态,例如上图基本模块的hidden layer A;
  2. 从与步骤1相同的选项中选择第二个隐藏状态,例如上图基本模块的hidden layer B;
  3. 选择要应用于步骤1中选择的隐藏状态的操作(黄色框);
  4. 选择要应用于步骤2中选择的隐藏状态的操作(黄色框);
  5. 选择一个方法来组合步骤3和步骤4的输出来创建(绿色框);

考虑到计算资源的限制,论文限制了search space,设置B=5。
步骤3和步骤4中选择的操作可以下面的这些选项选择 :
ここに画像を挿入説明
搜索策略:
ここに画像を挿入説明
文章进行了布鲁斯-随机搜索(RS)和强化学习(RL)的对比,得出强化学习(红色)可以获得比随机搜索(蓝色)更好的结果。

最终结构NASNet-A:
ここに画像を挿入説明

4、结果

ここに画像を挿入説明

                                </div>
            <link href="https://csdnimg.cn/release/phoenix/mdeditor/markdown_views-b6c3c6d139.css" rel="stylesheet">
                                            <div class="more-toolbox">
            <div class="left-toolbox">
                <ul class="toolbox-list">
                    
                    <li class="tool-item tool-active is-like "><a href="javascript:;"><svg class="icon" aria-hidden="true">
                        <use xlink:href="#csdnc-thumbsup"></use>
                    </svg><span class="name">点赞</span>
                    <span class="count"></span>
                    </a></li>
                    <li class="tool-item tool-active is-collection "><a href="javascript:;" data-report-click="{&quot;mod&quot;:&quot;popu_824&quot;}"><svg class="icon" aria-hidden="true">
                        <use xlink:href="#icon-csdnc-Collection-G"></use>
                    </svg><span class="name">收藏</span></a></li>
                    <li class="tool-item tool-active is-share"><a href="javascript:;"><svg class="icon" aria-hidden="true">
                        <use xlink:href="#icon-csdnc-fenxiang"></use>
                    </svg>分享</a></li>
                    <!--打赏开始-->
                                            <!--打赏结束-->
                                            <li class="tool-item tool-more">
                        <a>
                        <svg t="1575545411852" class="icon" viewBox="0 0 1024 1024" version="1.1" xmlns="http://www.w3.org/2000/svg" p-id="5717" xmlns:xlink="http://www.w3.org/1999/xlink" width="200" height="200"><defs><style type="text/css"></style></defs><path d="M179.176 499.222m-113.245 0a113.245 113.245 0 1 0 226.49 0 113.245 113.245 0 1 0-226.49 0Z" p-id="5718"></path><path d="M509.684 499.222m-113.245 0a113.245 113.245 0 1 0 226.49 0 113.245 113.245 0 1 0-226.49 0Z" p-id="5719"></path><path d="M846.175 499.222m-113.245 0a113.245 113.245 0 1 0 226.49 0 113.245 113.245 0 1 0-226.49 0Z" p-id="5720"></path></svg>
                        </a>
                        <ul class="more-box">
                            <li class="item"><a class="article-report">文章举报</a></li>
                        </ul>
                    </li>
                                        </ul>
            </div>
                        </div>
        <div class="person-messagebox">
            <div class="left-message"><a href="https://blog.csdn.net/thisiszdy">
                <img src="https://profile.csdnimg.cn/E/C/9/3_thisiszdy" class="avatar_pic" username="thisiszdy">
                                        <img src="https://g.csdnimg.cn/static/user-reg-year/1x/2.png" class="user-years">
                                </a></div>
            <div class="middle-message">
                                    <div class="title"><span class="tit"><a href="https://blog.csdn.net/thisiszdy" data-report-click="{&quot;mod&quot;:&quot;popu_379&quot;}" target="_blank">thisiszdy</a></span>
                                        </div>
                <div class="text"><span>发布了53 篇原创文章</span> · <span>获赞 15</span> · <span>访问量 2万+</span></div>
            </div>
                            <div class="right-message">
                                        <a href="https://im.csdn.net/im/main.html?userName=thisiszdy" target="_blank" class="btn btn-sm btn-red-hollow bt-button personal-letter">私信
                    </a>
                                                        <a class="btn btn-sm  bt-button personal-watch" data-report-click="{&quot;mod&quot;:&quot;popu_379&quot;}">关注</a>
                                </div>
                        </div>
                </div>
发布了37 篇原创文章 · 获赞 12 · 访问量 2万+

一、目标检测之NASNet

Learning Transferable Architectures for Scalable Image Recognition

二、NASNet

1、自动产生网络结构

ここに画像を挿入説明
如上图所示,控制器RNN利用概率p从搜索空间预测结构A,一个具有A结构的子网络被训练成收敛性达到精度R,用R缩放p的梯度来更新RNN控制器。

2、采用resnet和Inception重叠使用block结构思想

ここに画像を挿入説明
论文借鉴了目前主流优秀的网络结构(如ResNet和GoogleNet)的重复堆叠思想,使得RNN控制器学习得到也是基本单元convolutional cell,这是和原来的NAS很不一样的地方。论文通过堆叠convolution cell从而构建整个网络结构,上图所示就是基于这两种cell在不同数据集上构建的网络结构。
  为了生成可扩展的网络结构并且能够结构任意size的图像,基于此论文设计的convlolution cell主要包含两种:

  • Normal Cell:不改变输入feature map的大小的卷积;
  • Reduction Cell:将输入feature map的长宽各减少为原来的一半的卷积,是通过增加stride的大小来降低size。

最后RNN控制器用来预测这两种Cell。

3、利用迁移学习将生成的网络迁移到大数据集上提出一个new search space

ここに画像を挿入説明
一个convolution cell由B个block组成,那么一个block又是什么呢,如上图所示,对于每个block来说RNN控制器有5个预测步骤也有5个输出的预测值。每个block的输入是前面的两个block的最后的输出。

预测步骤一共是5个步骤:

  1. 从h_i​,h_i−1​或从隐状态的集合中选择一个隐藏的状态,例如上图基本模块的hidden layer A;
  2. 例えば、ステップ1と同様のオプションから第二の隠れ状態を選択し、図隠れ層Bのベースモジュール。
  3. 選択された状態に隠された適用手順(黄色のボックス)を選択します。
  4. 隠された状態2を選択し適用するステップ(黄色のボックス)を選択します。
  5. (緑色のボックス)を作成する出力ステップ3及び4の組み合わせを選択する方法。

計算リソースの限界を考慮すると、紙の探索空間、集合B = 5を制限します。
手順の選択3と4の操作は、以下のオプションを選択できます。
ここに画像を挿入説明
検索戦略:
ここに画像を挿入説明
記事ブルースだった- (RL)を学習ランダム探索(RS)と補強を比較し、取得した強化学習(赤)は、ランダム探索より求めることができます(青)より良好な結果。

最終的な構造NASNet-A:
ここに画像を挿入説明

4つの結果

ここに画像を挿入説明

                                </div>
            <link href="https://csdnimg.cn/release/phoenix/mdeditor/markdown_views-b6c3c6d139.css" rel="stylesheet">
                                            <div class="more-toolbox">
            <div class="left-toolbox">
                <ul class="toolbox-list">
                    
                    <li class="tool-item tool-active is-like "><a href="javascript:;"><svg class="icon" aria-hidden="true">
                        <use xlink:href="#csdnc-thumbsup"></use>
                    </svg><span class="name">点赞</span>
                    <span class="count"></span>
                    </a></li>
                    <li class="tool-item tool-active is-collection "><a href="javascript:;" data-report-click="{&quot;mod&quot;:&quot;popu_824&quot;}"><svg class="icon" aria-hidden="true">
                        <use xlink:href="#icon-csdnc-Collection-G"></use>
                    </svg><span class="name">收藏</span></a></li>
                    <li class="tool-item tool-active is-share"><a href="javascript:;"><svg class="icon" aria-hidden="true">
                        <use xlink:href="#icon-csdnc-fenxiang"></use>
                    </svg>分享</a></li>
                    <!--打赏开始-->
                                            <!--打赏结束-->
                                            <li class="tool-item tool-more">
                        <a>
                        <svg t="1575545411852" class="icon" viewBox="0 0 1024 1024" version="1.1" xmlns="http://www.w3.org/2000/svg" p-id="5717" xmlns:xlink="http://www.w3.org/1999/xlink" width="200" height="200"><defs><style type="text/css"></style></defs><path d="M179.176 499.222m-113.245 0a113.245 113.245 0 1 0 226.49 0 113.245 113.245 0 1 0-226.49 0Z" p-id="5718"></path><path d="M509.684 499.222m-113.245 0a113.245 113.245 0 1 0 226.49 0 113.245 113.245 0 1 0-226.49 0Z" p-id="5719"></path><path d="M846.175 499.222m-113.245 0a113.245 113.245 0 1 0 226.49 0 113.245 113.245 0 1 0-226.49 0Z" p-id="5720"></path></svg>
                        </a>
                        <ul class="more-box">
                            <li class="item"><a class="article-report">文章举报</a></li>
                        </ul>
                    </li>
                                        </ul>
            </div>
                        </div>
        <div class="person-messagebox">
            <div class="left-message"><a href="https://blog.csdn.net/thisiszdy">
                <img src="https://profile.csdnimg.cn/E/C/9/3_thisiszdy" class="avatar_pic" username="thisiszdy">
                                        <img src="https://g.csdnimg.cn/static/user-reg-year/1x/2.png" class="user-years">
                                </a></div>
            <div class="middle-message">
                                    <div class="title"><span class="tit"><a href="https://blog.csdn.net/thisiszdy" data-report-click="{&quot;mod&quot;:&quot;popu_379&quot;}" target="_blank">thisiszdy</a></span>
                                        </div>
                <div class="text"><span>发布了53 篇原创文章</span> · <span>获赞 15</span> · <span>访问量 2万+</span></div>
            </div>
                            <div class="right-message">
                                        <a href="https://im.csdn.net/im/main.html?userName=thisiszdy" target="_blank" class="btn btn-sm btn-red-hollow bt-button personal-letter">私信
                    </a>
                                                        <a class="btn btn-sm  bt-button personal-watch" data-report-click="{&quot;mod&quot;:&quot;popu_379&quot;}">关注</a>
                                </div>
                        </div>
                </div>

おすすめ

転載: blog.csdn.net/weixin_43489950/article/details/104345200