(2017-2019)を検出するための方法を仕上げ(リモート/テキスト)ターゲットを回転させます

 
著者:qianlinjunの
リンクします。https://zhuanlan.zhihu.com/p/98703562

最近、近年の機会を利用し、リモートセンシング目標検出紙仕上げ作業部分を関連付ける、リモートセンシングは、テキストの回転シーン目標検出紙方法とコードの整頓を(集中)、希望の不作為の多くアウトポイントまでラッシュがあります。

最初はDOTAにデータセットの公式ウェブサイトを置く()、公式サイトには、水平および回転ターゲット提出インタフェースは、あなたがランキングを検出するために、リアルタイムで結果を見ることができます提供()、現在のトップ5は、武漢大学Xiaguiソングチーム、南京大学科学のpca_lab、サイバー会社なので、中国科学アカデミーと電子アリIDSTからでした。チームの前にあるプラス記号を開くと導入方法のいくつかを見ることができます。

DOTA回転目標トラックリアルタイムランキング(2019 12-22)

以下は、年代順に提出された書類に係る方法を説明します

1.RRPN(二段白テキスト検出支店翔グループ)

時間:2017年3月3日

题目:「任意指向のシーンテキスト検出による回転提言」

リンク:

イノベーション:

これは、シーンテキスト候補ブロックベースのアーキテクチャRPN任意の方向を検出する第一回転内に導入されるべきです。ROIの回転は、アンカーの回転に基づいて得られ、次いで、対応する特徴を抽出し、効果があってもよいです

パイプライン 定義済みのアンカー

2.EAST(科学技術の単相検出器のテキスト傑作)

時間:2017年4月11日

题目: "EAST:効率的で正確なシーンテキスト検出器」

リンク:

知っているほとんどの解釈:

イノベーション

  • これは、検出枠figure3のシングルステージを提案しています。新たな目標回転定義された方法(四辺形特性距離及び回転角情報フレームをポイント)、C、図Dの下に示すように、Eは、4つの予測距離及び角度情報であります
  • グランドトゥルースボックスの回転が内側左上()以下のスケーリングされた範囲は、緑色のブロック図である必要があり、グリーンフレーム特徴点として低下ターゲットアンカーフリー回転を検出する比較的早い方法を試します陽性サンプル。アンカーフリーレベル検出FoveaBoxこの考えの2019は、ターゲットフレームに幾分類似している(
  • プロセスのNMSを加速するために、地域-AwareのNMSを提案

3. R2CNN(二段テキスト検出サムスン中国)

時間:2017年6月29日

题目: "R2CNN:回転リージョンCNNオリエンテーション堅牢なシーンのテキスト検出のための」

リンク:

知っているほとんどの解釈:

イノベーション

  • 新しいターゲット定義回転方法(最初の2つの角点の四隅の点が時計回りの順序のX1、Y1、X2とY2の矩形高で検出しました)
  • プールROIもサイズを集め3X11と11x3 2種類を追加したときにプールされたサイズの7x7のを使用することに加えて、考慮にいくつかのテキストボックスの幅と高さとの間に大きなギャップを取って、より速くrcnn全体的なフレームワークを使用してください。3X11機能は良好高い検出ワイドフレームとの比較に適している、レベルをキャプチャすることができ、そして11x3垂直フィーチャが広いより検出されたブロックの背を比較するための良好な捕捉を、より良くすることができます。

4.RR-CNN(二段船検出CASIA)

時間:2017年9月。

题目: "回転REGION BASED CNN FOR SHIP検出」

リンク:

イノベーション:

  • 提案されたRROIプーリング層、ターゲット特徴抽出を回転させます
  • ターゲット・モデルを回転回帰
  • 行うには同様の目標のための伝統的なNMS、この記事では、マルチタスク、マルチカテゴリのNMS(紙があまりにも見て理解していない参照)を提案しています
ROIプーリング マルチタスクNMS

5. DRBOX(CAS二段検出対象電子)

時間:2017年11月26日

题目: "回転可能バウンディングボックスを回転不変検出器の学習」

链接:

创新:

  • 网络pipeline如下,论文时间比较早,没具体说使用了什么网络结构,参考其他论文说法,DRBOX类似RPN结构
  • 比较早的说明了用水平框检测旋转目标存在的问题

6. TextBoxes++(单阶段 华科白翔组)

时间:9 Jan 2018

题目:《TextBoxes++: A Single-Shot Oriented Scene Text Detector》

链接:

知乎链接:

创新:

  • 在SSD基础上检测水平框和旋转框

 

  • 使用不规则卷积核:

textboxes++中采用3x5的卷积核,以便更好的适应长宽比更大的文字

  • 使用OHEM策略

训练过程采用OHEM策略,不同于传统的OHEM,训练分为两个stage,stage1的正负样本比为1:3,stage2的政府样本比为1:6

  • 多尺度训练

由于Textboxes++采用了全卷积结构,因此可以适应不同尺度的输入。为了适应不同尺度目标,采用了多尺度训练。

  • 级联NMS

由于计算倾斜文字的IOU较为耗时,因此作者采用级联NMS加速IOU计算,先计算所有所有框的最小外接矩形的IOU,做一次阈值为0.5的NMS,消除一部分框,然后再计算倾斜框的IOU的基础上做一次阈值为0.2的NMS。


7. Learning roi transformer for oriented object detection in aerial images(cvpr2019 武大夏桂松 两阶段)

时间 1 Dec 2018

题目:《Learning roi transformer for oriented object detection in aerial images》

论文链接:

创新

  • 基于水平anchor,在RPN阶段通过全连接学习得到旋转ROI(区别于RRPN设置很多旋转anchor,因为这篇文章是从水平anchor学习得到旋转ROI,减小了计算量),基于旋转ROI提取特征,然后进行定位和分类
  • Rotated Position Sensitive RoI Align

基于旋转框提取roi特征

8. R2PN(两阶段)

时间: August 2018

题目:《Toward arbitrary-oriented ship detection with rotated region proposal and discrimination networks》

链接:

创新

  • 回転アンカー、ROI、回転に基づいて特徴を抽出ROIを回転させることによって得られたRPNに基づいて、よりRRPNように感じ、その後見つけて分類します。この記事と学習ROIトランス違いは、前者が水平アンカー、計算のより少ない量である回転アンカー、ということです。

9. R2CNN ++(SCRDet)(二段CAS電子)

時間:2018年11月17日

题目: "SCRDet:より堅牢な検出に向けて小型、雑然として回転のためには、オブジェクト"

リンク:

注意のメカニズムをチャネル、機能の融合とスペースを追加します。水平アンカーに基づいて、RPNは、次に検出ヘッドは、以下のようにターゲットの予測(X、Y、W、H、θ)、パイプライン座標任意の角度を達成するために、粗いROIによって予測されます。

pipline

イノベーション:

  • SF-ネット:マップ機能の2つの異なる層は、小さな標的融合の効率的な検出をカスタマイズしました
SF-ネット
  • MDA-ネット:注目のチャンネルピクセルレベルの注意の使用を検出するためのメカニズムと集中的な小さな目標と目的
MDA-ネット
  • ターゲットへ回転垂直の角度に変化がある場合平滑L1lossの提案された改良版は、(0から°のmutate -90°まで)の不連続の問題を解決します

10. CADネット(二段)

時間:2019年3月3日

题目:「CAD-ネット:コンテキストアウェア検出ネットワークリモートセンシング画像内のオブジェクトのために」

リンク:

イノベーション:

  • 提案GCNet(グローバル・コンテキスト・ネットワーク)、ターゲット検出時グローバルコンテキスト情報への統合
  • 提案PLCNet、目標シナジーの学習スペースの焦点に(ローカルコンテキストネットワークをピラミッド)
ネットワークのパイプライン PLCNet構造の スペースの注意

。11 R3Det(単相回転検出対象プロセッサ・オン耐え&南)

時間2019年8月

题目: "R3Det:オブジェクトを回転させるための機能洗練された洗練されたシングルステージ検出器」

論文リンク:

コード:

通訳リンク:

イノベーション:

  • 回転検出対象(ターゲット検出レベルができ)存在してもよく、アンカー形状(上部の下方に一致していない特徴点の目標位置受容野は、緑色フレームアンカーを隅を残し、それが乗って特徴点に見ることができます船の一部は、その後、グランドトゥルース(赤いボックス)を合わせてアンカーに戻すには、この特徴点を直接使用することは必ずしも正確ではない)、この論文は2つの段階に分かれているので:アンカーから最初のステージは、次のようにスピンボックス(オレンジボックス)を予測赤で示されるように、> 2、この時間は、オレンジ色の枠の範囲が非常に近い実際のターゲットにされた後、オレンジ色のボックス機能(私はROIが同様の特性をプール理解として抽出)に従って抽出し、この特徴によってグランドトゥルースに復帰 - 図番号1赤デジタル2-> 3。
  • RetinaNetネットワーク構造は、の構造を以下、及び発表は洗練モジュールを備えて、複数回積層することができると
使用retinanetネットワークバックボーン構造の 機能改良モジュール

最近、いくつかの新しい論文の回転検出対象は、アイデアは似ています。

1.中国支店グループ&呉夏Guisongから白翔「マルチオブジェクト指向の検出のための水平方向のバウンディングボックスで頂点を滑空」

リンク:

イノベーション:

RPN全体的な構造ベースのアンカー構造レベル、検出ヘッドの予測結果水平フレームと回転フレームの出力つつ。回転枠ブロックを回転する4つの頂点の水平フレームが得られるオフセット4つの頂点に対して水平フレームに基づいて予測されます。

回転フレームの水平フレームの結果から得られた結果 フレームと水平フレーム出力を回転させながら、パイプライン検査ヘッド

2.IENet(アンカー-無料)

链接:

检测头思路和上面那篇比较像,但是整体结构和fcos类似,也就是anchor-free思路,同时引入了注意力机制

未完待续..

おすすめ

転載: www.cnblogs.com/wind-chaser/p/12273552.html