ヨロV3は、ラベルとバウンディングボックスとの間の関係を理解します

BBOX座標場合:[35220622933]

最初のステップ:(ズーム変倍の3種類)BBOXフォームの中心の座標と幅と高さに変換

次いでonehot:[0 0 0 1 0 0 0 0 0 0 ........]、もちろん、滑らかで

バウンディングボックスの中心座標と幅及び(35 + 62)/ 2 = 48.5(220 + 293)/2=256.5幅と高さ= 62から35 = 73 27293から220までの高さを算出

したがって、バウンディングボックスの幅及び中心座標(256.5 48.5 2773)の高さ

次いで、スケーリングに従ってスケールされ(81632)

図3は、座標のスケーリングされたセット[32.0625 6.0625 3.375 9.125] [3.03 1.68 16.03 4.56]、[1.51 8.01 0.84 2.28]であります

ステップ2:アンカーが高いと広いセンターを取得します

アンカー中心座標及び3~8スケールの合計の各グループの幅と高さ:[32.5 1.25 1.625 6.5] [6.5 2 3.75 32.5]、[32.5 4.125 2.875 6.5]

                 16のスケール:[3.5 16.5 1.875 3.8125] [2.8125 3.875 3.5 16.5]、[16.5 3.6875 7.4375 3.5]

                 32のスケール:[1.5 2.8125 8.5 3.625] [4.875 6.1875 1.5 8.5] [1.5 8.5 11.65625 10.1875]

前記中心座標の座標は関数kmeans外クラスタのバウンディングボックスプラス0.5、幅と高さ座標を丸め

次いで、3バウンディングボックス座標のセットと3つの群座標アンカーIOU算出しました

バウンディングボックスのアンカーに対応する3つのグループの3つの異なるスケーリングはIOU> 0.3と左上隅のマークダウンのグリッド座標を見つけます。

ラベル格式为[範囲のiについてnp.zeros((train_output_sizes [I]、train_output_sizes [i]は、anchor_per_scale、5 + num_classes))(3)]

次に、寸法の三種類のI = [1,2,3]代表的にラベルを付けます。

ラベル[i]の[ニース、インド、iou_mask:] = 0 
のラベル[i]の[ニース、インド、iou_mask、0:4] = bbox_xywh
ラベル[i]の[ニース、インド、iou_mask、4:5] = 1.0
ラベル[i]の[ニース、インド、iou_mask、5:] = smooth_onehot

おすすめ

転載: www.cnblogs.com/lzq116/p/12176022.html
おすすめ