Keras-YOLOv3モデルを理解し、使用するために訓練サプリメント[+]

このブログは、要約を作成する場所を比較し、周りのプロセスの関連する重要な部分の実現にチュートリアルが、自分自身ではありません。

私が変更されたコードを使用しても使用して実施する場合の詳細な手順は、(長いP明確なポイントではないか、keras下YOLOで説明し、B駅のマスターアップ教育ビデオを推奨し、追加のコードが必要と発表しました、)私の感謝の気持ちを表現するために、原則の実現のために、ネットワーク構造の話darknet53は非常に明確である:kerasは独自yolo3ターゲット検出プラットフォーム(yolo3ソースコード詳細)構築
のも貼り付けられた著者keras-YOLO GitHubのを

学生パスを所有することができますので、それはなどウェイトトレーニング画像、ラベル、と、言って材料オンラインそれらの詳細に限定されることはありませんので、ソースコードを読み取る能力を持っているが、高度、少なくとも、あなたはコードの部分をやっている知っている、いくつかの理解を行うことをお勧めします対応する変更。

3つのデータセットの関連

コンピュータビジョンのチャレンジからのデータセットの名前があります。現在、物体認識の分野では、人間よりも標的認識精度と分解能のコンピュータが持っています。

COCOデータセット:マーク80個のカテゴリがあり
VOCデータ収集:20のカテゴリでマークされたが、データ量が比較的少ない
imagenetデータセット:データの膨大な量、数十絵の何千ものまで

ダークネットからkerasへ

ダークネット及びkerasは、二つの異なるアーキテクチャ、特定のライブラリに実質的に依存しないダークネット、本体としてC言語であり; Tensorflowが書き込まPython言語に基づいているkeras。最も明白な違いを使用する場合は重量(またはモデルと呼ばれる)とは異なります。YOLO事前研修モデルが提供するのダークネットアーキテクチャのココデータセットの下で実施された研修、モデルのサフィックスは.weightです。読み取ることができKerasモデルは.h5接尾辞です。だから私たちが見ると、コード記述keras-YOLO変換の役割を果たしているでconvert.py有するよう文書を、使用することができます。また、その理由として、私も料理です。モデル、体重、ネットワーク混合状態にある三つの言葉でした。

YOLO缶チューンすべての場所

使用する場合:ロードされたモデルを修正することによって、パスを変更するステップと、画像パスを識別する

(train.pyファイル内の)トレーニング:タグファイル(.txt)のパスで読み取ることができるYOLO書かれたフォーマット、前のフレーム(archors)経路、新しいトレーニングモデルの格納位置、事前訓練モデル位置、トレーニングおよび検証セットの比率は、3後、BATCH_SIZE(各バッチの量、コンピューティング性能に応じて)は、トレーニング、エポックの層の全て(訓練世代が何回も繰り返される)場合

事前研修モデルについてここでは詳細は新しいホワイトボードネットワークと比較されるが、訓練されたパターン認識ネットワークは、これらのクラス(クラス)は、トレーニングの前に表示されていなかったにも関わらず、より速く、より特徴的なパターンを見つけて抽出することが効率的な場合があります前に。Yolo_weight.h5直接訓練に基づいに訓練された(事前に訓練されたネットワークimagenetのデータの集合である)darknet53であってもよいです。

詳細オプション:変更先験的特定のフレームサイズ(アンカー、アンカー、ファイルパス./model_data/yolo_anchors.txt、kmeans.pyが提供する画像上のクラスタボックスに、大規模なオブジェクトを識別分け、オブジェクト、小さな対象ブロックのスリーサイズ)

コンフィギュレーション・データセット

VOC試験は、データセット、VOCに従ってフォーマットに示したデータセット上で行いました。もちろん、全体の1種類、不可能ではないが、自分の使用を再所有しますが、多くのコードを変更することで、あるいは成功して実行することができますプログラムYOLO識別フォーマットに書き換えます。そう容易に利用可能なデータセットの形式があるので、我々はそれが標準の近くに移動するためのイニシアチブを取ることを検討してください。
かかわらず、年間の、VOC全身状態データは、5つの目標画像タグ2原画マッピング情報3を識別するために使用されているフォルダ、およびさらに2つのセマンティックセグメンテーション情報ファイルフォルダを含むがありセット。

変換処理前のトレーニングのシリーズ

まず、自分のvoc2yolo.pyを書くためにステップB駅までで使用されている絵「名前」コレクションを、訓練するために設定し、元のVOCデータセットの処理の必要性は、VOCデータ収集の下になります./ImageSet/Main train.txtを生成します。その後keras-YOLO voc_annotation.pyが来る、ステップ会うVOCラベルフォーマット生成ヨロ読めるラベルフォーマットのマッピング関係に応じて、このステップでは、指定されたファイルの割合に応じて_train.txt年発生、他の3つの内部ます.txtファイル。またmodel_dataフォルダ.txtファイル内の適切なトレーニングの前に追加する必要がありますが、最も一般的で一般的であるここでの唯一のクラスを(含まれ、実際には、20クラスIの使用VOCデータセットはmodel_dataにプリセットされていますフォルダ)。

背中に書かれました

Bが原因上記のコードの使用に耐え、特にtrain.pyあなたが見るために霧を感じるそうなら、私はコードまで直接使用することを提案し、この部分はほとんど行われて書き換えます。あなたは変更が設定され、トレーニングデータセットの割り当ては、むしろプロセスVOC形式から世代YOLO認識タグラベルフォーマットに比べて、train.pyで実行されて感じることができます。
また、研修「名前」を準備しているマッピング関係VOCデータ収集タグと写真は、プロセスを終了すると、追加のコードが所定の位置にある使用。

初心者白は、高齢者の多くを理解することが、耽溺を請うてください場所がありません。私は批判や改善を楽しみにしています。

リリース3元の記事 ウォンの賞賛0 ビュー72

おすすめ

転載: blog.csdn.net/ConTroleR99/article/details/104659914