複数のターゲットを検出したときに、YOLOv5 が特定のターゲットの出現に対してのみアラームを鳴らすようにするにはどうすればよいですか?

1. 問題の説明

前回のブログ投稿では、多くの友人がプライベート メッセージやコメントを通じて私にメッセージを残して、「ラベルが 2 つある場合、どちらかを認識させて警察に通報するにはどうすればよいですか?」という質問をしました。実際には、次の C友人が解決策を教えてくれました。はい、しかし、YOLOv5 の各部分のコードを理解していない可能性があるため、自分で変更するのはまだ困難です。
ここに画像の説明を挿入
ここでは私なりの改善方法をお話しますので、皆さんも試してみてください。

2. 改善方法

私の方法は比較的シンプルですが、detect.pyのピクチャフレームのコードに判定を追加するだけです。
ここではヘルメットの検出を例に操作してみます。
コードバージョン: YOLOv5-6.2
検出重み: ヘルメット検出のオープンソース重み、s バージョン
検出オブジェクト: 人物と帽子の両方

第一歩

detect.py で、コード行のこの部分を見つけます。スクリーンショットは次のとおりです。
ここに画像の説明を挿入

ステップ2

次に、コードを入力します

if names[int(cls)] == 'person':

ステップ3

次に、if ステートメントの下に音声ブロードキャスト コードを挿入します。

value = det[:, 4].max().item() #进行多个目标检测,检测的所需目标才发出语音告警
if value > 0.80:
    count += 1
    if count > 8:
        count = 0
        if time.time() - tplay > 4.0:
            import os  
            os.system(
              'start /b D:/yolov5-6.2-helmet/ffmpeg/bin/ffplay.exe -autoexit -nodisp D:/yolov5-6.2-helmet/helmet-warning.mp3')  # 音乐播放
   # 参数含义: start /b 后台启动  ffplay音乐播放软件的位置   -autoexit 播放完毕自动退出  -nodisp不显示窗口    mp3语音的位置
            tplay = time.time()

コードを追加すると、次の効果が表示されます。スクリーンショットは次のとおりです。
ここに画像の説明を挿入

ステップ4

次に、detect.py でコードのこの部分を見つけます。スクリーンショットは次のとおりです。
ここに画像の説明を挿入
次に、次のコード行を追加します。

t0 = time.time()
count = 0
tplay = 0

追加後の効果は次のとおりです。
ここに画像の説明を挿入
変更はここで終了し、detect.py スクリプトを実行するだけです。
音声アラームのMP3ファイルの生成方法? 私のこのブログ投稿を読むことができます:ターゲットを検出した後に YOLOv5 にアラームを鳴らす方法? このブログ投稿の前のセクションで詳しく説明しました。

3. 検知効果表示

検出が完了した後に YOLOv5 アルゴリズムによって保存された検出フレームを含むビデオには音声がありません。これは原作者が書いたものです。ここでのショーは、QQ 画面録画機能を使用して録画したことです。

YOLOv5 マルチターゲット検出、特定のターゲットが出現したときの音声アラームの効果

動画では、最初はその人はヘルメットをかぶっていなかったので、アルゴリズムが検出後に音声アラームを発していましたが、帽子をかぶった後はアルゴリズムがヘルメットをかぶっていることを検出し、音声アラームは発せられませんでした。

5.最後に書く

ちょっと自分を売り込みましょう。1.マーク
された喫煙データ セット、応答および通話用の携帯電話データ セット、エレベーター ボタン データ セット、および上記のデータ セットを使用してトレーニングされた YOLOv5 検出重み。

2. YOLOv5-5.0 向けの改善されたソリューションもあります (アテンション メカニズム、構造の改善など)。

3. YOLOv5 の PyQT 検出インターフェイスには、音声アラームの完全な手順セットが含まれています。

検出インターフェースの効果表示

困っているクラスメートは、Didi me にプライベート メッセージを送信できます。絶対に高品質で低価格です。

おすすめ

転載: blog.csdn.net/Mr_LanGX/article/details/130734276