群衆カウントの主流のイノベーションの方向性を整理する

群集のカウントの定義：群集のカウントは、画像またはビデオストリームに存在する群集の総数をカウントまたは推定する手法として知られています。

母任务：オブジェクトカウンティングの目標は、1 つの画像またはビデオシーケンス内のオブジェクトインスタンスの数をカウントすることです。アプリケーション領域監視、微生物学、混雑度推定、製品カウント、トラフィックフローモニタリングなど、多くの実世界のアプリケーションがあります。

イノベーションの方向性:

動画の群衆カウントモデルを見つけて構築します。（これができれば、イノベーションの作業量全体の 50% を占めることになります。これが卒業論文の最も重要なポイントです。これができれば、バラスト石ができて、卒業できます。安定 -自分で収集高品質の条件を満たす自社開発のデータセット + 自作のデータラベル付け + データ前処理のイノベーション、イノベーションポイントの 25% がそこにあり、市場で最も強力なモデルを次のように変更できます。ビデオに適応します. ビデオの下で数える, 革新のポイントはすでに整っています. 1 枚は動画で、7 枚はカウント用の静的な個別の写真です。——私は彼らが写真の群集カウントで行ったフラワーワーク、トリック、およびモデル構造の革新の 3 つまたは 4 つを動かし、他の人から学びました—ビデオの分野に彼らのモデル革新の利点を初めて紹介しました、そして彼らの欠点を少し最適化して改善し、ビデオで誰も使用したことがないスコアが最も高いものを選択する. 私はそれを初めて使用し、多くのトリックを使用してこのシーンに最適なモデルを作成し、このシーンに最適なモデルを作成してください. 適応、私はイノベーションです—(P2PNet、CSRNet、SANet)—これらの写真は無関係です.これは特定の駅にいる群衆の写真かもしれません. 1 つは、特定の正方形の写真の群衆の写真です。しかし、私たちのタスクは、商店街の 10 分間のビデオを収集し、10 分以内に何人の人物がその映像に登場するかを数えることです.同じ人物を数えて追跡するだけでなく、異なる場所に登場する人物の類似性を比較する必要もあります.最後に、Heavy に移動し、最後に何人の人が通り過ぎたかを数えます。各フレームの密度分析や人数カウントから映像の流れ分析まで。(このトピックに関する 5 つの論文: https://github.com/gjy3035/Awesome-Crowd-Counting/blob/master/src/Video.md)

収集したビデオデータを GAN を使用して強化し、より多くのビデオデータを生成する、GAN を使用した 3 つの記事があり、モデルのどこにあるか、GAN が紹介されているか、GAN のどのようなアイデアが使用されているか、どのように解決するかがわかりますどうしたの？

高品質 (たとえば、さまざまな照明や天候をカバーする群衆カウントビデオ) と、より大きなビデオ群衆カウントデータセットを提供します。

それぞれが役割を果たし、レイヤーで動作します—次のモデルが並列化され、最終的にマージされ、すべての高度な技術が積み上げられます(1) 検出は、カメラの近くの頭を識別するために使用されます—最先端の検出技術を取りますYOLO-v7など、やるべきことをやる、(2)カメラから離れた位置での密度推定で推定される頭部の数、(3)セマンティックセグメンテーションがどのような役割を果たしているのか、まだ見ていない--最先端のセグメンテーション手法を使用して、トレンディなファンシーテクノロジと他の方向のトリックを組み合わせます。小さなターゲット検出 (人間のポーズモデル)、セマンティックセグメンテーション、顕著性検出を組み合わせます (問題は、モデルがあまりにもある可能性があります)。パラメータが多く、データ量がモデルを適切にトレーニングするのに十分でないため、一般化能力が低下し、トレーニングセットが過剰適合し、テストセットのスコアが低くなり、類似のモデルになります。)

オブジェクトカウント（他のものを数える）方向の技術は参考にできます

ファンシーでファッショナブルなテクノロジーを導入してモデルをより良くします：注目のトランスフォーマーシリーズモデルも使用できます

可能であれば、(1) モデルの蒸留、枝刈り、軽量化 (Light-weight Model) の方向で開発する (カメラなどの計算能力が比較的低いデバイスに展開されるため) —— [Deep Eye は、 (2) 圧縮モデルの予測時間を可能な限り高速化し、さらにリアルタイム (Real-Time) を達成するか、またはアブレーション実験を通じて、スコアにとって良くないいくつかのスコアを改善する多くの場合、予測時間が大幅に増加します. コンポーネントが削除されるか、一部の選択の精度が低下しますが、モデルのサイズがはるかに小さくなるか、予測時間がはるかに短くなります.

アノテーション方法、タグ生成、ネットワーク設計、損失設計、すべて革新できる

中密度および低密度のトラフィック統計に最適なモデルを見つけて構築し、モデルの食事数、予測時間、およびグラフィックスカードのメモリ使用量 (コンピューティングリソースの消費)を削減しながら、精度を最大標準。今日のモデルの大部分は、人口密度が非常に高いデータセット用に設計されています。高密度群衆カウントモデルは、多くの場合、より多くのパラメーターを持ち、より複雑になります. これらのコストの消費は、公園やビジネス地区の人々のカウントには不要です. (このシナリオでは、検出ベースの方法の方がうまく機能する可能性があります)

「ヘッドアップ」角度でビデオを撮影するのに適した「群衆カウント」モデルを探します: 現在、ほとんどの群衆の写真は地上約 2 メートル (またはそれ以上) であり、下を向いて写真を撮ったり、ビデオ。あるので学校の監視映像など）ですが、数えているシーンは商店街や公園で、カメラは地上約1.7mの位置から撮影し、視点は頭上です。写真の人物の形は、上から見た人の形とは異なります。この撮影角度に適応するモデルを選択または提案する必要があります。

誤認しやすいさまざまなシーンのデータを保証し、誤認を防ぎます。次のシナリオが考えられます。人はカウントされませんが、人はカウントされません

傘、人は特定されるべきであり、特定された傘ではありません. 頭ではなく、それでも人.
人ではなく人の影が人の影として認識され、昼頃になると人に似た強い影が出ることがあります。
冬は暗く、このシーンのデータはありません。冬の暗さ. 11 月と 12 月のほうがはるかに早く暗くなります. それでも、モデルは主に日中の人々の画像でトレーニングされました.
冬の雪: トレーニングデータには雪がありませんでしたが、次のような間違いがあります。

2Dから3Dまでの写真とビデオ、RGBD画像の収集（ただし、カメラはおそらく入手できず、入手するにはかなりの費用がかかります）（中古で200元、中古で500〜3000元）

画像からも判別可能、歩行者属性認識人は男女、年齢は子供、若者、老人、動線を提供する利用者のポートレート、姿勢推定・姿勢推定・このレストランに何人並んでいるかを判断、そして通過する人々を区別します-したがって、このブランチのキューの平均数が30人で、他のブランチが10人である場合、店舗エリアを30人の店舗に拡張する必要があります

他の人はどのように革新しますか？

スケールの変化スケールの変化、同じ写真の異なる位置、人間の頭のサイズは異なります（クローズアップレンズは近く、はるかに小さい）; 別の写真、人間の頭のサイズも異なります

2016_MCNN: 畳み込みニューラルネットワーク、畳み込みカーネルサイズが異なる CNN ネットワークが並列化されてから融合される

2018_CSRNet: (1) Dilated CNNにより入力サイズを縮小せずに受容野を拡大 (2) より深いネットワーク抽出機能を導入 VGG-16

2017_SwitchCNN: 写真のさまざまな場所で群衆の密度が異なることを考慮して、スイッチレイヤーを使用して、各パッチを高、中、低の 3 種類の密度レベルに分割しています。パッチが属する密度レベルに対応するネットワークにパッチを割り当て、写真内の人物の数を数えます

2018_IG_CNN: Switch-CNN のアップグレード版で、人為的に密度レベルを設定するのではなく、モデルレベルを自動的に分割するモデル成長 Growing Network のアイデアを採用しています。プロセスは二分木に似ています

2016_CrowdNet: 並列の 2 つのネットワーク。1 つの Deep Network がレンズに近い顔情報 (高レベルのセマンティック情報) をキャプチャし、1 つの Shallow Network がレンズの特徴から離れた小さな頭のブロブ (低レベル) をキャプチャするために使用されます)

2019_SAANet: (1) 複数の密度マップを合成用の複数のアテンションマスクと組み合わせます (2) 損失関数を最適化し、スケールを考慮した損失を使用して、ネットワークバックボーンの前のレイヤーによって生成された密度マップが小さなヘッドにより多くの注意を払うようにします、およびバックボーンの背後にあるレイヤー生成された密度マップは、大きな頭にもっと注意を払います (3) ジオメトリ適応法を使用して散らばった頭が大きくなりすぎるという問題を解決するために、半径を決定するための 2 つのセットの方法(4) アテンションヘッド (5) アップサンプリングは、アンチプーリングの代わりにバイリニアを使用します。

2017_MSCNN: マルチカラムネットワーク構造は多くの計算を必要とするため、著者はマルチカラム構造を使用せずにマルチスケールフィーチャを同時にキャプチャすることを望んでおり、マルチスケールブロブが使用されています (ネットワークはわかりません)。構造）

2018_SANet: インセプションアーキテクチャと同様のモジュールが使用されます. 各畳み込みモジュールは, 異なるサイズの畳み込みカーネルで複数の畳み込みを並列に実行します. これらの並列畳み込みブロックを使用してマルチスケールの特徴を抽出し, 最後にデコンボリューションによって密度マップを取得します.

2019_AutoScale: 絵の中のインクのにじみすぎている部分を抜き出し、拡大率を自動学習し、その部分を他の部分に近い程度まで拡大して、まとめてカウントする

2019_L2SM: 遠くの密集した群集の写真を拡大します.まず、写真全体の予測密度マップをブロックに分割し、平均密度に従って各ブロックの密度レベルを判断します.高密度ブロックの場合はズームします.密度マップを再計算し、縮小して元に戻します

2019_PGCNet: Use scale- changing gaussian blur+fix kernel conv to evaluate this. カーネルを変更するガウスぼかしは、パースペクティブマップに基づいて決定されます。

2019_DSSINet: (1) CNNの異なる深さのレイヤーには異なる情報が含まれています. 浅い特徴にはより構造化された情報が含まれています. 深い特徴にはより多くの意味情報が含まれています. 2つは補完的です. U-Netは特徴を直接接続する方法です. (2) 条件付きランダムフィールド CRF を使用して、異なるレイヤー間の特徴を融合 (3) SSIM の損失を改善し、Dilation と SSIM を提案損失、すなわち DMS-SSIM

2020_PDANet: (1) ネットワークは、アテンション、ピラミッドスケール機能、および密度を意識した群衆カウント用の 2 つのブランチデコーダモジュールを活用します。(2) 専用の密度認識デコーダー DAD は、異なる画像間の密集レベルの変動に対処します (3) 低密集密度マップと高密集密度マップの合計は、全体的な密度マップを生成するための空間的注意と見なされます

注目のモデルとトランスフォーマーを紹介

2019_SAANet: アテンションヘッドを使用して、バックボーンによって出力された C チャネルの機能マップを 3 チャネル (QKV) 機能マップに変換します

2019_SFANet: (1)U-netの構造を真似、まずVGG16を使ってずっとダウンサンプリング、アップサンプリングを2分岐に分け、1つは注意マップパス、1つは密度マップパス (2)セグメンテーションマスクはグラウンドトゥルースを作るときに使う

2019_ADCrowdNet: 注意を払って複雑な背景の影響を除外し、密度マップ推定ネットワークが群衆エリアに焦点を当てるようにします

2019_CAN: 写真の人間の頭の大きさの違いを表す機能の詳細情報を検出することに注意してください。

2019_RANet: 特徴の融合に自己注意を使用し、特徴マップ上のさまざまな位置にある特徴の加重平均を結合します

2018_DecideNet: 注意を使用

2019_Scale-Aware Attention: グローバルおよびローカルの Attention Network による密な群衆カウント評価に基づく Scale-aware Attention ネットワーク

2019_シンダギ：アテンションネットワークの活用

2018_Kang : 使用注意

2020_PDANet: 注意が使用されます

グラウンドトゥルース/密度マップの作成方法:

2019_SAANet: Far away: アダプティブジオメトリのカウントグラウンドトゥルースの生成。Nearby: 頭部が検出できれば、別途定義された式があります。

2019_SFANet: セグメンテーションのグラウンドトゥルースの生成: 上記のカウントグラウンドトゥルースに対してガウスぼかしが実行されます

2019_PSDDN: (1) 尖った点を直接使用してグラウンドトゥルースを作成する; (2) 最近隣ヘッド距離を使用してボックス形式でグラウンドトゥルースを初期化する; (3) グラウンドトゥルースを更新し、トレーニングプロセス中にグラウンドトゥルースを継続的に最適化する列車を達成する

2019_Content-aware: グラウンドトゥルースを作成する新しい方法を提案する (1) kd ツリーが見つけられない可能性がある問題を補うために、ブルートフォースを使用して最も近いヘッドを見つけ、最近隣までの距離を見つけます。 Nearest (2) Chan-Vese 輪郭成長法による頭の輪郭の決定

2019_Adaptive_density_map: 密度マップの生成プロセスを学習可能にすることで、モデルがトレーニングされるにつれて、密度マップを継続的に微調整して、より合理的な密度マップを生成できます. (1) モジュールを使用して、トレーニングプロセス微調整密度マップ (2) は自己注意モデルを使用して、ポイントアノテーションから密度マップを適応的に生成します

2019_DADNet: MCNN から複数の列のアイデアを取得し、CSRNet から dilated conv のアイデアを取得し、加えて Deformable Conv を取得します

損失関数の設計

一般に、複数の損失関数が一緒に追加されます

2019_SAANet: スケール認識損失スケール知覚損失と MSE 損失

2019_PSDDN：局所的に制約された回帰損失，

2018_ACSCP: 合成損失 1、CSCP 損失

BCE 分類損失、バウンディングボックス回帰損失、BCE 分類損失

2019_DSSINet: SSIM の損失を改善し、拡張と SSIM を組み合わせた拡張マルチスケール構造的類似性損失、つまり DMS-SSIM を提案しました。

2019_S-DCNet: 損失は 2 つの制約を使用します。1 つはクロスエントロピー分類の損失、もう 1 つは予測人数の L1 損失です。

2019_SPANet: (1) ピクセルに対する最大超過、つまり MEP 損失を提案 (2) 残差マップではなく予測密度マップに基づく一連の反復ソリューションを提案

2018_SaCNN: モデルを共同で最適化するために 2 つの損失関数を導入しました。1 つは密度マップ損失で、もう 1 つは相対カウント損失です。

2021年一般化損失関数: 一般化損失関数

その他のモデルの革新:

その他のモデル: Attention と Transformer の導入; GAN の導入, アドバーサルロスを使用した制約による密度マップのぼやけの防止; カリキュラム学習の漸進的学習の導入; 自動エンコーダーモデルをトレーニングするための教師なし手法の導入; 機能を融合するための条件付きランダムフィールドの導入

2018_CSRNet: Dilated Convolution の紹介

2017_Spatiotemporal: 双方向 ConvLSTM モデル

2017_CP-CNN: ピラミッド畳み込みを利用

2018_SANet: Inception アーキテクチャを使用したモジュール

2019_GWTA_CCNN: WTA ベースのオートエンコーダーのアイデアを改良し、GWTA ベースのオートエンコーダー方式を提案しました

2019_AFN: 条件付きランダムフィールド CRF の反復更新メカニズムを使用して、異なるレイヤー間の機能の融合を実現する

2019_Bayesian_loss: ベイズ統計の知識紹介

2015_Liu: ガウス過程に基づくベイジアンモデル

2019_PSDDN: カリキュラム学習が使用されました。

2019_SGANet: Inception-v3 をバックボーンとして使用し、セグメンテーション予測ブランチとカリキュラム学習 (CL) を組み合わせて、単純なものから難しいものまで学習します。

2018_ACSCP: GAN を使用し、アドバーシアルロスを使用して制約します

2017_CP-CNN: 敵対的損失が使用され、敵対的生成ネット (GAN) [8] がユークリッド距離損失関数の欠陥を克服するために使用されます。

カウントを支援するその他のタスク: セグメンテーションの方法の紹介; 検出の方法の紹介; (yolo-v7 などの最新技術を使用)

2019_MANet: カウントに 5 つのセグメンテーションマスクが適用されます

2019_-Focus for free: セグメンテーション、カウティング、分類の 3 つのタスクを統合し、セグメンテーションを使用してクーティングに空間的注意を提供し、分類を使用してカウントにチャネル注意を提供し、最後にカウントの精度を向上させることです。

2017Cascaded-MTL: モデル全体に 2 つのサブタスクがあります 2 つのサブタスク: 1 つは群集カウントの分類で、もう 1 つは密度マップの推定です。

2018DecideNet: 既存の新技術を並行して使用し、検出、回帰法、注意、最後に融合を行う (1) 群集密度が小さい場合は、検出ベースの方法が優れています。(2) 群衆密度が大きい場合は、回帰ベースの方法の効果が高くなります。Quality net は RegNet と DetNet を中間で調整します

2015_Cross-Scene: モデルは 2 つのタスクを同時に実行し、画像ブロック内の群集密度と群集の総数の 2 つの数値を交互に回帰します。モデルは、群衆密度マップ + 総人数を出力します。

2017_Zhao: セマンティックセグメンテーションフレームワーク FCN に基づくカウント

悪い分類:

2021_P2PNet: 密度マップとバウンディングボックスの 2 つの中間ステップを破棄し、頭の位置と確率値を直接予測する

2021_CCTrans: Vision Transformer に基づく; マルチスケールの受容野回帰ヘッド (それが何であるかわからない); 3 つの損失関数を最適化する

2019_MANet: セグメンテーションマスクをカウンティングに適用する 5 つの方法、バックボーンで使用されるスケールアウェアレイヤーを研究し、グラウンドトゥルースを作成する過程でマスクを導入しました。彼は5つの構造を提案し、結果を比較しました

2019_PSDDN: (1) ポイントを使用してグラウンドトゥルースを作成します (2) resnet101 は最後の完全に接続されたレイヤーを削除し (resnet101 は一連の 4 つのブロックです)、Resblock3 と Resblkock4 によって生成された特徴マップを取得し、それを処理してマージします。 (3) 損失関数はさまざまなものを使用します: BCE 分類損失、バウンディングボックス回帰損失 (4) グラウンドトゥルースの更新 (理解できませんでした) (5) カリキュラム学習漸進的な学習、最初は簡単に学習し、次にハードに学習

2019_GWTA_CCNN: Unsupervised + Supervised method, 6-layer ニューラルネットワーク, 最初の 4 層は教師なしメソッドでトレーニングされ、最後の 2 層は教師ありメソッドでトレーニングされます.教師なしメソッドは、WTA に基づくオートエンコーダーのアイデアを改善するためのものです. GWTAに基づく新しい方法を提案するオートエンコーダー法

2018_ACSCP: (1) 生成された密度マップの解像度が低い問題に対して、 U-net 構造を使用して、入力と同じ解像度で密度マップをアップサンプリングします(2) 生成された密度マップのぼやけの問題に対して、逆損失は制約に使用されます (3) 異なる密度領域の予測における不連続性の問題については、クロススケール一貫性制約が採用されます。つまり、異なる密度のパッチによって生成された密度マップを密度と組み合わせる必要があります。画像全体によって生成されたマップが可能な限り一貫していること

2019_PACNN: パースペクティブマップの計算方法、およびパースペクティブマップと密度マップ評価モデルを組み合わせてより良い密度マップを取得する方法を提案

2019_CAN: 異なる受容野を実現するために異なるカーネルサイズの畳み込みカーネルを使用する代わりに、異なるヘッドサイズの情報を機能に反映します。顕著性検出と同様の方法を使用して、特徴内の詳細な情報を注意として検出して特徴を最適化し、最終的にスケール情報を組み込んだコンテキストアウェア特徴を生成します。

2019_RRSP: 2 つの写真の違いを学習して、モデルがより優れた汎化能力を得ることができるようにするため、

2019_S-DCNet: (1) 写真を正方形の断片に切り取り、各断片の人数が 20 人を超える場合は、各パッチの人数が 20 人以下になるまで 4 つの正方形に分割し、その後、各パッチを予測人数、(2)バックボーンとしてのVGG16

2019_CCCNet: 写真に写っている人数を数えるだけでなく、さまざまな姿勢の人が何人いるかを判断するために、たとえば、この記事では、人を立っているか座っているかの 2 つのカテゴリに分類するデータセットを提案しています。

2019_DACC: より良いスタイル転写効果を得るために、スタイル転写の考え方、構造と質感を分離し、構造とテクスチャーを組み合わせて再構築し、合成スタイルを転写した後に通常のカウントトレーニングを行うリアルに

2021_Cross-Modal Collaborative: RGBT マップのヒートマップを群衆カウントにも導入

2018_SaCNN：同じ検出精度を確保しながら、速度が大幅に向上し、ネットワーク構造の複雑さが大幅に軽減されます。(1) 単一列モデル、単一ネットワーク構造、小規模な畳み込みカーネルを使用して、異なる畳み込みカーネルの後続のトレーニング用の固定機能を抽出します (2) マルチスケールレイヤーは同じ低レベルパラメーターと機能表現を共有します。モデルパラメータが大幅に削減されます

2018_Liu: 教師なしメソッドを使用したラベルのないデータセットからの学習

2021_Cross-View Cross-Scene: マルチアングルビューでの写真の融合

2017_Spatiotemporal: 時空間情報と群衆移動情報を考慮した双方向ConvLSTMモデル

2019_シンダギ：トップダウンとボトムアップの機能が異なるスケールの融合、注意メカニズムを含む

2017CP-CNN: Context Pyramid Contex Pyramid Convolutional Neural Network Counting Model. グローバルコンテキスト推定器 (GCE) とローカルコンテキスト推定器 (LCE) は、画像のグローバルコンテキスト情報とローカルコンテキスト情報をそれぞれ抽出し、密度マップ推定器 (DME) は、MCNN のマルチカラムネットワークに従います。構造は高次元の特徴を生成します。融合畳み込みニューラルネットワーク (fusion-CNN、F-CNN) は、最初の 3 つの部分の出力を融合して密度マップを生成します. F-CNN は、一連の分数ステップ畳み込み層を使用して、密度プロットの詳細を再構築します.

2018_ic-CNN: 得られた密度マップを低解像度 (Low Resolution, LR) の密度マップから高解像度 (High Resolution, HR) の密度マップに徐々に絞り込む

技術的困難の挑戦

(1)スケールバリエーション群集スケール(場面変化密度変化)や頭の大きさを含むスケール変化。現在、マルチスケールフィーチャフュージョンとマルチスケール密度マップフュージョンの 2 つの主なソリューションがあります。スケールの変動は、さまざまなレベルのフィーチャまたは密度マップを融合することで、ある程度軽減できます。

(2) 閉塞の問題閉塞。現在のほとんどの研究では、畳み込みニューラルネットワークの強力な特徴抽出および学習機能を利用して、この問題を軽減しています。

(3)人口分布が偏在し、個体分布が偏在し、人口密度分布が大きく異なる。2 つの解決策: 注意メカニズムとパッチベースの処理を使用して、注意メカニズムにより、モデルは混雑したエリアにより多くの注意を向けます。もう 1 つの方法は、入力画像を複数のパッチに分割し、異なるパッチを個別に処理することによって、偏在の問題を軽減することです。

(4)角度変更

(5) その他のデータセットが小さい、背景ノイズが大きい、照度差が大きいなど。

群衆カウントの有用性

これにより、管理者は、旅客の流れのピーク時に人員を増やし、サービス品質を向上させ、売り上げを伸ばし、空き時間に人員を削減して人員の無駄を避けることができます。

さまざまなフロアとさまざまなエリアの乗客の流れの統計を通じて、管理者は各エリアの集客率と混雑度を数えることができ、店舗を合理的に分散させ、売上を伸ばすことができます。

継続的な毎日の乗客の流れの統計を通じて、日、週、月、年の乗客の流れの変化規則を取得できるため、管理者は将来の活動を正確に計画し、時間、人員、および在庫注文量を決定できます。

旅客の流れを比較することにより、開催されたプロモーション活動を効果的に評価し、マーケティングとプロモーションへの投資収益率を効果的に評価します。

旅客流動の統計を通じて、カウンターや店舗のレンタル価格レベルを客観的に判断できます。

現在の旅客流動状況と変化する傾向を表示し、交通量の多い地域での緊急事態を防止するための措置を講じ、現在のモール滞在者数をリアルタイムで監視して、電力、保守担当者、およびセキュリティ担当者を合理的に調整します。等、モールコストの運営管理

オフィス街の人の流れを統計し、どこに出店するか、どこで閉店するか、人が多いのに営業が悪くて回転率が高くない場所を見極める

交通量の多い公園や公衆トイレには、より多くのゴミ箱を配置し、より多くの人が清掃し、より多くのスポーツおよびフィットネス機器、およびより多くの修理リソースを配置する必要があります

公共の安全: 2015 年の上海の外灘でのスタンピードなど、韓国の梨泰院での混雑したスタンピード、人の流れの統計、人の流れがしきい値を超えている、外出するだけで、スタンピードを防ぐために入っていない

新しいクラウンの流行、社会的距離、人が密集することはできません、人の数を数えて密集しているかどうかを判断できます

上海ディズニーランドや北京ユニバーサルスタジオでは、アトラクションごとに30分から1時間の行列ができているが、監視カメラでその瞬間の人数を数えて公式アカウントに載せることができれば、人々は長時間走ることを避けることができるだろうサークル内に非常に多くの人がいることがわかりました/少人数のイベントでより多くの人がプレイできるようにし、多数のプレイヤーが参加するイベントに多くの人が並ぶのを避けることができます

各時間にスーパーマーケットに滞在している人の数を特定する特定の時間 (滞留時間) で店内にいる人の数を見つけ、スーパーマーケット内の各棚の隣に滞在している人の数を特定します。前者と後者の面積を減らす CCTV映像の助けを借りて、小売店内のさまざまなセクション（食料品、飲料など）の人々の数。

群衆の暴動やスタンピードの発生を防ぎ、予期せぬ人々の集まりを早期に警告します

都市計画都市計画

1.公共の安全管理：群衆カウントの最も重要な目的は、公共のビデオ監視に使用し、各シーンの人数をリアルタイムで出力し、密度が高すぎるシーンを時間内に報告して、管理者が対応できるようにすることです。 2014 年末の外灘でのスタンピードの再発を回避するために、時間内にそれらをガイドします。

2. 公共空間の設計: 空港ターミナル、鉄道駅、ショッピングモール、その他の公共の建物などの既存の公共の場所の群衆分析は、群衆の安全性と利便性の観点からシーン設計の重要な欠陥を明らかにすることができます。これらの研究は、公共空間の設計を改善して、安全性をより確実に確保し、人々の移動活動を促進するために使用できます。

3. データの収集と分析: 情報を収集し、さらなる分析と推論を行うために使用できます。たとえば、小売業では、群衆カウントを使用して、店舗内の製品に対する人々の関心を測定し、その情報に基づいて配置する適切な製品を選択できます。同様に、群衆カウントは、待ち時間を最適化するための交通規制のために、さまざまな時間に列に並んでいる人の数を測定するためにも使用できます。

4. 仮想シミュレーション設計: 基礎となる現象を理解するために使用できるため、正確なシミュレーションを提供する数学的モデルを構築できます。これらの数学的モデルは、コンピューターゲーム、映画シーンへの視覚効果の挿入、避難計画の設計など、さまざまなアプリケーションで群衆現象をシミュレートするためにさらに使用できます。

5. その他の視覚タスクの支援: 爆発、銃撃、その他の事故現場などのグループイベントで容疑者と犠牲者を検索します。群衆カウント技術は、顔検出/認識タスクを支援して、これらのタスクをより正確にし、犯罪者をより適切に見つけることができます。

6. その他のビジョンタスクの基礎として: スタジアム、観光名所、ショッピングモール、空港などの場所では、多数の監視カメラが広く配置され、セキュリティと安全の目的で群衆を監視しています。ただし、設計上の制限により、従来のビデオ監視方法では高密度の人混みの状況に対応できません。この場合、行動分析、混雑分析、異常検出、イベント検出などの群集分析関連タスク用に特別に設計されたアルゴリズムを利用できます。