異常検出: データの深層の背後にある謎を探る (パート 1)
1. 異常検出とは何ですか?
外れ値検出 は、その名前が示すように、通常のデータとは異なるデータや、予想される動作と大きく異なるデータを識別することです。
少数のイベントを対象として、クレジット カード詐欺、工業生産の異常、ネットワーク フローの異常 (ネットワーク侵入) などの問題を特定します。
1.1 例外のカテゴリー
点異常とは、正常な人々や患者の健康指標など、異常な少数の個別のインスタンスを指しますが、ほとんどの個別のインスタンスは正常です。
状況異常(コンテキスト異常とも呼ばれます) は、特定の状況では異常で、他の状況では正常である個々のインスタンスを指します。たとえば、特定の時間に温度が突然上昇または低下します。特定のシナリオでは、高速クレジット カードの場合取引;
グループの異常とは、グループ コレクション内の個々のインスタンスが異常であり、個々のインスタンス自体は異常ではない可能性がある状況を指します。侵入や不正行為の検出などのアプリケーションでは、外れ値ポイントは複数のデータ ポイントのシーケンスに対応します。単一のデータポイント。たとえば、ソーシャル ネットワーク内の偽のアカウントによって形成されたセットは、グループの異常なサブセットとして機能しますが、サブセット内の個々のノードは本物のアカウントと同じように正常である可能性があります。
1.2 異常検知タスクの分類
教師あり: トレーニング セット内の正の例と負の例の両方にラベルが付けられます
教師なし: トレーニング セットにはラベルがありません
半監視型