PP:オートエンコーダの混合物に基づく深いクラスタリング

問題:クラスタリング

クラスタリングネットワークは別の空間にデータを変換した後、クラスタのうちの1つを選択します。次に、このクラスタに関連付けられているオートエンコーダは、データポイントを再構成するために使用されます。

はじめに

従来の方法:データは------>各オブジェクトから特徴ベクトルを抽出-------->特徴空間におけるベクトルの集合のグループ。 

クラスタは、オートエンコーダネットワークによって表されます。??どうやって

一般的な方法:K-手段と 点間の距離が高次元空間であまり有益になるので、しかし、高次元のデータセットのために、それはあまり便利です。 

あなたは、パターンのシーケンスを探している場合、それは、高次元の場合のように、時間ディメンションは、クラスタと各パターン、およびいくつかのシーケンスは、それらをクラスタに帰することができないということではありません。

表現の学習は、低次元の特徴空間への入力データをマッピングするために使用されてきました。

試み:教師なし深い学習がクラスタリングにアプローチ適用されます。  ??どうやって

しかし、低次元の特徴空間を介してクラスタ上で最も注目。 

より多くのクラスタリングにやさしい表現にデータを変換します:

K-手段の深いバージョンは、データ表現を学習し、埋め込まれたスペースのk手段を適用することに基づいています。

 

クラスタを表現する方法: 

オートエンコーダネットワークVSベクトル。

データ崩壊問題:各データベースのクラッシュのデータは、もう一度プログラムを再調整する必要があります。

 

多変量時系列のために、どのようなパターンを見つけるために。 

1.検索パターン:SAX。TICC; スライド窓。导数

2. VG、統計機能。

3。   

補足知識: 

1.パターン認識とクラスタリング

パターン認識は、カテゴリ、またはクラスへの未知のパターンの割り当てのための十分に確立された技術とコンピュータサイエンスの成熟した分野です。パターンを測定、と呼ばれるいくつかの数のベクトルとして定義される機能通常、パターン認識システムの用途は、未知のパターンのための決定ルールを形成することが知られているカテゴリからサンプルを訓練未知のパターンが決定ルールに従ってカテゴリのいずれかに割り当てられています。私たちは、ユーザが割り当てられている文書のクラスに興味があるので、私たちは、ユーザーのカテゴリに以前に目に見えない文書を分類しようとするパターン認識技術を使用することができます。パターン認識技術は、カテゴリの数とラベルが知られている必要がありますが、 クラスタリング  技術は、カテゴリの外部知識を必要としない教師なしています。クラスタリング方法は、単にそのメンバー他のクラスタのメンバーに比べて(ある距離尺度に従って)互いにより類似しているクラスタにグループ同様のパターンに試みます。特定のグループに属している、あるいはどのように多くのグループが適切であるパターンの事前知識は全くありません。例えば[などの基本的なパターン認識とクラスタリングのテキストを参照して5、  6、  7 ]さらなる情報について。 

私たちのドキュメントの生の特徴をクラスタリングに焦点を当て、その後、分類のための機能を見つけようとする文書の最初の採用パターン認識技術。

 

おすすめ

転載: www.cnblogs.com/dulun/p/12309740.html