昨日暫定何かが学ぶことがなかった
分析例をクラスタリング:
データはまだ2012年に31個の省と自治区に住む都市住民の消費の分布で、地方消費の種類を行うためには、調査データに応じて分割しました。
`read.tableを「= d3.8( "クリップボード"、ヘッダ= T)
d3.8の
プロット(d3.8、GAP = 0)
D = DIST(d3.8、T = DIAG、アッパー= T)
D
予備理解その後、異なるクラスタリング
最短距離法プロット(hclust(D、 '単'))
プロット(hclust(D、 '完了'))ネイバー法の
プロット(hclust(D、 '中央値 ')) 方式、中間距離の
プロットを( hclust(D、 '平均') )の平均類似性
プロット(hclust(D '重心 ')) メソッド重力
プロット(hclust(D 'ward.D '))ward.D 方法
H = hclust(D「病棟.D2 ')
プロット(H)
rect.hclust(H 2)に加えて第2カテゴリーボックス
の2つのカテゴリに分類cutree(H、2)
H = hclust(D' ward.D2「)
プロット(H)
rect.hclust(H 3)は、3つのブロックの追加
の3つのタイプがcutree(H、3)
ので、四つのカテゴリー...
:新しいコンテンツ
法クラスタリングK-手段
関数kmeansクラスタリング方法は、迅速な方法であり、このアルゴリズムの基本的な考え方は、最も近いクラス中心(平均)の各サンプルを割り当てることです。
原理:関数kmeansアルゴリズムパラメータKは、N個のオブジェクトは、k個のクラス、インナー類似度の高いクラス、下位クラスとの間の類似性に分けられます。類似度計算は、平均値の平均クラスオブジェクトに基づいて行われます。
関数kmeans使用法:
関数kmeans(X、センター、...)、データブロックまたはデータ行列X、センタークラスタまたはクラスタ中心の初期数。次には例えば
R 2言語3.8クラスター分析
おすすめ
転載: blog.csdn.net/m0_46445293/article/details/104717153
おすすめ
ランキング