Python third-party module machine learning Scikit-Learn module clustering

One.cluster
1. Introduction:

sklearn.cluster是sklearn模块中用于解决聚类问题的子模块

2.Class:

"近邻传播聚类算法"(Affinity Propagation Clustering):class cluster.AffinityPropagation([damping=0.5,max_iter=200,convergence_iter=15,copy=True,preference=None,affinity='euclidean',verbose=False,random_state='warn'])

######################################################################################################################

"凝聚聚类算法"(Agglomerative Clustering):class cluster.AgglomerativeClustering([n_clusters=2,affinity='euclidean',memory=None,connectivity=None,compute_full_tree='auto',linkage='ward',distance_threshold=None,compute_distances=False])

######################################################################################################################

"BIRCH聚类算法"(BIRCH Clustering Algorithm):class cluster.Birch([threshold=0.5,branching_factor=50,n_clusters=3,compute_labels=True,copy=True])

######################################################################################################################

"DBSCAN聚类算法"(DBSCAN Clustering):class cluster.DBSCAN([eps=0.5,min_samples=5,metric='euclidean',metric_params=None,algorithm='auto',leaf_size=30,p=None, n_jobs=None])

######################################################################################################################

凝聚特征:class cluster.FeatureAgglomeration([n_clusters=2,affinity='euclidean',memory=None,connectivity=None,compute_full_tree='auto',linkage='ward',pooling_func=<function mean>,distance_threshold=None,compute_distances=False]])

######################################################################################################################

"K-均值聚类算法"(K-Means Clustering):class cluster.KMeans([n_clusters=8,init='k-means++',n_init=10,max_iter=300,tol=0.0001,precompute_distances='deprecated',verbose=0,random_state=None,copy_x=True,n_jobs='deprecated',algorithm='auto'])

######################################################################################################################

"小批量K-均值聚类算法"(Mini-Batch K-Means Clustering):class cluster.MiniBatchKMeans([n_clusters=8,init='k-means++',max_iter=100,batch_size=100,verbose=0,compute_labels=True,random_state=None,tol=0.0,max_no_improvement=10,init_size=None,n_init=3,reassignment_ratio=0.01])

######################################################################################################################

基于"水平核"(Flat Kernel)"均值漂移聚类算法"(Mean Shift Clustering):class cluster.MeanShift([bandwidth=None,seeds=None,bin_seeding=False,min_bin_freq=1,cluster_all=True,n_jobs=None,max_iter=300])

######################################################################################################################

通过向量数组估计聚类结构:class sklearn.cluster.OPTICS([min_samples=5,max_eps=inf,metric='minkowski',p=2,metric_params=None,cluster_method='xi',eps=None,xi=0.05,predecessor_correction=True,min_cluster_size=None,algorithm='auto',leaf_size=30,n_jobs=None])

######################################################################################################################

"光谱聚类算法"(Spectral Clustering):class cluster.SpectralClustering([n_clusters=8,eigen_solver=None,n_components=None,random_state=None,n_init=10,gamma=1.0,affinity='rbf',n_neighbors=10,eigen_tol=0.0,assign_labels='kmeans',degree=3,coef0=1,kernel_params=None,n_jobs=None,verbose=False])
  #即apply clustering to a projection of the normalized Laplacian

######################################################################################################################

"光谱双聚类算法"(Spectral Biclustering):class sklearn.cluster.SpectralBiclustering([n_clusters=3,method='bistochastic',n_components=6,n_best=3,svd_method='randomized',n_svd_vecs=None,mini_batch=False,init='k-means++',n_init=10,n_jobs='deprecated',random_state=None])

######################################################################################################################

"光谱联合聚类算法"(Spectral Co-Clustering Algorithm):class sklearn.cluster.SpectralCoclustering([n_clusters=3,svd_method='randomized',n_svd_vecs=None,mini_batch=False,init='k-means++',n_init=10,n_jobs='deprecated',random_state=None])

3. Function:

执行近邻传播聚类算法:sklearn.cluster.affinity_propagation(<S>[,preference=None,convergence_iter=15,max_iter=200,damping=0.5,copy=True,verbose=False,return_n_iter=False,random_state='warn'])

######################################################################################################################

执行"DBSCAN提取"(DBSCAN extraction):sklearn.cluster.cluster_optics_dbscan(<reachability>,<core_distances>,<ordering>,<eps>)

######################################################################################################################

通过"Xi-steep method"来提取簇:sklearn.cluster.cluster_optics_xi(<reachability>,<predecessor>,<ordering>,<min_samples>[,min_cluster_size=None,xi=0.05,predecessor_correction=True])

######################################################################################################################

执行"OPTICS算法"(OPTICS Algorithm):sklearn.cluster.compute_optics_graph(<X>,<min_samples>,<max_eps>,<metric>,<p>,<metric_params>,<algorithm>,<leaf_size>,<n_jobs>)

######################################################################################################################

执行"DBSCAN聚类算法"(DBSCAN Clustering):sklearn.cluster.dbscan(<X>[,eps=0.5,min_samples=5,metric='minkowski',metric_params=None,algorithm='auto',leaf_size=30,p=2,sample_weight=None,n_jobs=None])

######################################################################################################################

估计均值漂移算法中使用的"带宽"(Bandwidth):cluster.estimate_bandwidth(<X>[,quantile=0.3,n_samples=None,random_state=0,n_jobs=None])

######################################################################################################################

执行K-均值聚类算法:cluster.k_means(<X>,<n_clusters>[,sample_weight=None,init='k-means++',precompute_distances='deprecated',n_init=10,max_iter=300,verbose=False,tol=1e-4,random_state=None,copy_x=True,n_jobs='deprecated',algorithm="auto",return_n_iter=False])
  #参数说明:
	X:指定数据;<n_samples>×<n_features> array-like/<n_samples>×<n_features> sparse matrix
	n_clusters:指定簇/聚类中心的数量;int
	sample_weight:指定各条数据的权重;1×<n_samples> array-like/None(权重均相等)
	init:指定初始聚类中心;"k-means++"/"random"/<n_clusters>×<n_features> array-like/callable
	precompute_distances:指定是否预计算距离;"auto"/bool
	  #预计算距离将降低计算时间,但会增加内存开销
	n_init:指定算法重复次数(每次均重新初始化聚类中心);int
	  #将返回最好的结果
	max_iter:指定算法的最大迭代次数;int
	verbose:
	tol:
	random_state:
	copy_x:
	n_jobs:
	algorithm:
	return_n_iter:

######################################################################################################################

通过"k-means++算法"(K-Means Plus Plus Algorithm)来选择初始聚类中心:sklearn.cluster.kmeans_plusplus(<X>,<n_clusters>[,x_squared_norms=None,random_state=None,n_local_trials=None])

######################################################################################################################

基于水平核执行均值漂移聚类算法:cluster.mean_shift(<X>[,bandwidth=None,seeds=None,bin_seeding=False,min_bin_freq=1,cluster_all=True,max_iter=300,n_jobs=None])

######################################################################################################################

执行光谱聚类算法:cluster.spectral_clustering(<X>[,bandwidth=None,seeds=None,bin_seeding=False,min_bin_freq=1,cluster_all=True,max_iter=300,n_jobs=None])

######################################################################################################################

基于"特征矩阵"(Feature Matrix)执行"Ward聚类算法"(Ward Clustering):sklearn.cluster.ward_tree(<X>[,connectivity=None,n_clusters=None,return_distance=False])

二.cluster.bicluster

Guess you like

Origin blog.csdn.net/weixin_46131409/article/details/113446743