0. 前言

无监督学习通常采用聚类算法（clustering algorithm）对其分门别类，通常成为“簇”（cluster）。常见的聚类算法有 K-means（K-均值），初始作如下定义：

1. K-means的算法流程

K-means主要由簇分配和移动聚类中心两部分组成，是一种迭代的算法，2个簇的流程可如下描述：

用伪代码，可作如下描述：

优化目标函数（代价函数）如下定义：

$\large J(c^{(1)},...,c^{(m)},\mu_{1},...,\mu_{k})=\frac{1}{m}\sum_{i=1}^{m}\left\|x^{(i)}-\mu_{c^{(i)}}\right\|^2$

很明显，代价函数表示的是，所有样本与各自属于的簇中心的欧式距离的平方和再取平均。

注：K-means聚类算法有时候会陷入局部最优解。

如下图所示（图源：吴恩达机器学习），就是一个局部最优的例子：

为避免局部最优，可在上述伪代码外再嵌套一层循环，每次确定簇中心之后计算代价函数，多次迭代之后，选择代价函数最小的一组结果。此方法适合 $K$ 值较小（小于10）的情况。

簇的数量的选择，通常有两种方法，均要求 $K< m$ ：

如果这篇文章对你有一点小小的帮助，请给个关注喔~我会非常开心的~