【主色提取】模糊C均值(FCM )聚类算法和彩色图像快速模糊C均值( CIQFCM )聚类算法

系列文章目录

第一章主色提取入门之FCM 和 CIQFCM

系列文章目录

前言

主色提取技术在伪装设计、伪装评估、图像分割、图像混合、图像检索、遥感图像分析、医学图像分析等领域有着广泛的应用。由Dunn 于1973年提出的FCM聚类算法由于其较高的聚类精度和相对广泛的适用性，而CIQFCM 就是 FCM 算法的改进。

一、FCM 聚类算法

1 基本思想

FCM聚类算法的基本思想就是将n个样本xi（i=1，2，，n）,划分为c个模糊簇，找个每个簇的聚类中心。最小化目标函数为：

其中，m > 1是一个可以控制聚类结果模糊程度的常数，Jm是目标函数。

是样本xk到第i个聚类中心vi的距离，μik是k个样本对第i个类别的隶属度函数，这就要求样本对每个聚类的隶属度之和为1，如式(2 )所示。

为实现最小Jm，根据公式更新隶属度μik和聚类中心vi。( 3 )和( 4 ) .更新μik时，根据dik是否为0，有两种情况需要讨论：

用b表示迭代次数，令μibk值为：

FCM 聚类算法的步骤如下：

2 FCM 的缺陷

FCM聚类算法是一种迭代随机爬山算法，其中有两个问题需要解决。一种是如果初始类中心选择不正确，聚类效果会变差或者无法收敛到最优解。二是过多的聚类样本会导致聚类计算量显著增加。

具体来讲，FCM聚类算法认为每个样本属于不同的类别，具有一定的隶属度。这种模糊处理方法保留了更多关于样本之间相互联系的信息，并且由于数据样本分布的重叠性，特别适合于主色提取。但是在FCM聚类算法的每次迭代中，需要计算所有像素对每个聚类中心的隶属度U和新的聚类中心V，其中计算U和V的运算次数均为n* c，因此FCM算法的复杂度为O( n* c* b)。对于大尺寸的图像，计算的复杂度会很高。

二、CIQFCM 聚类算法

CIQFCM 聚类算法可以快速提取背景图像的主导颜色，它是基于FCM的基础上加了一个叫量化间隔的东西，它的改进就是在量化颜色时做了一个小的改动---压缩样本量。

整个流程可以分为三步：首先，将聚类样本空间从图像像素映射到量化颜色空间，并采用多种方法压缩聚类样本量。然后，采用改进的谱系聚类算法获得初始类中心。最后，采用CIQFCM聚类算法快速提取背景图像的主导颜色。

1 集群空间映射

1.1 基本思想

聚类空间映射的目的是将聚类样本从图像像素映射到量化的颜色空间，从而在尽可能保留原始信息的同时减少聚类样本的数量。颜色的量化有多种方法，CIELAB颜色空间所能以坐标失真度最小为目标，采用等比例量化方法，将3个坐标L、a、b用一个称为量化区间的变量进行压缩。例如，设量化间隔为5，则将3个坐标L、a、b分别划分为nL=100 / 5、na=240 / 5、nb=240 / 5级。此时有Nc= nL *na* nb= 46080个量化颜色，少了125倍。对于每个等级，其中间颜色值用来表示该等级的颜色。

设P是图像中像素的样本集，设C为量化后的颜色矩阵，定义集合P到集合C的映射关系M为：