【主色提取】模糊C均值(FCM )聚类算法和彩色图像快速模糊C均值( CIQFCM )聚类算法

系列文章目录


第一章 主色提取入门之FCM 和 CIQFCM


目录

系列文章目录

前言

一、FCM 聚类算法

1 基本思想

​编辑

 2 FCM 的缺陷

二、CIQFCM 聚类算法

1 集群空间映射

1.1 基本思想

 1.2 压缩聚类样本

2 初始类中心的确定方法

3 采样CIQFCM聚类算法

总结



前言

主色提取技术在伪装设计、伪装评估、图像分割、图像混合、图像检索、遥感图像分析、医学图像分析等领域有着广泛的应用。由Dunn 于1973年提出的FCM聚类算法由于其较高的聚类精度和相对广泛的适用性,而CIQFCM 就是 FCM 算法的改进。


一、FCM 聚类算法

1 基本思想

FCM聚类算法的基本思想就是将n个样本xi(i=1,2,,n),划分为c个模糊簇,找个每个簇的聚类中心。最小化目标函数为:

其中,m > 1是一个可以控制聚类结果模糊程度的常数,Jm是目标函数。

是样本xk到第i个聚类中心vi的距离,μik是k个样本对第i个类别的隶属度函数,这就要求样本对每个聚类的隶属度之和为1,如式(2 )所示。

 

为实现最小Jm,根据公式更新隶属度μik和聚类中心vi。( 3 )和( 4 ) .更新μik时,根据dik是否为0,有两种情况需要讨论:

 

 

用b表示迭代次数,令μibk值为: 

FCM 聚类算法的步骤如下:

 2 FCM 的缺陷

FCM聚类算法是一种迭代随机爬山算法,其中有两个问题需要解决。一种是如果初始类中心选择不正确,聚类效果会变差或者无法收敛到最优解。二是过多的聚类样本会导致聚类计算量显著增加

具体来讲,FCM聚类算法认为每个样本属于不同的类别,具有一定的隶属度。这种模糊处理方法保留了更多关于样本之间相互联系的信息,并且由于数据样本分布的重叠性,特别适合于主色提取。但是在FCM聚类算法的每次迭代中,需要计算所有像素对每个聚类中心的隶属度U和新的聚类中心V,其中计算U和V的运算次数均为n* c,因此FCM算法的复杂度为O( n* c* b)。对于大尺寸的图像,计算的复杂度会很高。

二、CIQFCM 聚类算法

CIQFCM 聚类算法可以快速提取背景图像的主导颜色,它是基于FCM的基础上加了一个叫量化间隔的东西,它的改进就是在量化颜色时做了一个小的改动---压缩样本量。

整个流程可以分为三步:首先,将聚类样本空间从图像像素映射到量化颜色空间,并采用多种方法压缩聚类样本量。然后,采用改进的谱系聚类算法获得初始类中心。最后,采用CIQFCM聚类算法快速提取背景图像的主导颜色。

1 集群空间映射

1.1 基本思想

聚类空间映射的目的是将聚类样本从图像像素映射到量化的颜色空间,从而在尽可能保留原始信息的同时减少聚类样本的数量。颜色的量化有多种方法,CIELAB颜色空间所能以坐标失真度最小为目标,采用等比例量化方法,将3个坐标L、a、b用一个称为量化区间的变量进行压缩。例如,设量化间隔为5,则将3个坐标L、a、b分别划分为nL=100 / 5、na=240 / 5、nb=240 / 5级。此时有Nc= nL *na* nb= 46080个量化颜色,少了125倍。对于每个等级,其中间颜色值用来表示该等级的颜色。

  设P是图像中像素的样本集,设C为量化后的颜色矩阵,定义集合P到集合C的映射关系M为:

 

其中,Np为图像中的像素个数;P在C上的统计NP表示每个量化后对应的像素个数。

 其中,Np为集合P中元素的个数,即图像中像素的个数;Nc为集合C中元素的个数,即量化颜色的个数。

就如下图所示:

 1.2 压缩聚类样本

当量化间隔设置为5时,量化颜色数为46080,仍然是一个很大的数量。随着量化间隔的进一步减小,样本数量会更大。

所以要对聚类样本进行压缩,图像中出现的颜色通常不会覆盖整个颜色空间。因此,在每次坐标量化时,只考虑图像中出现的颜色。

方法分为两步,第一步,求取L、a、b的最大值和最小值,设置颜色量化的坐标范围;第二步,在完成NP统计后,从颜色空间中移除统计量为0的元素,进一步减少样本数据量。

2 初始类中心的确定方法

为保证聚类效果和效率,采用谱系聚类算法初始化类中心。在映射后的聚类空间上进行谱系聚类的思想与传统谱系聚类基本一致, 两者的区别在于,在合并距离最小的类别后计算新的类中心时,需要使用统计量NP对颜色进行加权,如式( 11 )所示。

其中,vk是合并后第k类的中心;Nk为第k类的样本数;Ci表示类别中第i个样本的颜色值;NPi表示第i个样本颜色对应的图像像素个数。

3 采样CIQFCM聚类算法

CIQFCM聚类算法将映射后的颜色值作为聚类样本,这样就可以大大减少样本的数量。其基本原理是改写目标函数Jm的计算公式。

以上三个式子中,b为迭代次数,m为聚类控制参数,c为聚类类别数。u ik(b)为第k个样本对第i个类别的模糊隶属度,dik是第k个样本到第i个聚类中心的距离,也是CIE 94色差公式计算出的ck和v i之间的色差。

CIQFCM聚类算法的具体步骤如图所示:


总结

(1) 映射后压缩聚类样本的方法对CIQFCM算法效率的提高具有重要意义。

(2) CIQFCM算法与PFCM聚类算法相比具有良好的聚类效果。

(3)CIQFCM算法可以提高聚类效率,并且随着图像尺寸的增大,其优势更加明显。

对于CIQFCM算法,在FCM聚类之前需要进行聚类空间映射,因此CIQFCM算法在应用于小尺寸图像时优势并不明显。

CIQFCM算法可以快速提取大尺寸图像的主色,可应用于迷彩涂装设计、图像色调分析和图像分割等领域。

猜你喜欢

转载自blog.csdn.net/m0_51816252/article/details/128240864