判别域代数界面方程法----线性判别函数

在n维特征空间中,特征矢量x=(x_1,x_2,...,x_n)^T,线性判别函数的一般形式是

式中:w_0=(w_1,w_2,...,w_n)^T称为权矢量或系数矢量。为简洁起见,上式还可以写成

d(x)\overset{\bigtriangleup }{=}w^Tx

式中:x=(x_1,x_2,...,x_n,1)^Tw_0=(w_1,w_2,...,w_n,w_{n+1})^T,其中x称为增广特征矢量,w成为增广权矢量。此时的增广特征矢量的全体称为增广特征空间。

两类问题

设d(x)为判别函数,待识模式增广特征矢量x可以通过下面判别规则进行分类

d(x)=w^Tx\left\{\begin{matrix} >0\Rightarrow x\in \omega _1\\ <0\Rightarrow x\in \omega _2\\ \end{matrix}\right.

等于0时可以任判或拒判。

多类问题

w_i/\bar{w_i}两分法

这方法的基本思想是用判别函数将属于Wi类的与不属于的分开。将问题变成多个两类问题,如果模式是线性可分的,一般需要建立c-1个独立的判别函数,为方便起见可建立c个判别函数

d_i(x)=w_i^Tx (i=1,2,...,c)

通过训练,每个判别函数都会具有下面的性质

d_i(x)\left\{\begin{matrix} >0(x\in w_i)\\ <0(x\notin w_i) \end{matrix}\right.

不难想到,这样划分出来的子区域会有很多的重叠部分,即不确定区,类别越多,不确定区也会越多。因此需要通过多个不等式的联立,才能使判别结果更精确。所以对于c类问题,判决规则

如果\left\{\begin{matrix} d_i(x)>0\\ d_j(x)<0(\forall j \neq i) \end{matrix}\right.,则判x\in w_i

w_i/w_j两分法

基本思想:对c类中的任意两类\omega _iw_j都建立一个判别函数,这两个函数只将两类区分开对其他模式分类是否正确不提供信息。通过训练得到区分两类的判别函数为

d_{ij}(x)=w_{}ij}^Tx (i,j=1,2,...,c; i\neq j)

它具有性质

d_ij(x)=w_{ij}^Tx\left\{\begin{matrix} >0(x\in w_i)\\ <0(x\in w_j) \end{matrix}\right.

d_{ij}=-d_{ji}

显然,d_{ij}(x)的正负并不可以判断出x是属于哪一类,只能判断出x是位于含有w_i类的子区域还是含有w_j类的子区域中,因为在其中一个子区域中还可能含有其他的类域(或一部分)。所以需要通过多个不等式的联立,才能使判别结果更精确,判决规则

没有不确定去区的w_i/w_j两分法

对方法2中的判别函数作下面的处理,令

d_{ij}s=d_i(x)-d_j(j)=(w_i-w_j)^Tx

则对d_{ij}(x)>0等价于d_i(x)>d_j(x),于是对每一类、\omega _i均建立一个判别函数di(x),c类问题就有c个判别函数

d_i(x)=\omega_i^Tx(i=1,2,...,c)

此时的判别规则

如果d_i(x)>d_j(x)(\forall j \neq i)

x \in \omega_i

小结

1.当c>3时,w_i/w_jw_i/\bar{w_i}需要更多的判别函数式,这是一个缺点。

2.但是w_i/\bar{w_i}法是将\omega_i类与其余的c-1类分开,而w_i/w_j法则将\omega_i\omega_j,显然w_i/w_j法使模式更容易线性可分,这是它的有点。

3.方法⑶判别函数的数目和方法⑴相同,但没有不确定区,分析简单,是最常用的一种方法。方法⑶判别函数的数目和方法⑴相同,但没有不确定区,分析简单,是最常用的一种方法。

猜你喜欢

转载自blog.csdn.net/aaalswaaa1/article/details/81701718