聊一聊粗糙集(二)

之前,我们简要地介绍了粗糙集,我将继续更新粗糙集相关的概念


等价类与等价关系

首先,我们先入为主地了解下等价类的定义吧,以下定义来自维基百科。
在数学上,假设在一个集合\(X\)上定义一个等价关系(用\(\sim\)来表示),则\(X\)中的某个元素\(a\)的等价类就是\(X\)中等价于\(a\)的所有元素所形成的子集:
\[ [a]=\{x\in X|x \sim a \} \]

还是举几个例子吧

如果说\(X\)是汽车的集合,\(\sim\)是汽车颜色相同的等价类,则一个特定等价类由所有的绿色汽车组成。\(X/ \sim\)自然被认为所有汽车颜色的集合

考虑到整数集合Z上的 “模2” 等价关系,\(x\sim y\)当且仅当\(x-y\)是偶数。这个关系精确地引发两个等价类:\([0]\)由所有的偶数组成,\([1]\)由所有的奇数组成。在这种关系下,\([7]\)\([9]\)\([1]\)都表示\(Z/\sim\)的同一个元素。

在简要了解等价类这个概念后,下面我们将给出粗糙集中的等价类和等价关系:
\(S=(U,A=C\cup D,V,f)\)是决策信息系统,\(\forall B\subseteq C\),论域\(U\)的不可分辨关系被定义为:
\[ R_B=\{(x,y)\in U\times U|f(x,a)=f(y,a),\forall a\in B \} \]

很显然,不可分辨关系是一种等价关系。它将论域U划分为\(U/R_{B}\)\(U/R_{B}=\{E_{1},E_{2},...,E_{m}\}\)是由等价关系\(R_{B}\)形成的等价类集合。由等价关系\(R_{B}\)形成的等价类\([x]_{B}=\{y|(x,y)\in R_{B}\}\)是粗糙集理论中的基本知识粒。

我们还是以病人病历为例。

病人 头疼 肌肉疼 体温 流感
\(e_{1}\) 正常
\(e_{2}\)
\(e_{3}\) 很高
\(e_{4}\) 正常
\(e_{5}\)
\(e_{6}\) 很高



设论域\(U=\{e_{1},e_{2},e_{3},e_{4},e_{5},e_{6}\}\),条件属性\(C=\{C_{1},C_{2},C_{3}\}\),决策属性\(D=\{d\}\)
\(C_{1}\)为头疼,\(C_{2}\)为肌肉疼,\(C_{3}\)为体温,有三个条件属性。

先来看头疼这个条件属性\(C_{1}\),它的值域只有两个:“是”和“否”。
\[ U/\{ C_{1} \}=\{\{e_{1},e_{2},e_{3} \},\{e_{4},e_{5},e_{6} \}\}=\{\{是 \},\{否 \}\} \]

\[ \{e_{1},e_{2},e_{3}\}为“是” \]

\[ \{e_{4},e_{5},e_{6}\}为“否” \]
\(C_{1}\)为论域\(U\)上一个知识

再看肌肉疼这个条件属性\(C_{2}\),它的值域只有两个:“是”和“否”。
\[ U /\{ C_{1} \}=\{\{e_{1},e_{2},e_{3},e_{4},e_{6} \},\{e_{5} \}\}=\{\{是 \},\{否 \}\} \]

\[ \{e_{1},e_{2},e_{3},e_{4},e_{6} \}为“是” \]

\[ \{e_{5} \}为“否” \]

\(C_{2}\)为论域\(U\)上一个知识

最后看看体温这个条件属性\(C_{3}\),它的值域有三个:“正常”,“高”和“很高”。
\[ U/\{C_{3} \}=\{\{e_{1},e_{4} \},\{e_{2},e_{5} \},\{e_{3}, e_{6} \} \}=\{\{正常 \},\{高 \},\{很高 \}\} \]

\[ \{e_{1},e_{4} \}为“正常” \]

\[ \{e_{2},e_{5} \}为“高” \]

\[ \{e_{3},e_{6} \}为“很高” \]
\(C_{3}\)为论域\(U\)上一个知识

决策属性当然便是流感\(d\),它的值域有两个:“是”和“否”。
\[ U/d=\{X_{1},X_{2} \} \]

\[ X_{1}=\{ e_{1},e_{4},e_{5} \}为“否” \]

\[ X_{2}=\{ e_{2},e_{3},e_{6} \}为“是” \]
至此,等价类和等价类关系暂时介绍到这里了。


精确集和粗糙集

还是结合病人病历为例:

以体温\(C_{3}\)这个条件属性为例
\[ U/C_{3}=\{ \{ e_{1},e_{4} \},\{e_{2},e_{5} \},\{e_{3},e_{6} \} \}=\{X_{1},X_{2},X_{3} \} \]
如果\(X=\{ e_{1},e_{2},e_{4},e_{5} \}\)

那么\(X=X_{1}\cup X_{2}=\{e_{1},e_{4} \} \cup \{e_{2},e_{5} \}\)

\(X\)可以由已有的\(X_{1},X_{2},X_{3}\)中的若干个\(\{X_{1},X_{2}\}\)组成,因此\(X\)\(C_{3}\)精确集

如果\(X=\{e_{1},e_{2},e_{4} \}\)

\(X=\{e_{1},e_{4} \}\cup \{e_{2} \}\)

此时,\(X\)不能用\(X_{1}\)\(X_{2}\)\(X_{3}\)中的任何一个或者若干个组合构成,那么\(X\)\(C_{3}\)粗糙集


本文内容暂时到这里结束了,之后将会介绍上近似,下近似等等概念。

本文参考了:

  • 景运革. 基于知识粒度的动态属性约简算法研究[D].西南交通大学,2017.

猜你喜欢

转载自www.cnblogs.com/Gedanke/p/12357042.html