基于约束的频繁模式挖掘

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/weixin_37726222/article/details/85222261

7.3.1 关联规则的元规则制导挖掘

元规则的作用是什么?

元规则使得用户可以说明他们感兴趣的规则的语法形式。规则的形式可以作为约束,帮助提高
挖掘的性能。也是说,它挖掘一种规则的形式(或者说,属性的组合模式而不是这种组合本身。)

那么如何使用元规则指导挖掘过程呢?

首先元规则的模板:
P1&&P2&&…Pl=>Q1&&Q2&&…Qr
所以元规则的谓词的总数是(l+r),为了找出满足这个模板的维间关联规则:需要注意下面两点:

  1. 需要找出所有的频繁p-谓词集 Lp。
  2. 还需要Lp中的l-谓词集的支持度计数,方便计算Lp导出的规则的置信度。

7.3.2 在挖掘期间对搜索空间剪枝的办法是?

  • 模式搜索空间剪枝
  • 数据搜索空间剪枝

模式空间剪枝约束

  1. 单调的
  2. 反单调的
  3. 简洁的约束
  4. 可转变的约束
  5. 不可转变的约束

什么是反单调的模式剪枝约束?

如果一个项集不满足该规则约束,那么它的任何超集也不满足该规则约束。
eg:
min(J.price)>=50,一旦存在一个项集中有小于50的价格,那么它的所有超集都不满则
这个约束了。

count(I)<=10 等等都是如此。

数据空间剪枝约束

策略是什么?

减掉对其后挖掘过程中可满足模式的产生没有贡献的数据片段。

两个性质:

  1. 数据的简洁性
  2. 数据的反单调性

什么是数据的反单调性?

在挖掘过程中,如果基于当前模式,一个数据项不满足数据反单调性约束,则可以减掉它。
我们剪掉它,因为在剩下的挖掘过程中,它不能对当前模式的超模式的产生有任何形式的贡献。
因此,我们说,数据反单调性对搜索空间剪枝仅限于基于模式增长的挖掘算法。

猜你喜欢

转载自blog.csdn.net/weixin_37726222/article/details/85222261