基于Apriori算法的交互挖掘算法伪代码

频繁模式的交互挖掘

        给定数据库 DB,假定最小支持度阈值为 s,经过一次挖掘后,得到数据库 DB 中的频繁模式集 FP。当用户对挖掘结果感到不满意时,会改变最小支持度阈 值再次进行挖掘,假设新的最小支持度阈值为 s′,新的频繁模式集为 FP′。

        频繁模式的交互挖掘,就是通过已获得的频繁模式集 FP 和更新后的最小支 持度阈值 s′,按照与原来相同的数据库高效发现新的频繁模式集 FP′问题。注意 由于最小支持度阈值的改变,即使数据库没有变化,DB 中在 s 下的频繁模式未 必是 s′下的频繁模式,另一方面,原来在 s 下不频繁的模式,有可能成为 s′下的 频繁模式。概况地说,最小支持度阈值的改变会有三种情况:

1. s′ > s,一些最初的频繁模式可能会成为不频繁的,即 FP′⊆FP;

2. s′ = s,频繁模式没有发生变化,即 FP′ = FP;

3. s′ < s,一些最初不频繁的模式可能会成为频繁的,即 FP⊆FP′。

        前两种情况下,频繁模式的更新比较简单直接。因为 FP′⊆FP 且 FP 已知, 所以直接从 FP 中选择那些支持度不小于 s′的模式,就构成新的结果 FP′。第三种 情况下,由于原来不频繁的模式可能会变成频繁的,即 FP⊆FP′,需要重新扫描 数据库获取新的模式频度信息,导致挖掘过程比较复杂。

伪代码

猜你喜欢

转载自blog.csdn.net/weixin_48419914/article/details/121343910