关联规则分析-apriori

í一、概念

1、支持度support:数据集中A、B同时出现的频率,即 P(AB) = Freq(AB) / N

2、置信度confidence:在A出现的条件下,B出现的频率,即 置信度P(A->B) = Freq(AB) / Freq(A) 

3、提升度lift:left = 支持度(AB) / 支持度(A) * 支持度(B)

      注:提升度反应了关联规则中的A与B的相关性,提升都>1 且越高表明正相关性越高,提升度<1且越低表明负相关性越高,提升度=1表明没有相关性。

例如:A和B的关联规则的支持度是0.2,A出现的支持度是0.3,B出现的支持度是0.5,则提升度是 1.33>1,表明 ”A -> B“ 规则对于B的出现有提升效果

4、频繁项集:满足最小支持度要求的项集。

5、关联规则:表示两个物品之间,存在很强的关系

6、性质:

    a、如果某个项集是频繁的,那么它的所有子集也是频繁的

    b、如果某个项集是非频繁的,那么它的所有超集也是非频繁的

    c、Apriori算法从单元素项集开始,通过满足最小支持度的项集来形成更大的集合

猜你喜欢

转载自www.cnblogs.com/stacey999999/p/12073603.html