ML之Apriori:利用关联规则挖掘技术的Apriori算法实对用户推荐现购物网站更多感兴趣产品应用案例

ML之Apriori:利用关联规则挖掘技术的Apriori算法实对用户推荐现购物网站更多感兴趣产品应用案例

目录

利用关联规则挖掘技术的Apriori算法实对用户推荐现购物网站更多感兴趣产品应用案例

# 1、定义数据集

# 2、数据预处理

# 2.1、特征编码

# 3、模型训练与推理

# 3.1、使用Apriori算法挖掘频繁项集

# 3.2、根据频繁项集生成关联规则

# 3.3、根据置信度排序并打印前5条规则


相关文章
ML之Apriori:利用关联规则挖掘技术的Apriori算法实对用户推荐现购物网站更多感兴趣产品应用案例
ML之Apriori:利用关联规则挖掘技术的Apriori算法实对用户推荐现购物网站更多感兴趣产品应用案例实现代码

利用关联规则挖掘技术的Apriori算法实对用户推荐现购物网站更多感兴趣产品应用案例

# 1、定义数据集

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7 entries, 0 to 6
Data columns (total 4 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   A       7 non-null      object
 1   B       7 non-null      object
 2   C       7 non-null      object
 3   E       3 non-null      object
dtypes: object(4)
memory usage: 352.0+ bytes
None
   A  B  C    E
0  B  C  E  NaN
1  A  B  D  NaN
2  A  D  E  NaN
3  A  C  E    E
4  B  C  D  NaN
5  B  D  E    E
6  A  C  D    E

# 2、数据预处理

# 2.1、特征编码

# 3、模型训练与推理

# 3.1、使用Apriori算法挖掘频繁项集

frequent_itemsets 
      support              itemsets
0   0.571429                 (A_A)
1   0.428571                 (A_B)
2   0.142857                 (B_B)
3   0.571429                 (B_C)
4   0.285714                 (B_D)
5   0.428571                 (C_D)
6   0.571429                 (C_E)
7   0.428571                 (E_E)
8   0.142857            (B_B, A_A)
9   0.285714            (B_C, A_A)
10  0.142857            (A_A, B_D)
11  0.285714            (A_A, C_D)
12  0.285714            (A_A, C_E)
13  0.285714            (E_E, A_A)
14  0.285714            (A_B, B_C)
15  0.142857            (A_B, B_D)
16  0.142857            (A_B, C_D)
17  0.285714            (A_B, C_E)
18  0.142857            (A_B, E_E)
19  0.142857            (B_B, C_D)
20  0.285714            (B_C, C_D)
21  0.285714            (B_C, C_E)
22  0.285714            (E_E, B_C)
23  0.285714            (B_D, C_E)
24  0.142857            (E_E, B_D)
25  0.142857            (E_E, C_D)
26  0.285714            (E_E, C_E)
27  0.142857       (B_B, A_A, C_D)
28  0.142857       (B_C, A_A, C_D)
29  0.142857       (B_C, A_A, C_E)
30  0.285714       (E_E, B_C, A_A)
31  0.142857       (A_A, C_E, B_D)
32  0.142857       (E_E, A_A, C_D)
33  0.142857       (E_E, A_A, C_E)
34  0.142857       (A_B, B_C, C_D)
35  0.142857       (A_B, B_C, C_E)
36  0.142857       (A_B, B_D, C_E)
37  0.142857       (A_B, E_E, B_D)
38  0.142857       (A_B, E_E, C_E)
39  0.142857       (E_E, B_C, C_D)
40  0.142857       (E_E, B_C, C_E)
41  0.142857       (E_E, B_D, C_E)
42  0.142857  (E_E, B_C, A_A, C_D)
43  0.142857  (E_E, B_C, A_A, C_E)
44  0.142857  (A_B, E_E, B_D, C_E)

# 3.2、根据频繁项集生成关联规则

rules 
     antecedents      consequents  ...  leverage  conviction
0         (B_B)            (A_A)  ...  0.061224         inf
1         (A_A)            (B_B)  ...  0.061224    1.142857
2         (A_A)            (C_D)  ...  0.040816    1.142857
3         (C_D)            (A_A)  ...  0.040816    1.285714
4         (E_E)            (A_A)  ...  0.040816    1.285714
..          ...              ...  ...       ...         ...
125  (B_D, C_E)       (A_B, E_E)  ...  0.102041    1.714286
126       (A_B)  (E_E, B_D, C_E)  ...  0.081633    1.285714
127       (E_E)  (A_B, B_D, C_E)  ...  0.081633    1.285714
128       (B_D)  (A_B, E_E, C_E)  ...  0.102041    1.714286
129       (C_E)  (A_B, E_E, B_D)  ...  0.061224    1.142857

# 3.3、根据置信度排序并打印前5条规则

    antecedents consequents  antecedent support  ...  lift  leverage  conviction
65   (E_E, A_B)       (B_D)            0.142857  ...  3.50  0.102041         inf
59   (B_D, A_B)       (C_E)            0.142857  ...  1.75  0.061224         inf
122  (E_E, A_B)  (B_D, C_E)            0.142857  ...  3.50  0.102041         inf
32   (E_E, B_C)       (A_A)            0.285714  ...  1.75  0.122449         inf
33   (E_E, A_A)       (B_C)            0.285714  ...  1.75  0.122449         inf

[5 rows x 9 columns]

猜你喜欢

转载自blog.csdn.net/qq_41185868/article/details/129779037