机器学习关联规则分析 - 代码天地

机器学习关联规则分析

其他 2021-03-21 15:24:30 阅读次数: 0

一.概述
1.概念:

"关联规则分析"(Association Analysis)是指发现存在于数据集中的关联性,从而描述1个事物中某些属性间的规律

2.相关概念:

下表是某超市的部分交易记录(TID为交易号,Items为交易的商品):

PID	Items
001	Cola,Egg,Ham
002	Cola,Diaper,Beer
003	Cola,Diaper,Beer,Ham
004	Diaper,Beer

通过分析该数据集,可找出关联规则,如 ${Cola\}→\{Diaper\}$ 表示购买了Diaper的顾客很可能会购买Beer.下面是1些常用概念

概念	说明
事务	每条记录称为1个事务，例如上表包含了4个事务
项	交易的每个物品称为1个项，如Diaper、Beer等
项集	包含0或多个项的集合称为项集，如｛Beer,Diaper｝、｛Beer,Cola,Ham｝
k-项集	包含k个项的项集叫作"k-项集"，例如｛Cola,Beer,Ham｝叫作3-项集
支持度计数	一个项集出现在几个事务当中，它的支持度计数就是几。例如｛Diaper,Beer｝出现在事务002/003/004中，故其支持度计数为3
支持度	支持度计数除于总的事务数。例如，上例中总的事务数为 4，｛Diaper,Beer｝的支持度计数为 3，所以对｛Diaper,Beer｝的支持度为75%，这说明有75%的人同时买了Diaper和Beer
频繁项集	支持度大于或等于某个阈值的项集就叫作频繁项集。例如阈值为50%时，因为｛Diaper,Beer｝的支持度为75%，故其是频繁项集
前件和后件	对于规则{A}→{B},｛A｝称为前件，｛E｝称为后件
置信度	对于规则｛A}→{B｝，它的置信度为｛A,B｝的支持度计数除以｛A｝的支持度计数。例如，规则｛Diaper｝→｛Beer｝的置信度为3/3，即100%，这说明买了Diaper的人也买了Beer
强关联规则	大于或等于最小支持度阈值和最小置信度阈值的规则叫作强关联规则。通常意义上说的关联规则都是指强关联规则。关联分析的最终目标就是要找出强关联规则
闭项集	如果项集X的直接超集都不具有和它相同的支持度计数，则X是闭项集
频繁闭项集	如果项集X是闭的，并且它的支持度大于或等于最小支持度阈值，则X是频繁闭项集
最大频繁项集	如果项集X是频繁项集，并且它的直接超集都不是频繁的，则X为最大频繁项集

3.步骤:

①发现频繁项集
②发现强关联规则

4.常见算法:
在这里插入图片描述
二.Apriori算法

猜你喜欢

转载自blog.csdn.net/weixin_46131409/article/details/113807201

机器学习关联规则分析

机器学习——关联规则

机器学习——聚类分析——关联规则（K-means算法）

Python机器学习&数据分析-关联规则

机器学习—关联规则分析之Apriori算法

机器学习_关联规则算法

机器学习系列文章：Apriori关联规则分析算法原理分析与代码实现

机器学习（七）探寻模式——基于关联规则的购物篮分析

【机器学习】采用关联规则算法分析蔬菜涨跌规律实验（Apriori算法）

机器学习——关联规则的挖掘问题

机器学习----Apriori算法（关联规则）

机器学习 —— 关联规则Apriori算法及实现

[机器学习笔记] 常用关联规则算法

机器学习算法--关联分析

[机器学习算法]关联分析

深度学习驱动的犯罪模式分析：关联规则挖掘的应用

【机器学习算法】关联规则-3 关联规则的指标问题和关联规则的使用方法

机器学习实战---读书笔记：第11章使用Apriori算法进行关联分析---2---从频繁项集中挖掘关联规则

机器学习典型应用1--关联规则

Python机器学习 — 关联规则（Apriori、FP-growth）

机器学习-非监督分类算法之关联规则

【机器学习】关联规则Apriori和mlxtend——推荐算法

白话机器学习算法之关联规则

机器学习算法 - 频繁项集和关联规则思想

【机器学习算法】关联规则2 FPgrowth法算法

【机器学习算法】关联规则-1 关联规则的概念，Apriori算法，实例和优缺点

【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析

关联规则算法Apriori的学习与SQL简单实现购物篮分析

《Python数据分析与挖掘实战》第八章学习-关联规则Apriori

python数据分析：关联规则学习（Association rule learning）

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)