学习笔记(70):第二章：海量数据的处理与挖掘-关联规则挖掘01 - 代码天地

学习笔记(70):第二章：海量数据的处理与挖掘-关联规则挖掘01

编程语言 2020-02-27 09:00:31 阅读次数: 0

立即学习:https://edu.csdn.net/course/play/26303/334278?utm_source=blogtoedu

1. 数据挖掘是一项从大量的记录数据中提取有价值、人们感兴趣的只是，这些只是是隐含的、事先未知的有用信息，提取的知识一般可表示为概念(concepts)、规则(rules)、规律(regular ides)、模式(patterns)等形式

其中：

规则：海量数据中样本与样本之间的关联性

模式：通过特征X，经过函数f得到结构y

2. 关联规则：发现数据中的规律

* 超市中什么产品回忆起购买(组合推荐)

* 顾客在买了一台PC之后下一步会购买(搭配推荐)

* 哪种DNA对这种药物敏感(统计学运用)

3. 关联规则基本概念

* 每一个数据样本称为项目

* 例如一个顾客购买商品的购物车称为项目的组合即事务

* 事务中有意义的项目集合叫做项集，比如面包和牛奶，这就是二项集，我们要挖掘的就是项集

* 1000个人购物，1000个购物单，牛奶在购物单中出现的次数叫支持度

* 当支持度高到一定程度，才会观测出有意义的信息和规则，设定一个阈值

* 项集A在事务数据库D中出现的次数占D中总事务的百分比叫做项集的支持度。如果项集的支持度超过用户给定的最小支持度阈值，就称该项集是频繁项集(或频集)

4. 事务数据库中X和Y同时存在的百分比s%称为支持度；信任度表示出现X的基础上再出现Y的概率，即条件概率

果儿_wj

发布了73 篇原创文章 · 获赞 3 · 访问量 722

私信关注

猜你喜欢

转载自blog.csdn.net/wj1408421029/article/details/104529417

学习笔记(70):第二章：海量数据的处理与挖掘-关联规则挖掘01

学习笔记(68):第二章：海量数据的处理与挖掘-Hive在数据统计分析中持久化应用01...

《数据挖掘概念与技术》学习笔记-第二章

学习笔记(66):第二章：海量数据的处理与挖掘-Map Reduce思想变换数据key-value_03

学习笔记(67):第二章：海量数据的处理与挖掘-Map Reduce思想变换数据key-value_05

数据挖掘学习笔记-第二章数据预处理

数据仓库与数据挖掘学习笔记第二章联机分析处理

数据挖掘导论笔记1——第二章：数据

数据挖掘概念与分析第二章笔记

【数据挖掘】关联规则挖掘

【数据挖掘与商务智能决策】第二章特征工程与数据预处理

数据挖掘习题选做--第二章

Python数据分析与挖掘实战——第二章

数据挖掘导论课后习题答案-第二章

数据挖掘读书笔记--第二章：认识数据

机器学习与数据挖掘-作业二-第二章模型评估与选择

关联规则数据挖掘

数据挖掘-关联规则模型简要笔记

数据挖掘之挖掘大型数据库中的关联规则学习笔记

【机器学习】数据挖掘算法——关联规则（二），挖掘过程，Aprioir算法

【数据挖掘学习笔记】11.频繁模式挖掘进阶与关联规则

浅谈数据挖掘中的关联规则挖掘

数据挖掘算法——关联规则挖掘

2021-10-12 数据挖掘-实用机器学习工具与技术》—— 学习笔记第二章输入：概念、实例和属性

数据挖掘day18、19-《数据挖掘导论》-第一章，第二章

数据挖掘之关联规则

网络数据挖掘---关联规则

机器学习与数据挖掘学习笔记（5）关联挖掘

《Python数据分析与挖掘实战》第八章学习-关联规则Apriori

《python数据分析与挖掘实战》第二章 python数据分析简介

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)