数据挖掘理论与算法

第一章 技术简介
分类:基于规则进行划分;
聚类:没有以前的规则,将同类型的放置到一块;
关联:两件物品之间必须有关联才能进行挖掘;
回归:我们说的线性回归指的是参数和变量有线性的关系;
注意:同一份数据从不同的角度看,可以发现不同的结果。

第二章
1、数据预处理
2、异常值与重复数据检测
在这里插入图片描述
3、类型转换和采样
连续性
离散性
文本数据
为了保证等机会的事务具有相信的地位,在编码的时候我们建议每个事务占用一个维度,例如,如果有三个小球,我们编码的时候我们可以设置成三维的,如果有四个小球的话我们可以设置成四维的,但是当小球很多的时候,这种方式相对来说已经不够适用了

猜你喜欢

转载自blog.csdn.net/weixin_43797885/article/details/89059368
今日推荐