数据挖掘最常见的六大任务和问题

1.分类问题:

从训练样本中学习,构建一个函数(分类器),对样本的所属类别进行判别

典型的分类问题:

1.垃圾邮件识别

2.文本分类

3.信用评分

4.欺诈检测

5.图像识别

6.用户流失预测

7.营销响应预测

8.广告点击率预估

9.商品推荐

2.聚类问题:

从数据中探索样本之间的相似性,把特征相似的样本聚为一类,是一种无目标的探索性分析

典型的聚类问题:
1.用户分群
2.相似文档聚类

3.回归问题:

从训练样本中学习,构建一个函数,对样本的目标变量进行估值


典型的回归问题:
1.房价预测
2.收入预测

4.关联问题:

从交易型数据中发现频繁关联出现的Item(商品),又称为购物篮分析


典型的关联问题:
1.商品买了还买
2.电影看了还看
3.商品推荐

5.序列问题:
从顺序型数据中发现序列模式,例如9个月前买了PC的用户,下一个月可能会买一根内存


典型的序列问题:
1.购物模式预测
2.网站点击模式预测
3.中文分词
4.DNA序列分析

6.异常检测问题:

检测样本取值是否显著偏离常规,发现有意义的孤立点和异常值


典型的异常检测问题:
1.信用卡欺诈行为检测
2.网络安全检测
3.不合格产品检测

发布了26 篇原创文章 · 获赞 35 · 访问量 735

猜你喜欢

转载自blog.csdn.net/csdnliu123/article/details/105588984
今日推荐