1.分类问题:
从训练样本中学习,构建一个函数(分类器),对样本的所属类别进行判别
典型的分类问题:
1.垃圾邮件识别
2.文本分类
3.信用评分
4.欺诈检测
5.图像识别
6.用户流失预测
7.营销响应预测
8.广告点击率预估
9.商品推荐
2.聚类问题:
从数据中探索样本之间的相似性,把特征相似的样本聚为一类,是一种无目标的探索性分析
典型的聚类问题:
1.用户分群
2.相似文档聚类
3.回归问题:
从训练样本中学习,构建一个函数,对样本的目标变量进行估值
典型的回归问题:
1.房价预测
2.收入预测
4.关联问题:
从交易型数据中发现频繁关联出现的Item(商品),又称为购物篮分析
典型的关联问题:
1.商品买了还买
2.电影看了还看
3.商品推荐
5.序列问题:
从顺序型数据中发现序列模式,例如9个月前买了PC的用户,下一个月可能会买一根内存
典型的序列问题:
1.购物模式预测
2.网站点击模式预测
3.中文分词
4.DNA序列分析
6.异常检测问题:
检测样本取值是否显著偏离常规,发现有意义的孤立点和异常值
典型的异常检测问题:
1.信用卡欺诈行为检测
2.网络安全检测
3.不合格产品检测