机器学习8——异常检测、推荐算法

异常检测

非监督学习,对于已知样本集,提取其中小部分样本 特征与其他大部分样本相差很大的,与聚类类似,不过异常样本多数不能重特征数归为一个类

当样本特征分布近似拟合高斯分布时,其两边分布较少的样本即可视为异常样本

对于异常检测算法检查,可以借鉴监督学习的二分类问题,将异常值作为负类进行分类

推荐系统

基于内容的推荐系统,对内容进行特征提取(人为),基于不同商品的不同特征及用户喜欢程度,对不同的用户建立分类模型,可以得到用户的喜欢参数模型:根据已有内容特征,监督学习,提取用户特征。

基于用户的协调推荐算法,当商品内容及用户的特征数据都没有时(商品特征提取困难),首先对用户进行聚类,基于内容(不是内容特征)进行相似度聚类,得到不同用户群组,对不同用户群组进行标签标记(标签不唯一,不一定表示实际特征),在用户特征提取完毕后,再基于用户特征及用户对内容的喜爱程度对商品尽心特征其他:根据商品、用户关系,无监督学习,对用户聚类,提取用户特征;对已标记特征的用户,监督学习,提取内容特征。根据内容特征,修正用户特征,根据用户特征,修正内容特征,迭代优化。

猜你喜欢

转载自blog.csdn.net/nominior/article/details/88244181