机器学习笔记一 - 代码天地

机器学习笔记一

其他 2018-05-26 09:35:25 阅读次数: 0

协同滤波：

项目向量：特征

用户向量：对对应的项目特征的偏好程度

二者点乘并相加。两个向量都应该有一个偏置项，充分考虑不同用户，不同项目之间的差异。比如，用户有可能是消极的，也有可能是积极的。

项目向量和用户向量可以作为给项目和用户分类的依据。

挑战：新用户和新项目不太好处理，未知的太多

决策树：选取最优特征是很重要的一步。选取的标准有信息增益（表示了某特征使得数据集D的分类不确定性减少的程度），信息增益比（归一化），基尼指数，分别对应于ID3,C4.5,CART树。它可以看成一个条件概率分布，它会使数据集的纯度越来越高。

信息增益的偏好是属性取值有很多种的特征，所以引入了信息增益比。

挑选特征A，且该特征有两个取值时，

扫描二维码关注公众号，回复： 1037513 查看本文章

决策树划分在三种情况下，终止划分：

1、该结点只包含一类（纯度已经100%），

2、特征集为空，说明决策树已经把所有的特征都用上了，输出类别是比例最大的那一类。

3、某个划分的子集为空，此时说明没有取该特征对应的某一取值。

当然，为了防止过拟合，还可以加一个划分终止条件：信息增益小于某一阈值时。

剪枝也是很重要的一步操作，它是一种动态规划问题，主要是防止过拟合，需要借用验证数据集。决策树只考虑信息增益，而剪枝优化的是损失函数（考虑到了模型复杂度）。

现在很流行的CART树是基于基尼指数来进行。要注意的是，它除了可以解决分类问题，还可以解决回归问题，此时每个结点对应一个固定值（可以用平方误差最小原则求解每个结点的最优值）

猜你喜欢

转载自blog.csdn.net/melody96313/article/details/80346769

机器学习笔记一

机器学习笔记（一）

机器学习学习笔记（一）

机器学习笔记一：关于机器学习

机器学习笔记(一)初识机器学习

机器学习笔记（一）-了解机器学习

机器学习笔记一：概述

机器学习基础笔记一

机器学习笔记一：导论

周志华机器学习笔记（一）

Python机器学习笔记一

机器学习笔记一：简介

《机器学习实战》笔记（一）

机器学习入门笔记一

机器学习实战笔记（一）

《机器学习实战笔记》（一）

机器学习课程笔记一

google机器学习笔记（一）

白面机器学习笔记（一）

机器学习课程笔记（一）

机器学习学习笔记（一）机器学习导学

《机器学习》学习笔记（一）——机器学习概述

《机器学习》学习笔记一杂谈

《机器学习及实践》学习笔记（一）

《机器学习（周）》学习笔记（一、二）

机器学习一：绪论（学习笔记）

机器学习入门笔记（一）-学习计划

百面机器学习学习笔记（一）

《机器学习Python实践》学习笔记（一）

机器学习实战——学习笔记(一)

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)