读西瓜书：3.1/3.2/3.3章 - 代码天地

读西瓜书：3.1/3.2/3.3章

其他 2018-10-30 15:36:50 阅读次数: 0

3.1 线性模型

线性模型

$f(x)=w_1x_1+w_2x_2+...+w_dx_d+b \tag{3.1}$

向量形式

$f(x)=w^Tx+b \tag{3.3}$

为什么是线性模型呢？

(补充：PRML 3.1）这里x可以是高阶，重点是w是线性就行了，如果x也是线性那么会给模型带来局限性，此时可以引入基函数 $\phi(x)$ $f(x)=w^T\phi(x)+b \tag{3.2}$

basis function

优点

简单，易于建模，可解释性好

3.2 线性回归

线性回归

给定数据集 $D=\{(x_1,y_1),(x_2,y_2),...,(x_,,y_m)\}$ ，其中 $x_i$ 可以是多维的， $y_i$ 属于实数集.
LR试图学一个线性模型去拟合真实值 $f(x)=wx_i+b$ 使得 $f(x_i)\simeq y_i$
离散属性处理：若有“序”，则连续化；否则，转化为 k 维向量

如何确定参数

度量函数：这里选用均方误差
- $E(f;D)=\frac{1}{m}\sum_{i=1}^m(f(x_i)-y_i)^2\tag{3.4}$
令均方误差最小化，有
- $(w^*,b^*)\\=argmin_{(w,b)}\sum_{i=1}^m(f(x_i)-y_i)^2\\=argmin_{(w,b)}\sum_{i=1}^m(y_i-wx_i-b)^2 \tag{3.5}$
对 $E_{(w,b)}=\sum_{i=1}^m(y_i-wx_i-b)^2$ 进行最小二乘参数估计
- 因为3.5式是凸函数，分别对 w 和 b 求导
- 令导数为0，得闭式解

多元线性回归

如果用以上参数估计法，涉及矩阵求逆
- 若 $X^TX$ 满秩或正定，则 $\hat{x}^*=(X^TX)^{-1}X^Ty$
- 若不满秩，则有多个解，此时需看归纳偏好或引入正则化

线性模型的变化

对数线性归回
- $lny=w^Tx+b \tag{3.6}$
更一般的，考虑单调可微函数 $g(·)$ ， $g(·)$ 称为联系函数，实质是线性回归后映射到另一个函数空间
- $y=g^{-1}(w^Tx+b) \tag{3.7}$

3.3 对数几率回归

极大最后一式等于极小它的负数，因为该式是关于 $\beta$ 高阶可导连续凸函数，所以可以用凸优化理论优化。

总结

线性模型关键是参数是线性的，其中存在两种变化

输入可以变换基
- 比如多项式 ( $x,x^2 ,x^3...x^n$ )
- 这是为了拟合真实数据的变化尺度
- 尺度相当则模型表达会更好
输出可以通过联系函数映射到新的空间
- 特别的，当联系函数为 sigmoid function 时，此时的线性回归称为逻辑回归
- 逻辑回归属于判别式模型，采用极大释然进行参数估计，由此引出交叉熵

（后话）参数一多容易过拟合，但参数多能保证模型的表达能力，此时需要引入正则项，可以等于贝叶斯派中引入的先验。

参考
周志华. 机器学习. 3.1/3.2/3.3.
Bishop. Pattern Recognition And Machine Learning. 3.1.
李宏东. 模式分类（译）. 2.2贝叶斯决策论.

猜你喜欢

转载自blog.csdn.net/u013982164/article/details/82772892

读西瓜书：3.1/3.2/3.3章

读西瓜书：7.1/7.2/7.3章

西瓜书习题3.3

西瓜书初读感想

机器学习(周志华) 西瓜书第三章课后习题3.3—— Python实现

读西瓜书：6.1/6.2/6.3/6.4章【未完成】

西瓜书习题3.3，3.4 Based on TensorFlow

2022.9.19西瓜书3.3对数几率回归编程

离散数学复习——集合3.1、3.2、3.3

西瓜书第1章习题

西瓜书第二章笔记

西瓜书第3章线性模型

西瓜书第5章学习笔记

西瓜书第4章学习笔记

西瓜书第3章学习笔记

西瓜书1、2章学习笔记

《机器学习》（二）——《西瓜书》3章

【超详细！】周志华《机器学习》西瓜书小白Python学习笔记（二）————第三章线性模型（对数几率回归）附课后题3.3详解

机器学习-西瓜书、南瓜书第五章

西瓜书

【Tensorflow与深度学习笔记day04】3. TensorflowIO操作+3.1. 读取数据+3.2. 线程和队列+3.3. 图像操作+线程和队列+队列概述+管道读端多文件内容处理

西瓜书课后习题练习——Ch3.3编程实现对率回归

西瓜书3.3扩展softmax回归及3.6类别不平衡问题

python实现周志华西瓜书《机器学习》习题3.3对数几率回归

西瓜书第四章决策树

西瓜书第一章总结

西瓜书读书笔记（第一章）

西瓜书第3章公式推导三

西瓜书第3章公式推导四

西瓜书第3章公式推导一

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)