李宏毅机器学习——结构化学习(二)

其他 2020-03-22 09:53:36 阅读次数: 0

引言

在结构化学习(一)中，我们讲了结构化学习需要解决三个问题。本文就探讨如何解决这三个问题。

线性模型

在这里插入图片描述

我们先来想下，哪个问题最难？

假如 $F(x,y)$ 有某种特别的形式，并且我们知道它的形式，那第三个问题就很容易解了。

所以我们先来看下这个特别的形式是怎样的。

问题1

假设我们说这个形式必须是线性的。
在这里插入图片描述

给定一个 $x,y$ 对，首先我们用一组特征来描述它们。上图中的 $\phi_1,\phi_2,\phi_3$ 分别代表一个特征(标量)。

然后我们说 $F(x,y)$ 定义成：

在这里插入图片描述

可以整理一下，把它们用两个向量点乘表示：

在这里插入图片描述
假如 $F(x,y)$ 写成这样，那么问题3就不是一个问题。

这样讲很抽象，我们用一个例子来说明一下。以目标检测为例。

在这里插入图片描述

$x$ 是图像，而 $y$ 是边框。我们要定义 $\phi$ ，把 $x,y$ 代进去要得到一个向量。

在这里插入图片描述
那这个向量要怎么定义呢，可以随意定。比如用该向量里的某个维度是红色像素点在框框里面出现的百分比；绿色像素点在框框里面出现的百分比；或者是红色的在框框外的百分比；或者是框框的大小；

其实上面定义的很弱，可能无法正确识别。比较常用的是通过视觉单词(visual word)，就是上图中类似正方形的小方块。

这里有人提了个问题，上面我们说的这些特征是需要人工标注呢还是通过模型自己抽取。

这里可以用模型自己抽取的，比如可以训练一个CNN，通过这个CNN输出一个向量，该向量能很好的代表边框里面的东西。
在这里插入图片描述

如果我们想做摘要生成。

在这里插入图片描述

我们也可以先自己定义一些特征，比如 $y$ 里面有没有包含"import"这个单词；或者$y$里面有没有包含"definition"这个单词；或者 $y$ 的长度；
也可以用DNN来抽取特征；

好了，现在第一个问题定义好了，接下来看下第二个问题。

问题2

在这里插入图片描述
如果解上面这个问题？

我们从问题1的定义可以把 $F(x,y)$ 写成 $w \cdot \phi(x,y)$

在这里插入图片描述

我们一样需要穷举所有的 $y$ ，看哪个 $y$ 能让这个值最大。

这里我们假设已经解决了这个问题。

问题3

现在有很多带标签的训练数据

在这里插入图片描述

希望 $F(x,y)= w \cdot \phi(x,y)$ 的 $w$ 。如上图，对所有的训练数据，我们希望正确的 $w \cdot \phi(x^r,\hat y^r)$ 要大于所有错误的 $w \cdot \phi(x^r,y)$ 。

此时所得到的 $w$ 就是我们想要的。那么要怎么做呢

假设现在要做的是目标检测，我们收集了一张图片 $x^1$ ，我们知道 $x^1$ 对应的边框 $\hat y^1$ 的大小和位置；同样的 $x^2$ 也一样。

在这里插入图片描述

假设 $x^1$ 和 $\hat y^1$ (正确的边框)所形成的特征是红色的点。这里假设特征只有2维，为了能画到平面上。其他的 $y$ 和 $x^1$ 所形成的特征是蓝色的点。

在这里插入图片描述

我们把这些点画出来。红色的点只有一个，而蓝色的点有很多个。

在这里插入图片描述
因为这里还有 $x^2$ ,我们说 $x^2$ 与 $\hat y^2$ 形成的是红色的星星，其他是蓝色的星星。注意 $x^1,x^2$ 看以看成是独立的。

在这里插入图片描述

我们接下来要做的事情是，希望找到一个向量 $w$ ，然后我们上面的红色样本与蓝色样本点与这个 $w$ 做内积，希望得到的结果是，红色的星星所得到的内积结果是星星中最大的；红色的点所得到的内积结果是点中最大的。

在这里插入图片描述

注意这里我们不能用点与星星比较，因为它们属于不用的图像。

那找 $w$ 这个问题难解决吗？其实没有想象的那么难。具体怎么做呢

这里有一个算法：
在这里插入图片描述

翻译过来就是：

首先初始化 $w =0$
- do
  - 每个训练样本 $(x^r,\hat y^r)$
    - 找到使得 $w \cdot \phi(x^r,y)$ 最大的 $\overset{\sim}y^r$
      - $\overset{\sim}y^r = \arg \,\max_{y \in Y} w\cdot \phi(x^r,y)$ (问题2)
    - 如果 $\overset{\sim}y^r \neq \hat y^r$ ，更新 $w$
      - $w \rightarrow w +\phi(x^r,\hat y^r) -\phi(x^r,\overset{\sim}y^r)$
- unil $w$ 不再更新

do里面是循环，直到util的条件满足。

如果我们要找的 $w$ 存在，这个算法最终会停止。

我们用个例子来说明下这个算法吧。还是以上面的目标检测为例。

首先看下这些点代表什么意思
在这里插入图片描述

然后初始化 $w = 0$

在这里插入图片描述

然后随便选取一个训练数据(现在共有2份数据)，假设选的是圈圈(点)。这些点的分布是上图这样的。

然后需要根据现在的 $w$ 去看哪个它所形成的特征 $\phi(x^1,y)$ 与 $w$ 做内积后得到的值最大。但是现在因为 $w=0$ ，所以结果都是 $0$ ，我们此时先随机选一个 $y$ 。

在这里插入图片描述
假设我们选的是红点下面的那个蓝点(感觉这个算法有个bug，必须限制第一次不能选择红点，否则算法直接结束了)。

此时我们选出的 $\overset{\sim}y^1$ 与 $\hat y$ 不一样，我们需要调整 $w$ 。

根据下面这个式子调整:

$w \rightarrow w +\phi(x^1,\hat y^1) -\phi(x^1,\overset{\sim}y^1)$

在这里插入图片描述

此时我们找到了一个 $w$ ，接下来再选一个训练数据。

在这里插入图片描述

此时也一样，需要穷举所有的 $y$ ，使得那个式子最大，注意此时 $w$ 不是 $0$ 了。

在这里插入图片描述
然后我们找到了最大的星星。但是还是和真正的最大的星星不是同一个，因此，继续更新 $w$ 。

在这里插入图片描述
上式中的 $\phi$ 项相减得到了一个绿色的向量。

再加上原来的 $w$ 得到了一个新的 $w$ 。

在这里插入图片描述

接下来我们回到训练数据 $x^1$

在这里插入图片描述
发现用这个新的 $w$ 去计算内积，得到的 $\overset{\sim}y^1$ 就是 $\hat y^1$ ，也就不需要更新 $w$ 了，对这份数据来说。但是还不一定适合数据 $x^2$ 。所以还要继续。

继续选 $x^2$ 。

在这里插入图片描述
假设此时发现选出的 $y$ 也是 $\hat y$ ，因此就不需要更新 $w$ 了。

此时，整个算法结束。找出了想要的 $w$ 。

参考

李宏毅机器学习

愤怒的可乐

发布了148 篇原创文章 · 获赞 57 · 访问量 13万+

私信关注

猜你喜欢

转载自blog.csdn.net/yjw123456/article/details/104855705

李宏毅机器学习——结构化学习(二)

李宏毅机器学习——结构化学习(一)

李宏毅机器学习——结构化支持向量机

机器学习：李宏毅深度强化学习笔记（二）Q-Learning

强化学习--李宏毅

李宏毅机器学习——无监督学习(二)

李宏毅机器学习-学习笔记

李宏毅机器学习——迁移学习

李宏毅机器学习——集成学习

【机器学习（李宏毅）】二、Regression: Case Study

李宏毅机器学习——循环神经网络(二)

李宏毅2020机器学习课程笔记（二）

台大李宏毅机器学习课程

机器学习-台大李宏毅

【ML】李宏毅机器学习笔记

李宏毅机器学习笔记

机器学习-Regression速记(李宏毅)

李宏毅机器学习笔记（4）

李宏毅机器学习笔记（3）

李宏毅机器学习笔记（2）

李宏毅机器学习笔记（1）

机器学习-简介速记(李宏毅)

李宏毅机器学习笔记(5)

李宏毅机器学习课程

梯度下降_机器学习-李宏毅

李宏毅机器学习笔记(9)

李宏毅机器学习笔记(8)

李宏毅机器学习笔记(7)

李宏毅机器学习笔记(19)

李宏毅机器学习笔记(18)

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)