【机器学习】知否?知否?广义线性模型

点击上方蓝色字体,关注AI小白入门

跟着博主的脚步,每天进步一点点

本文介绍了广义线性模型,其中线性回归、logistic回归,softmax回归同属于广义线性模型。从指数分布家族推导出高斯分布、伯努利分布对应的指数分布家族形式,以最大化期望为目标推导出线性回归、logistic回归,softmax回归的目标函数,进一步强调模型的概率解释性。

作者 | 文杰

编辑 | yuquanle

广义线性模型

从线性回归,logistic回归,softmax回归,最大熵的概率解释来看,我们会发现线性回归是基于高斯分布+最大似然估计的结果,logistic回归是伯努利分布+对数最大似然估计的结果,softmax回归是多项分布+对数最大似然估计的结果,最大熵是基于期望+对数似然估计的结果。前三者可以从广义线性模型角度来看。

A、指数分布家族

指数分布家族是指可以表示为指数形式的概率分布,指数分布的形式如下:


其中 是分布的自然参数, 是充分统计量,通常 . 当参数 都固定的时候,就定义了一个以 为参数的函数族。

实际上大多数的概率分布都属于指数分布家族,比如:

1)伯努利分布  0-1问题

2)二项分布,多项分布  多取值  多次试验

3)泊松分布 计数过程

4)伽马分布与指数分布

5) 分布

6)Dirichlet分布

7)高斯分布

现在我们将高斯分布和伯努利分布用指数分布家族的形式表示:

高斯分布:


对应到指数分布家族有:


伯努利分布:


对应到指数分布家族有:

B、广义线性模

在了解指数分布家族之后,我们再来看广义线性模型的形式定义与假设:

1) 给定样本x与参数 ,样本分类y服从指数分布家族的某个分布。

2)给定一个x,我们目标函数为:

3)

三条假设,第一条是为了能在指数分布范围内讨论y的概率,第二条假设是为了使得预测值服从均值为实际值得一个分布,第三条假设是为了设计的决策函数(模型)是线性的。

由高斯分布的指数家族分布形式与广义线性模型的定义有线性回归的模型为:


同样由伯努利分布的指数家族分布形式与广义线性模型的定义有logistic回归的模型为(解释了为什么是sigmoid函数):


所以,在广义线性模型中,决策函数为线性函数是基于广义线性模型的第三条假设,而最终的模型是依赖于模型服从什么样的分布,比如 高斯分布,伯努利分布。

同样,我们应用logistic回归到softmax回归的一套定义,下面再来看多项分布对应的softmax回归:


其中 是表示 的概率, 是一个指示函数,为真是取值为 ,否则为 采用softmax中向量化的定义。

对应到指数分布家族有:


推出:

为了方便定义 ,由于多项分布所有值取值概率加和为1有:

所以有:

再由广义线性模型的第二条假设,同时将第三条线性假设 带入有:

最后由最大似然估计有softmax的目标函数如下:

到此,广义线性模型解释线性回归,logistic回归,softmax回归基本算完,可以看出线性函数是基于广义线性模型的第三条假设,采用sigmoid函数是因为伯努利分布,而softmax回归是logistic回归高维推广。

The End

方便交流学习,备注: 昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多: 机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等

记得备注呦

往期精彩回顾
新年送福气|您有一份NLP大礼包待领取
【机器学习】对数线性模型之Logistic回归、SoftMax回归和最大熵模型

【机器学习】一文读懂线性回归、岭回归和Lasso回归

长按二维码关注
AI小白入门

ID:StudyForAI

学习AI学习ai(爱)

期待与您的相遇~

你点的每个赞,我都认真当成了喜欢
发布了3363 篇原创文章 · 获赞 36 · 访问量 14万+

猜你喜欢

转载自blog.csdn.net/cpongo9/article/details/103353075