广义线性模型 - 代码天地

广义线性模型

其他 2019-03-14 07:51:14 阅读次数: 0

今天我来介绍一种在机器学习中应用的比较多的模型，叫做广义线性模型（GLM）。这种模型是把自变量的线性预测

函数当作因变量的估计值。在机器学习中，有很多模型都是基于广义线性模型的，比如传统的线性回归模型，最大熵

模型，Logistic回归，softmax回归，等等。今天主要来学习如何来针对某类型的分布建立相应的广义线性模型。

Contents

1. 广义线性模型的认识

2. 常见概率分布的认识

1. 广义线性模型的认识

首先，广义线性模型是基于指数分布族的，而指数分布族的原型如下

其中为自然参数，它可能是一个向量，而叫做充分统计量，也可能是一个向量，通常来说。

实际上线性最小二乘回归和Logistic回归都是广义线性模型的一个特例。当随机变量服从高斯分布，那么

得到的是线性最小二乘回归，当随机变量服从伯努利分布，则得到的是Logistic回归。

那么如何根据指数分布族来构建广义线性模型呢？首先以如下三个假设为基础

（1）给定特征属性和参数后，的条件概率服从指数分布族，即。

（2）预测的期望，即计算。

（3）与之间是线性的，即。

在讲解利用广义线性模型推导最小二乘和Logistic回归之前，先来认识一些常见的分布，这是后面的基础。

2. 常见概率分布的认识

（1）高斯分布

关于高斯分布的内容我就不再多讲了，如果把它看成指数分布族，那么有

对比一下指数分布族，可以发现

所以高斯分布实际上也是属于指数分布族，线性最小二乘就是基于高斯分布的。

（2）伯努利分布

伯努利分布又叫做两点分布或者0-1分布，是一个离散型概率分布，若伯努利实验成功，则伯努利随机变

量取值为1，如果失败，则伯努利随机变量取值为0。并记成功的概率为，那么失败的概率就是，

所以得到其概率密度函数为

如果把伯努利分布写成指数分布族，形式如下

对比指数分布族，有

Logistic回归就是基于伯努利分布的，之前的Sigmoid函数，现在我们就可以知道它是如何来的了。如下

如果

那么叫做正则响应函数，而叫做正则关联函数。

（3）泊松分布

泊松分布是一种离散型概率分布，其随机变量只能取非负整数值0，1，2，... 且其概率密度函数为

其中参数是泊松分布的均值，也是泊松分布的方差，表示单位时间内随机事件的平均发生率。在实际

的实例中，近似服从泊松分布的事件有：某电话交换台收到的呼叫，某个网站的点击量，来到某个公共

汽车站的乘客，某放射性物质发射出的粒子，显微镜下某区域内的白血球等计数问题。

泊松分布的内容：http://zh.wikipedia.org/wiki/%E6%B3%8A%E6%9D%BE%E5%88%86%E4%BD%88

关于概率论中的分布主要介绍这几个，其中还有很多分布都属于指数分布族，比如伽马分布，指数分布，多

元高斯分布，Beta分布，Dirichlet分布，Wishart分布等等。根据这些分布的概率密度函数可以建立相

应的模型，这些都是广义线性模型的一个实例。

转自http://blog.csdn.net/acdreamers/article/details/44663091

猜你喜欢

转载自blog.csdn.net/u010807669/article/details/51988244

广义线性模型

广义线性模型（GLM）

广义线性模型介绍

广义线性模型的理解

线性模型（二）广义线性模型

线性模型选择与广义线性模型

广义线性模型解读必看文章

机器学习之广义线性模型

广义线性模型（GLMs）及算法介绍

数据学习(2)·广义线性模型

广义线性模型（Generalized Linear Models）

ML—广义线性模型导论

详解广义线性模型的来龙去脉

从线性到非线性模型-广义线性模型

机器学习——线性回归到广义线性模型

机器模型简介（二）：广义线性模型

广义线性模型------逻辑回归和softmax回归

转 R 广义线性模型1 自变量：Logistic

【sklearn第八讲】广义线性模型

(五)xgboost中拟合广义线性模型

机器学习之广义线性模型（一）

广义线性模型与指数分布簇

广义线性模型(Generalized Linear Model)——机器学习

广义线性模型与指数分布族

广义线性模型与指数分布族的理解

python 机器学习 sklearn 广义线性模型

广义线性模型定价模块（PYTHON3.5+)

机器学习数学原理（2）——广义线性模型

CS299笔记：广义线性模型

【机器学习】知否？知否？广义线性模型

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)