TensorFlow 学习（五）二分类logistic回归模型 - 代码天地

TensorFlow 学习（五）二分类logistic回归模型

其他 2018-11-25 10:50:56 阅读次数: 0

逻辑回归的损失函数是对数损失函数，对数损失函数的方程式与信息论中的熵测量密切相关。它也是似然函数的负对数（假设“y‘ ’” 属于伯努利分布）。实际上，最大限度地降低损失函数的值会生成最大的似然估计值。对数损失函数的方程式如下图

$Log Loss = \sum_{(x,y)\in D} -ylog(y') - (1 - y)log(1 - y')$

其中：

(x,y)ϵD 是包含很多有标签样本 (x,y) 的数据集。
“ y ” 是有标签样本中的标签。由于这是逻辑回归，因此 “y” 的每个值必须是 0 或 1。
“ y' ” 是对于特征集“x”的预测值（介于 0 和 1 之间）

假设预测函数 hypothesis 在 0 和 1 之间 (概率）：

$h_w\left(x;w,b\right ) = \frac{1}{1 + e^{-(w^ T x + b)}}$

其中：

$h_w\left(x;w,b\right )$ 是逻辑回归模型针对特定样本的输出。
是 b + w1x1 + w2x2 + … wNxN
- “w” 值是该模型学习的权重
- “b” 值是该模型学习的偏差。
- “x” 值是特定样本的特征值。

请注意，该假设函数也称为对数几率

假设函数推理过程：

假设函数 $h_w\left(x;w,b\right ) = p$ ，服从伯努利分布，为正的概率为 p, 为负的概率为 1 - p.

逻辑回归中该样本为正的概率 $h_w\left(x;w,b\right )$ 为负的概率 $1 -h_w\left(x;w,b\right )$

odds优势比是事件发生概率和不发生概率之间的比值:

$odds = \frac{p}{1 - p}$

我们可以将［0，1］之间的任意数映射到[0,∞]之间的任意实数。但是，线性回归的输出还可以是负数，我们还需要另一步变换将[0,∞]的实数域映射到这个实数域R空间；

然后，在众多非线性函数中，log函数的值域为整个实数域且单调，因此，我们可以计算优势比的对数(ln 是log 底数为 e的数):

$\eta = ln(odds) = ln(\frac{p}{1 - p}) =w^ T x + b$

求解过程, $\eta=w^ T x + b$ ，取消 ln底数

$\frac{p}{1 - p} = e ^ \eta$

然后消除分子 p, 两边加 1

$\frac{p+1-p}{1-p} = e ^ \eta + 1$

$\frac{1}{1-p} = e ^ \eta + 1$

由上面可得

为负的概率： $1 - p =\frac{1}{e ^ \eta + 1}$

为正的概率： $p =\frac{e^\eta}{e ^ \eta + 1}$

需要的是为正的概率，分子分母同除以 ${e^\eta}$ , 化简可得：

$p = \frac{1}{1+e^{-\eta}}$

而 $\eta = w ^T x + b$ 所以最终假设样本为正的概率为：

$h_w\left(x;w,b\right )= p = \frac{1}{1+e^{-(w^{T} x+b)}}$

极大对数似然推理（逻辑回归（0和1分类））：

假设有 M 个样本，样本值分别为 $y_1,y_2,y_3,...y_m$ ，设 $p_i = P(y_i = 1| x_i)$ 为给定条件下得到 $y_i = 1$ 的概率，

同样地， $y_i = 0$ 的概率为 $P(y_i = 0 | x_i) = 1 - p_i$ ，所以得到一个样本值的概率为 $P(y_i) = p_i ^ {y_i} (1-p_i)^ {1-y_i}$ ,

注意，大写p（没有下标 i）: 是函数形式，小写p（有小标 i）：是一个值（概率）

则取对数似然依据

运用对数运算和差 $\log_{e} MN = log_{e}M + log_{e}N$ , $\log_eN^{m}$ = $m \log_eN$

$ln(P(y_i))=\sum_{i = 1}^{m}ln(p_i^{y_i} (1-p_i)^{1-y_i})$

$=\sum_{i = 1}^{m}ln(p_i^{y_i}) + ln ((1-p_i)^{1-y_i})$

$= \sum_{i = 1}^{m}y_i ln(p_i) + (1 - y_i)ln(1-p_i)$

当模型是条件概率分布，损失函数是对数损失函数时，经验风险最小化就等价于极大似然估计。所以加个负号

$logloss = \sum_{i = 1}^{m}-y_i ln(p_i) - (1 - y_i)ln(1-p_i)$

又根据 p(即 $p_i$ ) 上面的公式 $p =\frac{e^\eta}{e ^ \eta + 1}$ ， $1 - p =\frac{1}{e ^ \eta + 1}$

$\sum_{i = 1}^{m}-y_i ln(p_i) - (1 - y_i)ln(1-p_i)$

由于该极大似然函数无法直接求解，一般是进行梯度下降来不断接近最优解。

梯度下降有三种方式：

批梯度下降: 会获得全局最优解，缺点是在更新每个参数的时候需要遍历所有的数据，计算量会很大，并且会有很多的冗余计算，导致的结果是当数据量大的时候，每个参数的更新都会很慢。
随机梯度下降: 以高方差频繁更新，优点是使得随机梯度会跳到新的和潜在更好的局部最优解，缺点是使得收敛到局部最优解的过程更加的复杂。
小批量梯度下降: 结合了随机梯度下降和批梯度下降的优势，每次梯度更新的时候使用n个样本。减少了参数更新的次数，可以达到更加稳定收敛结果。(深度学习一般使用该方法优化）

TensorFlow 简单实现：

主要是这两个函数求解

$h_W\left(x;W\right ) = \frac{1}{1+e^{-(W^{T} x)}} =Sigmoid(W^{T}x)$

$Loss(W) = \sum_{i}{y^{(i)}log{1\over{h_{W}(x^{i})}}+(1-y^{(i)})log{1\over{1-h_{W}(x^{i})}}}$

源码参考GitHub地址：TensorFlow逻辑回归实现

猜你喜欢

转载自blog.csdn.net/qq_35200479/article/details/83316887

TensorFlow 学习（五）二分类logistic回归模型

【吴恩达-深度学习】二分类和logistic回归-学习笔记

小白的机器学习笔记（八）----Logistic回归处理二分类

深度学习之PyTorch---- Logistic回归（二分类问题）

经典的机器学习二分类算法——Logistic回归

深度学习框架tensorflow二实战（训练一个简单二分类模型）

Tensorflow深度学习神经网络学习笔记（一）二分类与多分类网络

tensorflow二分类

tensorflow实现二分类

TensorFlow2.0实现逻辑回归二分类，多分类

机器学习(7) 逻辑回归：二分类

Tensorflow之逻辑回归二分类以及交叉熵

单节点二分类logistic回归的反向传播训练学习参数与前向传播预测数据集的过程

人工智能-深度学习-自然语言处理(NLP)-TensorFlow2 ：TensorFlow2 创建RNN、LSTM、GRU神经网络模型-imdb数据集【电影评论情感二分类】

logistic回归：二分类

Tensorflow学习笔记二--线性回归模型

监督学习——logistic进行二分类（python）

机器学习入门（十）：回归与聚类算法——逻辑回归与二分类

Tensorflow 实战：一个简单的二分类模型

Spark2.0机器学习系列之2：Logistic回归及Binary分类（二分问题）结果评估

吴恩达机器学习（四）逻辑回归（二分类与多分类）

【TensorFlow】猫狗大战——二分类

【TensorFlow】：一个二分类的例子

使用Streamsets实现TensorFlow的二分类

使用TensorFlow实现二分类

TensorFlow学习五

TensorFlow学习之路（五）

tensorflow学习笔记五：用CNN进行图像分类

Logistic Regression（逻辑回归）模型如何实现二分类（为何可以做分类）

TensorFlow学习二：SOFTMAX回归

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)