简单粗暴理解与实现机器学习之逻辑回归(一):逻辑回归介绍、应用场景、原理、损失以及优化

逻辑回归

学习目标

  • 知道逻辑回归的损失函数
  • 知道逻辑回归的优化方法
  • 知道sigmoid函数
  • 知道逻辑回归的应用场景
  • 应用LogisticRegression实现逻辑回归预测
  • 知道精确率、召回率指标的区别
  • 知道如何解决样本不均衡情况下的评估
  • 了解ROC曲线的意义说明AUC指标大小
  • 应用classification_report实现精确率、召回率计算
  • 应用roc_auc_score实现指标计算
  • 在这里插入图片描述

3.1 逻辑回归介绍

逻辑回归(Logistic Regression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归,但是它与回归之间有一定的联系。由于算法的简单和高效,在实际中应用非常广泛。

1 逻辑回归的应用场景

  • 广告点击率
  • 是否为垃圾邮件
  • 是否患病
  • 金融诈骗
  • 虚假账号

看到上面的例子,我们可以发现其中的特点,那就是都属于两个类别之间的判断。逻辑回归就是解决二分类问题的利器

2 逻辑回归的原理

要想掌握逻辑回归,必须掌握两点:

逻辑回归中,其输入值是什么

如何判断逻辑回归的输出

2.1 输入

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-W5dDVOVj-1583249915465)(../images/%E9%80%BB%E8%BE%91%E5%9B%9E%E5%BD%92%E8%BE%93%E5%85%A5.png)]

逻辑回归的输入就是一个线性回归的结果。

2.2 激活函数

  • sigmoid函数

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-s1sIE2a1-1583249915466)(../images/sigmoid%E5%85%AC%E5%BC%8F.png)]

  • 判断标准

    • 回归的结果输入到sigmoid函数当中
    • 输出结果:[0, 1]区间中的一个概率值,默认为0.5为阈值

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0DRdXO8o-1583249915466)(../images/sigmoid%E5%9B%BE%E5%83%8F.png)]

逻辑回归最终的分类是通过属于某个类别的概率值来判断是否属于某个类别,并且这个类别默认标记为1(正例),另外的一个类别会标记为0(反例)。(方便损失计算)

输出结果解释(重要):假设有两个类别A,B,并且假设我们的概率值为属于A(1)这个类别的概率值。现在有一个样本的输入到逻辑回归输出结果0.6,那么这个概率值超过0.5,意味着我们训练或者预测的结果就是A(1)类别。那么反之,如果得出结果为0.3那么,训练或者预测结果就为B(0)类别。

所以接下来我们回忆之前的线性回归预测结果我们用均方误差衡量,那如果对于逻辑回归,我们预测的结果不对该怎么去衡量这个损失呢?我们来看这样一张图

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pDs90KhO-1583249915467)(../images/%E9%80%BB%E8%BE%91%E5%9B%9E%E5%BD%92%E8%BF%90%E7%AE%97%E8%BF%87%E7%A8%8B.png)]

那么如何去衡量逻辑回归的预测结果与真实结果的差异呢?

3 损失以及优化

3.1 损失

逻辑回归的损失,称之为对数似然损失,公式如下:

  • 分开类别:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YM96W9ML-1583249915467)(../images/%E5%8D%95%E4%B8%AA%E5%AF%B9%E6%95%B0%E4%BC%BC%E7%84%B6%E6%8D%9F%E5%A4%B1.png)]

怎么理解单个的式子呢?这个要根据log的函数图像来理解

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-MWrzWUgD-1583249915468)(…/images/log%E5%9B%BE%E5%83%8F.png)]

  • 综合完整损失函数

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-X4xpxVOt-1583249915468)(../images/%E5%AE%8C%E6%95%B4%E5%AF%B9%E6%95%B0%E4%BC%BC%E7%84%B6%E6%8D%9F%E5%A4%B1.png)]

看到这个式子,其实跟我们讲的信息熵类似。

接下来我们呢就带入上面那个例子来计算一遍,就能理解意义了。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iUmChx7U-1583249915469)(../images/%E6%8D%9F%E5%A4%B1%E8%AE%A1%E7%AE%97%E8%BF%87%E7%A8%8B.png)]

我们已经知道,log§, P值越大,结果越小,所以我们可以对着这个损失的式子去分析

3.2 优化

同样使用梯度下降优化算法,去减少损失函数的值。这样去更新逻辑回归前面对应算法的权重参数,提升原本属于1类别的概率,降低原本是0类别的概率。

发布了607 篇原创文章 · 获赞 809 · 访问量 10万+

猜你喜欢

转载自blog.csdn.net/qq_35456045/article/details/104644760