【机器学习】逻辑回归过程推导

目录：
一、LR的基本原理。
二、LR的具体过程，包括：选取预测函数，求解Cost函数和J(θ)，梯度下降法求J(θ)的最小值。
三、对《机器学习实战》中给出的实现代码进行了分析，对阅读该书LR部分遇到的疑惑进行了解释。比如：一般都是用梯度下降法求损失函数的最小值，为何这里用梯度上升法呢？书中说用梯度上升法，为何代码实现时没见到求梯度的代码呢？

一、LR的基本原理
Logistic Regression和Linear Regression的原理是相似的，按照我自己的理解，可以简单的描述为：
（1）找一个合适的预测函数，一般表示为h函数，该函数就是我们需要找的分类函数，它用来预测输入数据的判断结果。这个过程非常关键，需要对数据有一定的了解或分析，知道或者猜测预测函数的“大概”形式，比如是线性函数还是非线性函数。
（2）构造一个Cost函数（损失函数），该函数表示预测的输出（h）与训练数据类别（y）之间的偏差，可以是二者之间的差（h-y）或者是其他的形式。综合考虑所有训练数据的“损失”，将Cost求和或者求平均，记为J(θ)函数，表示所有训练数据预测值与实际类别的偏差。
（3）显然，J(θ)函数的值越小表示预测函数越准确（即h函数越准确），所以这一步需要做的是找到J(θ)函数的最小值。找函数的最小值有不同的方法，Logistic Regression实现时用的是梯度下降法（Gradient Descent）。

二、LR的具体过程

（1）构造预测函数
Logistic Regression虽然名字里带“回归”，但它实际上是一种分类方法，用于两分类问题（即输出只有两种）。首先，需要先找到一个预测函数（h），显然，该函数的输出必须是两个值（分别代表两个类别），所以利用了Logistic函数（或称为Sigmoid函数），函数形式为：
这里写图片描述