机器学习(2)分类之逻辑回归

上一节主要介绍了机器学习中监督学习和无监督学习的区别。这一章主要介绍监督学习中的分类算法-逻辑回归，也叫logistic回归。

逻辑回归：根据已有的数据点，根据这些数据分类的边界建立回归公式，找到最佳拟合参数集。

要介绍算法实现之前，肯定要先介绍其数学实现原理。

对于这些特征数据点，假如我们有：（公式图片来源于网络）

（x1，x2代表数据的特征，比如这些数据点是来自一个电视的特征，x1代表电视屏幕大小，x2代表电视屏幕分辨率，θ是权重参数）

我们知道这条线肯定不会和全部的数据点拟合，所以我们要设计一个公式来衡量所得到参数的精确性，这里把它称作损失函数或代价函数，逻辑分类的代价函数为：

逻辑回归中我们要计算这个公式的最大值，因为这是个分类问题，所以两侧的点到线的距离越大也就代表这条直线分类效果越好，就像求一个函数的最大值，我们上学时就知道要求一个函数的最大值，如果是多元函数，就是求其偏导数，这里有个专有名词叫做梯度上升，【把偏导数符号变一下就变成梯度下降】，这里θ作为自变量，梯度上升见下图1，对其求导过程如下2图：