对于逻辑回归来说,输出
y∈{0,1}
逻辑回归的sigmoid输出大小为预测1的概率。则有
P(y=1∣x,θ)=hθ(x)
P(y=0∣x,θ)=1−hθ(x)
根据似然估计可得,样本数为
m
L(θ)=∏i=1mhθ(x(i))y(i)(1−hθ(x(i)))1−y(i)
J(θ)=−Ln(L(θ)), 化简后可以当作交叉熵形式看。
对于线性回归,损失函数定义为均方差。
对两种回归的
J(θ)求导后可以发现梯度大小是相同的,都是
∂θ∂J(θ)=XT(hθ(x)−Y)
是sigmoid函数作为桥梁导致了这种巧合。