【Andrew Ng Deep Learning个人学习笔记】 2、神经网络基础（1） - 代码天地

【Andrew Ng Deep Learning个人学习笔记】 2、神经网络基础（1）

其他 2018-09-26 09:16:58 阅读次数: 0

构建训练集的矩阵时，使用以下形式：

$X = \begin{pmatrix} \vdots & \vdots & & \vdots \\ x^{(1)}& x^{(2)} & \cdots & x^{(m)}\\ \vdots & \vdots & & \vdots \\ \end{pmatrix} X\in R^{n \times m}$
$Y= \begin{pmatrix} y^{(1)} & y^{(2)} & \cdots & y^{(m)} \\ \end{pmatrix} Y\in R^{1 \times m}$

逻辑回归（Logistic Regression）

Given X, $\hat{y}$ = P(y = 1 | X) 0 $\leq$ $\hat{y}$ $\leq$ 1
即预测值 $\hat{y}$ 为：X条件下, y = 1的概率。

参数说明（Parameters specification）

输入的特征向量(Feature Vector)X: X $\in$ $R^{n_x}$ , $n_x$ 为特征的数量;
训练标签(Training Label)Y: Y $\in$ {0， 1} ;
权重(Weights)w: w $\in$ $R^{n_x}$ ;
阈值？？(Threshold)b: b $\in$ $R$ ;
输出(Output) $\hat{y}$ : $\hat{y}$ = $\sigma$ ( $w^T$ x + b) ;
$S$ 型函数（Sigmoid Function）: $S$ = $\sigma$ ( $w^T$ x + b) = $\sigma$ ( $z$ ) = $\frac{1}{1+e^{-z}} \quad$ ;
参数向量（Parameter Vector）: $\Theta$ = $\begin{pmatrix} \theta_0 \\ \theta_1 \\ \theta_2 \\ \vdots \\ \theta_m \\ \end{pmatrix}$

损失函数（Loss/Error Function）

$l(\hat{y}^{(i)}, y^{(i)}) =\frac{1}{2} (\hat{y}^{(i)}- y^{(i)})^2$
一般情况下，我们使用平方误差（Squared Error）来衡量损失函数，但是一个非凸函数，运行梯度下降算法时，很大可能性取到的是局部最优解，而我们想要的是全局最优解，因此一般情况下不使用这种损失函数。

一般使用这种形式的损失函数：
$l(\hat{y}^{(i)}, y^{(i)}) =-[y^{(i)}log(\hat{y}^{(i)}) + (1-y^{(i)})log(1-\hat{y}^{(i)})]$
$if$ $\hat{y}^{(i)}==1: l(\hat{y}^{(i)}, y^{(i)}) =-y^{(i)}log(\hat{y}^{(i)})$
$if$ $\hat{y}^{(i)}==0: l(\hat{y}^{(i)}, y^{(i)}) =-(1-y^{(i)})log(1-\hat{y}^{(i)})$

代价函数（Cost Function）

$J(w,b)=\frac{1}{m}\sum_{i=1}^ml(\hat{y}^{(i)}, y^{(i)})$
$=-\frac{1}{m}\sum_{i=1}^m[y^{(i)}log(\hat{y}^{(i)}) + (1-y^{(i)})log(1-\hat{y}^{(i)})]$

对比Cost Function与Loss/Error Function

Loss/Error Function衡量单个训练样本上的表现；Cost Function是Loss Function在整个训练集（Training set）上的平均值。

猜你喜欢

转载自blog.csdn.net/Valeni/article/details/82825517

【Andrew Ng Deep Learning个人学习笔记】 2、神经网络基础（1）

【Andrew Ng Deep Learning个人学习笔记】 2、神经网络基础（2）

【Andrew Ng Deep Learning个人学习笔记】 1、深度学习简介

Deep Learning(1) —— Andrew Ng

Andrew Ng's Deep Learning学习记录

Deep Learning by Andrew Ng 学习笔记之人脸识别

Deep Learning by Andrew Ng 学习笔记之Neural Style Transfer

神经网络-机器学习（machine learning）笔记（Andrew Ng）

[C3] Andrew Ng - Neural Networks and Deep Learning

Andrew Ng 机器学习笔记 09 ：神经网络

andrew ng machine learning week5 神经网络

andrew ng machine learning week4 神经网络

深度学习笔记之Andrew Ng（1）

深度学习笔记之Andrew Ng（2）

Machine Learning 2014 by Andrew NG (part 1)

Machine Learning Andrew Ng -1. Introduction

Andrew Ng Machine Learning Week2

Machine Learning 2014 by Andrew NG (part 2)

吴恩达 Andrew Ng深度学习deep learning.ai作业

andrew ng machine learning week1 课堂笔记

吴恩达（Andrew Ng）deep learning课程-Sequence Models编程作业Emojify Pycharm实现

Andrew Ng机器学习入门学习笔记（四）之神经网络（二）

Andrew Ng机器学习入门学习笔记（四）之神经网络（一）

Machine Learning Yearning(Andrew Ng)

Machine Learning Note - Andrew Ng

Andrew Ng《机器学习》视频课程笔记 - 1(开篇)

吴恩达(Andrew Ng)——机器学习笔记1

Andrew Ng《机器学习》视频课程笔记 - 2(Introduction)

Andrew Ng 深度学习笔记-01-week2-课程

Andrew Ng 深度学习编程作业 1-2

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)