CS224n assignment1 Q2 Neural Network Basics - 代码天地

CS224n assignment1 Q2 Neural Network Basics

其他 2019-01-08 19:07:59 阅读次数: 0

(a) 推导sigmoid的导数公式
y = 1/(1+exp(-x))

Answer：
y' = y*(1-y)
sigmoid的导数形式是十分简洁的，这也是sigmoid函数使用广泛的一个原因。

(b) 当使用交叉熵作为loss function时，推导其梯度公式，输入的y是一个one-hot向量

Answer：
当我们有一个分值向量f，损失函数对这个分值向量求导的结果等于向量里每个类别对应的概率值，但除了那个正确类别的概率值，它要再减去1。例如，我们的概率向量为p = [0.2, 0.3, 0.5]，第二类为正确的类别，那么的分值梯度就为df = [0.2, -0.7, 0.5]。
也是一个很重要的结论，在cs231n的作业已多次用到。

(c) 求一个单隐藏层的神经网络对于输入x的梯度
即 h=sigmoid(xW1+b1),y=softmax(hW2+b2)求y关于x的梯度

Answer：
令z2 = hw2+b2,z1=xW1+b1
则可以用链式法则求解。

(d) 求上题中的网络中有多少参数
输入为Dx维，输出为Dy维，隐藏单元有H个

Answer:
输入为Dx维，channel为1，隐藏层有H个单元，所以W1有DxH个参数，b1有H个参数
同理，W2有DDy个参数，b2有Dy个参数。

(e)sigmoid及其梯度求解

def sigmoid(x):
    """
    Compute the sigmoid function for the input here.

    Arguments:
    x -- A scalar or numpy array.

    Return:
    s -- sigmoid(x)
    """
    s = 1/(1+np.exp(-x))
    return s


def sigmoid_grad(s):
    """
    Compute the gradient for the sigmoid function here. Note that
    for this implementation, the input s should be the sigmoid
    function value of your original input x.

    Arguments:
    s -- A scalar or numpy array.

    Return:
    ds -- Your computed gradient.
    """
    ds = s*(1-s)
    return ds

猜你喜欢

转载自www.cnblogs.com/bernieloveslife/p/10240733.html

CS224n assignment1 Q2 Neural Network Basics

CS224n assignment1 Q3 word2vec

cs231n assignment1 Two-Layer Neural Network

Basics of Neural Network

Neural Network Basics

CS224n学习笔记：Lecture1 & 2

CS231n_assignment1 Q2 SVM

【CS224n】Neural Machine Translation with Seq2Seq

cs224n assignment 1总结

【CS224n】Neural Networks, Backpropagation

课程一(Neural Networks and Deep Learning)，第二周（Basics of Neural Network programming）—— 1、10个测验题（Neural N

吴恩达深度学习编程作业（1-2）- Python Basics with Numpy & Logistic Regression with a Neural Network mindset

CS224n学习笔记1

CS224n Assignment 1（1.1-1.2）

[cs224n] Lecture 3 – Neural Networks

【CS224n】Neural-Dependency-Parsing

CS231n assignment1 Q5 Level Representations: Image Feature

图像与机器学习-2-基础知识及cs231n/assignment1

[CS231n Assignment 2] 全连接神经网络(Fully-connected Neural Network)

(Review cs231n) Training of Neural Network2

CS231n assignment2 Q2 Batch Normalization

CS231n assignment3 Q2 Image Captioning with LSTMs

【NLP CS224N笔记】Lecture 1 - Introduction of NLP

［笔记］stanford engineering cs224n lecture 1

CS224N Learning - Lecture1

[cs224n] Lecture 2 – Word Vectors and Word Senses

［笔记］stanford engineering cs224n lecture2

Neural Network(1)-Introduction of Neural Network

Network Basics

cs231n neural network 笔记

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)