深度学习（十三） - 代码天地

深度学习（十三）

其他 2018-09-30 10:01:41 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/yeyustudy/article/details/81914644

1、嵌入矩阵的设置：一般来说，设置嵌入矩阵要比其基数多一个，代表未知的参量，确定嵌入矩阵大小的经验法则是其基数除以2，但不大于50（可以与前文所述RNN那里一起理解）
2、AdamW算法：
在损失函数中加了正则项，权重更新方法仍旧使用Adam，但损失函数变为 $L(w) = {\sum {||{{\hat y}_i} - {y_i}||} ^2} + \lambda ||w|{|^2}$ ，使得优化适可而止。
3、Word2Vec：是生成词嵌入的一种手段，能将one-hot编码所产生的稀疏向量压缩到一个较小的子嵌入空间中，但用来预测性能不佳；其将原本输入句子标记为1，删除原本句子中间单词并用随机单词代替并标记为0，利用模型训练找到标记为0的句子，我们要的就是在这个过程中生成的词嵌入。词嵌入是一种考虑语义的词表示方法。
4、Autoencoder：是一个输入等于输出的任务，相当于重构自身，保证中间层的激活量小于输入量，可以说是一个假任务。

猜你喜欢

转载自blog.csdn.net/yeyustudy/article/details/81914644

深度学习（十三）

深度学习(七十三)pytorch学习笔记

深度学习（十三）：迁移学习Transfer Learning

深度学习(十三) Adversarial Attack 理论部分

系统学习深度学习（三十三）--Prioritized Replay DQN

系统学习深度学习（四十三）--GAN简单了解

深度学习（十三）神经网络基础总结

推荐系统遇上深度学习(十三)--linUCB方法浅析及实现

caffe深度学习【十三】：Caffe的 solver 参数详解

深度学习（十三）caffe之训练数据格式

深度学习笔记——理论与推导之Reinforcement Learning（十三）

【GANs学习笔记】（二十三）EBGAN深度理解

动手学深度学习(PyTorch实现)(十三)--ResNet模型

深度学习实战篇之 ( 十三) -- TensorFlow之AlexNet

python与深度学习(十三):CNN和IKUN模型

「深度学习之优化算法」（十三）蝙蝠算法

零基础入门深度学习（十三）：词向量的深度解析

深度学习花书学习笔记第十三章线性因子模型

非监督特征学习与深度学习（十三）---- 自动编码器

深度学习（花书）学习笔记——第十三章线性因子模型

深度学习（二十三）——Fast Image Processing, SVDF, LCNN, LSTM进阶

深度学习编译中间件之NNVM(十三)NNVM源代码阅读2

深度学习笔记（十三）：L1、L2正则化

初识Leetcode----学习（十三）【二叉树的最小深度、路径总和】

【C语言进阶深度学习记录】二十三数组的本质分析

【C语言进阶深度学习记录】十三 C语言中 ++和--操作符

【C语言进阶深度学习记录】三十三 C语言中动态内存分配

Nginx详解二十三：Nginx深度学习篇之Nginx+Lua开发环境搭建

深度学习入门笔记（十三）：批归一化（Batch Normalization）

SIGAI深度学习第十三集循环神经网络2

今日推荐

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

对话Kaldi之父、小米首席语音科学家Daniel Povey：开源环境比金钱和荣誉更吸引我 | AGI技术50人...

Hugging Face全攻略：轻松下载Llama 3模型，探索NLP的无限可能！【实操】

阅读送书抽奖？玩转抽奖游戏，js-tool-big-box工具库新上抽奖功能

百度发布Comate代码知识增强2.0，国内首个支持实时检索智能代码助手

黑客利用扫雷游戏 Python 克隆隐藏恶意脚本，攻击欧洲和美国金融机构

微软对开源字体 Cascadia Code 进行重大更新

好书推荐《ChatGPT原理与架构：大模型的预训练、迁移和中间件编程》

Baidu Comate 智能编码助手：编程新伙伴，效率新飞跃

AI时代：人工智能大模型引领科技创造新时代

百篇博客 · 千里之行

周排行

WebSocket、HTTP 与 TCP

private,public,protected的区别

Python用了这么多年，总结出超实用的功能和特点

dgwp笔记

ModuleNotFoundError: No module named 'gdbm'

数组的去重方法

Ternsorflow 学习：005-MNIST 实现模型

SpringBoot 2 源码学习笔记（二）

jaxws-spring 搭建Web Services笔记

读取properties文件并获取属性值

每日归档

更多

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)