一种无监督模型（one model to learn them all） - 代码天地

一种无监督模型（one model to learn them all）

其他 2019-02-17 23:11:33 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/rosefun96/article/details/85724079

背景

这是Google17年的论文，提出了nlp领域的无监督模型。
之前针对图像识别、语音识别、翻译等不同的工作，需要不同的模型，谷歌提出这个模型来，一口气搞定了图像识别、图像分类和多语言翻译。
在这里插入图片描述

1 模型

在这里插入图片描述
MultiModel由三部分组成：模式网络，编码器，自回归编码器。
编码和解码使用了卷积、注意层、稀疏门控层等计算模块。
（1）卷积层可以检测局部模式特征；
（2）注意力机制层可以关注特定元素；
（3）稀疏门控混合专家提供计算容量并不增加过多计算成本。

1.1 卷积层

在这里插入图片描述

就普通卷积层，没看出什么特别

1.2 Attention层
在这里插入图片描述
Google之前提出的一个网络结构，这篇论文也没有过多描述。

1.3 混合专家层
稀疏门控混合专家层有许多简单的门控神经网络（专家）和可训练的门控网络组成。

1.4 编码解码层
在这里插入图片描述

2 总结

看了这篇论文，出发点真的太棒了，解决多模态问题，Google nlp的BERT模型思想也和这个类似，就让模型自动学习，不管语料是哪方面的。但这篇文章真的很难读懂。最近看了一些论文，缺乏实践，理解不够，可能以后读一篇论文还是尽量实践一下。

reference：
1.源码；
2.原论文;
3.知乎解读论文

猜你喜欢

转载自blog.csdn.net/rosefun96/article/details/85724079

一种无监督模型（one model to learn them all）

【深度学习】One Model to Learn Them All详解

ImageBind: One Embedding Space To Bind Them All

[CF]Equalize Them All

One Key to Sign Them All Considered Vulnerable: Evaluation of DNSSEC in the Internet

IMAGEBIND: One Embedding Space To Bind Them All论文笔记

D. Equalize Them All

One Sketch to Rule Them All: Rethinking Network Flow Monitoring with UnivMon阅读笔记

Learn: Model Validation

CodeForces 1144D -Equalize Them All

实验吧——(crypto)try them all writeup

HDU 3920 Clear All of Them I（状态压缩）

HDU 3920 Clear All of Them I（状压DP）题解

CSU-暑假集训题 Equalize Them All

多域--One Model to Serve All: Star Topology Adaptive Recommender for Multi-Domain CTR Prediction

tensorflow 查看模型输入输出saved_model_cli show --dir ./xxxx --all

hdu3920Clear All of Them I(预处理加状压dp)

D. Equalize Them All Codeforces Round #550 (Div. 3)

Codeforces Round #550 (Div. 3) D. Equalize Them All

题解 SP19148【INS14G - Kill them All】

X2-VLM: All-In-One Pre-trained Model For Vision-Language Tasks论文笔记

All in与否，表达的是一种态度

Find them, Catch them

Scikit-learn（一）

Model 模型

模型（Model）

模型Model

learn

You may wish to exclude one of them to ensure predictable runtime behavior

【All in One】Once

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)