NLP中的tramsformer的整体架构 - 代码天地

NLP中的tramsformer的整体架构

其他 2021-01-29 10:18:53 阅读次数: 0

tramsformer相比传统的解决方案的优势在于能够进行并行计算

编码方面:
1输入X,X是一个序列→里面包含好几句话→每句话有许多词
⬇⬇⬇⬇
2对词进行预处理→周期性的标志(正弦余弦)，独热编码(这一步中，主要是因为NLP模型一般都是人家训练好的，我们调调参就能上)
⬇⬇⬇⬇
3输入刚刚处理好的词，做N次self-attention
⬇⬇⬇⬇
4做multi-head的self-attention
⬇⬇⬇⬇
5随着层数的堆叠可能越预测效果越不理想使用残差连接

解码方面:
1使用mask机制(比如考试不能透考题)
2考虑编码端，每输出一个词都有独立的特征编码
3做N层，多层堆叠(multi-head与self-attention)
4化为分类问题

猜你喜欢

转载自blog.csdn.net/CSDNXXCQ/article/details/113362142

NLP中的tramsformer的整体架构

NLP整体流程的代码

数据中台-整体架构全景

Identity组件Keystone如何融入到整体架构中

Android中Battery电量上报流程整体架构拆解

索引整体架构

银行IT系统 -整体架构

tomcat 整体架构

openjdk 整体架构（概览）

Spring整体架构

【jdbc】jdbc 整体架构

Tomcat整体架构分析

tomcat整体架构浅析

银行系统整体架构

银行IT系统整体架构

项目-整体架构

Spring的整体架构

Dubbo框架——整体架构

【leveldb】整体架构

EOS整体架构分析

软件测试整体架构

linux内核整体架构

pixhawk 整体架构的认识

直播平台整体架构

二、Spring的整体架构

Netty整体架构

008 Rabbitmq的整体架构

Mybatis整体架构

RabbitMQ ——整体架构

Web技术整体架构

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)