transformer面试常考题 - 代码天地

transformer面试常考题

企业开发 2023-10-02 23:54:14 阅读次数: 0

1.位置编码有哪些？有什么区别？

nn.embedding和正余弦编码两种用的多。nn.embedding是一种基于学习的嵌入方法，

通过神经网络的训练过程，会自动学习数据中每个符号的嵌入向量表示。

而正余弦编码是一种手工设计的嵌入方式，是一种固定的编码方式，不依赖于具体的数据和训练模型。

2.transformer的结构

encoder部分主要是为了提取特征，decoder常用于生成式任务。FFN前馈网络进行特征交融。

3.为什么在QK相乘后要归一化

为了防止内积过大，导致梯度爆炸，这样更容易训练，有点类似BN的作用。

4.为什么要使用multi head attention

CNN里面有多个卷积核来提取不同维度的特征信息，那么transformer里也想着把channel分为几份，然后分别做注意力机制，这样即可以降低计算量，也可以学习不同维度的特征。具体操作，把QKV分成几份，然后分别注意力得到特征再concat。

5.后续继续更新

猜你喜欢

转载自blog.csdn.net/slamer111/article/details/132043414

transformer面试常考题

python面试常考题

python 面试常考题

JAVA面试常考题面试常考知识1

JAVA面试常考题面试常考知识2

JAVA面试常考题面试常考知识3

Java面试2018常考题目汇总

Http和Https的区别（面试常考题）

Python知识点——面试常考题

2019秋招面试常考题目

java面试常考题目总结

Java面试2019常考题目汇总

面试常考题—Java常量池

HTTP 和 HTTPS 的区别（面试常考题）

LeetCode面试常考题：Two Sum

Java面试2018常考题目汇总（一）（转）

Java面试2018常考题目汇总（一）

Java面试2018常考题目汇总（二）

【附答案】Java面试2019常考题目汇总（一）

Java面试2019常考题系列（附带答案）

计算机网络之面试常考题

python面试总结2(函数常考题和异常处理)

Http和Https的区别（面试常考题）（转）

一道面试常考题：反转单链表

前端面试---手写代码常考题

软件测试常考题

常考题目

java集合常考题

git常考题目

2020年-web前端-最新-最全-最快的面试咨询-面试真题-面试常考题

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)