BERT模型内部结构解析 - 代码天地

BERT模型内部结构解析

其他 2020-02-23 22:01:03 阅读次数: 0

BERT强大的特征抽取能力在各方面的应用如火如荼的展开，今日准备要对BERT输出的特征进行组合，以期能具有更好地变现，现在对model对象做详细的分析。

直观上，我们能够利用bert的信息有：1）pool out [CLS]；2）encoder layer；3）hidden state first output

我们加载bert的过程如下：

model = modeling.BertModel(config=bert_config,
                           is_training=self.__is_training,
                           input_ids=self.input_ids,
                           input_mask=self.input_masks,
                           token_type_ids=self.segment_ids,
                           use_one_hot_embeddings=False)

无论你是通过什么方法得到的，这个model对象就是我们要解析的，通过debug我们得知，它有如下成员：

讲一下个人的理解，请批评指正：

all_encoder_layers: 经过transformer_model函数返回每个block的结果，即对应bert的12个Transformer层，均是原始高维数据。如果要分析不同层抽取何种特征，可以分析这个得出一些结论

embedding_table: vocab表，用于构建字符embedding向量

embedding_output: embedding结果

sequence_output: 是bert最后一层的输出，需要验证一下all_encoder_layers最后一层的输出有何区别

　　　维度为[Batch_szie, seq_length, hidden_size]，这和一开始词向量的维度是一样的，只不过这个结果是经过Transformer Encoded提取特征之后的，包含重要的信息，也是bert想得到的结果

pooled_output: 一般分类任务需要的特征，pooled_output是取sequence_output的第一个切片然后线性投影获得，这个位置就是[CLS]

其实，明白这些之后就可以做一些特征组合进行操作了

猜你喜欢

转载自www.cnblogs.com/demo-deng/p/12354484.html

BERT模型内部结构解析

JVM内部结构

tensor内部结构

Kafka内部结构

解决模型半透明时看到内部结构的问题

hadoop源码解析之hdfs内部结构分析

解析Tomcat内部结构和请求过程

ConcurrentHashMap源码解析1.内部结构

MongoDB内部结构分析

ANE内部结构探究

LoadRunner内部结构(转)

data block内部结构

Oculus Rift内部结构

堆内存内部结构

JVM的内部结构与详述

协议栈的内部结构

.pdb 文件的内部结构

LSTM内部结构详解

onnx内部结构 -- 摘录

电子烟的内部结构

贰：RunLoop的内部结构

java类对象的内部结构图解(java对象模型精讲)

解析Cloudera Manager内部结构、功能包括配置文件、目录位置等

Kafka源码深度解析－序列9 －Consumer －SubscriptionState内部结构分析

oracle datablock 内部结构（来自一军的详细解析)

BMP位图基础:通过UltraEdit解析BMP文件内部结构

PostgreSQL 9.6源码解析之XLOG生成（二）xlog文件内部结构

线程池源码解析2.工作原理与内部结构

面试必考：HashMap的内部结构

MongoDB数据文件内部结构

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)