李宏毅 bert 讲解 - 代码天地

李宏毅 bert 讲解

企业开发 2023-09-08 23:16:30 阅读次数: 0

原始bert是干嘛的

bert就是transformer的encoder

输入seq，输出seq

先决定盖哪几个，再决定怎么盖
在这里插入图片描述

展示原始的bert

然后输出

输出的就是一个向量，里面就是词典所有的单词的概率（是吗）
在这里插入图片描述

里面的linear怎么做的（小参数）

然后跟我那个真实值，最小化，（就是一个分类问题），训练的时候，bert里面的参数和我们那个liner的参数一起训练。
在这里插入图片描述

工作2（好像没啥用）

除了上述的mask之外，还会预测下一个句子在这里插入图d片描述
这个输出的yes或者or，意思就是我这两个句子是不是相接的，后来说这个方法其实没有什么用。

然后就是bert其实它的作用就是填空，但是他却可以使用在其他的任务上，这些任务叫做下游任务（downstream tasks），

下游任务–微调

在这里插入图片描述
就是胚胎干细胞，给东西，可以做很多事情，他去做各式各样的任务，就是fine-tune，其实就是微调，

这些就是bert的实际测试的任务

在这里插入图片描述
表现都是上升的

在这里插入图片描述
这里面，liner的参数是随机初始化的，然后bert的参数是从学习了填空的预训练以后得到的。

至于为什么把会填空的bert拿过来，因为效果好，（就是好，但是不知道为啥）

下面是用不用训练好的bet模型的差距，前面是预训练的，后面的是随机初始化的，
在这里插入图片描述

下游是semi-supervised ： pre-training + fine-tune

案例二：词性分析
在这里插入图片描述

案例三：给定一个前提，给定一个结果，让你推断，前提能否得出结果
在这里插入图片描述
bert是怎么做的

不取cls取任何一个输出理论上都是可以的，bert里面结构都是self-attention，都是互相关联的

案例五：QA

在这里插入图片描述

bert计算的苹果和苹果手机，其实是考虑了上下文的

在这里插入图片描述

每个向量可以理解成，每一个词的意思

猜你喜欢

转载自blog.csdn.net/missgrass/article/details/122725807

李宏毅 bert 讲解

【NLP】李宏毅老师ELMO, BERT, GPT讲解【笔记】

LSTM(李宏毅讲解)

李宏毅-ELMO, BERT, GPT

【笔记】李宏毅 -- ELMO、BERT、GPT

李宏毅BERT部分学习

李宏毅学习笔记14.ELMO、BERT、GPT

【李宏毅2021机器学习深度学习】作业讲解

【李宏毅2022 机器学习春】hw7_BERT（占坑）

【强推】李宏毅2021机器学习深度学习(附作业讲解)【hw1】

如何讲解BERT

保姆级讲解BERT

李宏毅主页

台大李宏毅

【自然语言处理】BERT 讲解

GAN李宏毅(1)

李宏毅作业１

台大李宏毅--CNN

台大李宏毅--keras

李宏毅-逻辑回归

李宏毅深度学习

李宏毅课程笔记

李宏毅_回归_2

李宏毅GAN教程

李宏毅，语音合成

李宏毅，语音识别

BERT

Bert系列：BERT模型二分类demo以及讲解

【自然语言处理 | BERT】BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding论文讲解

BERT详解(2)---源码讲解[生成预训练数据]

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)