谷歌发布ALBERT V2和中文模型 - 代码天地

谷歌发布ALBERT V2和中文模型

业界资讯 2023-07-22 23:59:46 阅读次数: 0

2019年9月推出时，谷歌的ALBERT语言模型在GLUE、RACE和SQuAD 2.0等流行的自然语言理解（NLU）基准上取得了SOTA结果。谷歌现在发布了一个主要的V2 ALBERT更新和开源的中国ALBERT模型。

正如全名“A Lite BERT”所示，ALBERT是该公司BERT（来自变压器的双向编码器表示）语言表示模型的精简版，该模型已成为NLU研究的支柱。论文《ALBERT:语言表示的自我监督学习的精简BERT》已被今年4月在埃塞俄比亚首都亚的斯亚贝巴举行的ICLR 2020接受。

正如Synced报告中所概述的那样，谷歌的ALBERT是一个更倾斜的BERT；在3个NLP基准上实现SOTA，类似于BERT大型的ALBERT配置的参数减少了18倍，训练速度提高了1.7倍。

v2 和 v1 模型之间的比较
ALBERT v2模型的主要变化涉及三种新策略：无丢失、额外的训练数据和长训练时间。研究人员对ALBERT基地进行了10M步的训练，对其他模型进行了3M步的训练。结果表明，ALBERT v2的性能通常比第一个版本有显著改进。

特殊情况下，ALBERT-xxlarge v2 的性能比第一个版本略差。研究人员确定了两个可能的原因：1.额外训练150万步并没有显着提高性能;2. 对于 v1，研究人员在参数集中进行了一些超参数搜索，而对于 v2，他们采用了 v1 中的参数，但对RACE测试超参数进行了微调。“鉴于下游任务对微调超参数很敏感，我们应该小心所谓的轻微改进。

谷歌还发布了中文ALBERT模型，该模型使用来自中文语言理解评估基准（CLUE）的训练数据构建。

论文ALBERT：A Lite BERT for Self-supervised Learning of Language Representations发表在arXiv上。ALBERT models v2 GitHub

猜你喜欢

转载自blog.csdn.net/virone/article/details/131763717

谷歌发布ALBERT V2和中文模型

比ChatGPT更强的星火大模型V2版本发布！

谷歌地图V2，V3对比！

YoloAll V2发布，集成所有主流Yolo模型于一身

freyja v2版本发布

Pyston v2 发布：比 Python 快 20%

Vaadin v6.5.0发布使用Apache V2许可协议的开源产品

JPress v3.0 beta.1 发布，新增对 v2 版本的平滑升级支持

谷歌将 Manifest V2 扩展的结束日期推到 2024 年

轻量级模型：MobileNet V2

MobileNet V2模型——pytorch实现

谷歌发布MetNet神经网络模型预测天气

谷歌发布大模型Gemini，赶超GPT4

Canonical为所有Ubuntu用户发布AMD微码更新以修复Spectre V2

【更新】Essential Studio for ASP.NET Core 2018 v2发布

Git 2.26 发布，传输协议 V2 成默认协议

高性能 KV 存储引擎 rosedb V2 版本发布

Amazon Aurora Serverless v2 正式发布：针对要求苛刻的工作负载的即时扩展

Playground v2发布：生成效果胜过Stable Diffusion XL 2.5倍

NLP从Seq2Seq到ALBERT模型理解与实践

预训练语言模型 | (4) AlBert

【NLP】ALBERT：瘦身版的BERT模型

Agones v 1.23.0 发布，谷歌和育碧联合开发的游戏服务器

Agones v1.33.0 发布，谷歌和育碧联合开发的游戏服务器

为机器人装“大脑” 谷歌发布RT-2大模型

HoloLens 2 中文开发文档 MRTK v2

机器学习：利用 Tensorflow 和预训练模型提取特征-- Mobilenet V2

模型选择 + 过拟合和欠拟合动手学深度学习v2 pytorch

玩转MMDetection-MMDetection v2 目标检测模型训练和测试（四）

谷歌发布史上“最强大脑”——可以控制和操作机器人的AI模型

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)