Datawhale-大模型时代的数据变革

在这里插入图片描述

大模型参数规模的研究

在这里插入图片描述

大模型参数规模的探索

在这里插入图片描述
计算量不变的话,参数量,规模,loss有一个平衡点,不一定越大越好,可能百亿模型效果优于千亿模型。

大模型预训练数据的研究

在这里插入图片描述

大模型数据配方的探索

在这里插入图片描述

大语言模型预训练数据集

在这里插入图片描述

OpenDataLab-浦数

在这里插入图片描述
在这里插入图片描述

语料基础

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
###

数据采集工具库

在这里插入图片描述
在这里插入图片描述

扫描二维码关注公众号,回复: 15322641 查看本文章

在这里插入图片描述

数据处理的难题

在这里插入图片描述

创新性描述语言DSDL

在这里插入图片描述
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/uncle_ll/article/details/130587728