Distilling Step-by-Step: 可以用更少的训练数据与模型尺寸战胜同级别的LLM！

业界资讯 2023-06-12 06:34:26 阅读次数: 0

Distilling Step-by-Step: 可以用更少的训练数据与模型尺寸战胜同级别的LLM！

Introduction
Method
实验
参考

Introduction

作者提到部署大模型存在时延、内存、算力等挑战，所以目前的趋势是微调、蒸馏一个不是很大的语言模型，如Vicuna、Alpaca，但是获取特定下游任务的数据是困难的、昂贵的。

在这里插入图片描述

为了解决上述问题，作者提出了Distilling Step-by-Step，可以通过用更少的数据、更小模型战胜在同等数据集上的大模型。（本文中作者通过实验770M-T5战胜了540BPaLM）

Method

在这里插入图片描述
Distilling step-by-step 一共分为两步：

把一些未标注的数据通过CoT的方式prompt LLM生成label与理论基础（也就是为什么得到这样结果）。
把得到的数据在小模型中finetune。

其中第一步案例如下：

在这里插入图片描述

这样就可让小模型既可以学到这个任务怎么做，怎可以学到为什么这么做，增加小模型对特定任务的理解。

现在有了 xi（来自于原始为标注的数据）、ri(理论基础)、yi(标签)，作者为了更好的将三者联系起来：
在这里插入图片描述

输入问题，把output改为答案+答案的解题思路。

在计算损失函数的时候，对二者加权计算。
在这里插入图片描述

实验

在这里插入图片描述

在这里插入图片描述

参考

https://arxiv.org/pdf/2305.02301.pdf

猜你喜欢

转载自blog.csdn.net/qq_18555105/article/details/130490101

Distilling Step-by-Step: 可以用更少的训练数据与模型尺寸战胜同级别的LLM！

Distilling Step-by-Step

小模型媲美2000倍体量大模型，谷歌提出新思路：蒸馏也能Step-by-Step

典型医学设计实验GEO数据分析 (step-by-step) - 数据获取到标准化

典型医学设计实验GEO数据分析 (step-by-step) - Limma差异分析、火山图、功能富集

PWA：progressive web application step-by-step

创建本地centos源step-by-step

Wireshark 101: Getting around (step-by-step)

使用Eclipse构建Maven项目 (step-by-step)

zz 使用Eclipse构建Maven项目 (step-by-step)

Develop Your First Neural Network in Python With Keras Step-By-Step

Step-By-Step: Setting up Active Directory in Windows Server 2016

API Test Automation Tutorial: A Step-by-Step Guide

实现自己的Faster RCNN（Keras）（step-by-step）

A Step-by-Step Introduction to the Basic Object Detection Algorithms

Designing a Seamless Omnichannel Data Collection Strategy: A Step-by-Step Guide

大数据搬站step by step

训练网络时step的意思

[tf]step在模型里面设置

JAVA通过IP查询详细地址 Step-By-Step ( 纯真IP地址库)

step-by-step install Nginx反向代理服务器(Ubuntu 18.04 LTS)（转）

Building a Website with WordPress 5 A Step-By-Step Guide.pdf 免费下载

[不错]A step-by-step guide to enabling security, TLS/SSL, and PKI authentication in Elasticsearch

SKP900 SKP-900 program Mazda2 Key step-by-step

Step-by-step to LSTM: 解析LSTM神经网络设计原理

CentOS7下部署Django项目详细操作步骤[step-by-step]

OpenAI最新研究Let's verify step-by-step，过程胜于结果！

模型蒸馏开山作：Distilling the Knowledge in a Neural Network

Dynamics CRM 用代码注册Plugin Step

SHADER 用 step替代 if-else

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)