ALPAGASUS : TRAINING A BETTER ALPACA WITH FEWER DATA♢

业界资讯 2023-08-06 14:33:16 阅读次数: 0

ALPAGASUS : TRAINING A BETTER ALPACA WITH FEWER DATA♢

Introduction
Method
参考

Introduction

本文证明了数据的质量的重要性要大于数量。作者通过与GPT交互的方法过滤了Alpaca52k的数据，剩下9k，对二者分别微调，通过实验对比，发现9k的性能远大于52k。

第二点贡献是：作者通过混合其他开源指令数据集（Vicuna），证明了在数据集数量为9k是性能最佳。
在这里插入图片描述

Method

过滤方式就是通过In Context Learning 的方式与ChatGPT交互，为alpaca52k数据打分，分值为0-5.

prompt 如下：
在这里插入图片描述
之后选取4.5分以上的数据组成alpagasus 9k数据。

然后通过llama7b、llama13b分别对这两种数据集微调，性能对比如下：
在这里插入图片描述

同时作者也验证了 3k 6k的情况，发现9k的性能最好。

参考

https://arxiv.org/pdf/2307.08701.pdf

猜你喜欢

转载自blog.csdn.net/qq_18555105/article/details/131791683

ALPAGASUS : TRAINING A BETTER ALPACA WITH FEWER DATA♢

How to Better the Training

PRN（20200908）：Frosting Weights for Better Continual Training

分块算法--2018 UESTC Training for Data Structures

2019 UESTC ACM Training for Data Structures[B]

Differentiable Augmentation for Data-Efficient GAN Training

Training Generative Adversarial Networks with Limited Data

【论文阅读】Unsupervised Data Augmentation for Consistency Training

Puzzle Play with data terminal unit Children Results in Better Spatial Skills

【论】FlowRadar: A Better NetFlow for Data Centers(NSDI 2016)

【HZNU Summer training】HDU1856 More is Better （并查集最大集合）

NeurIPS 2021: All Tokens Matter: Token Labeling for Training Better Vision Transformers论文精读与解析

LV-ViT：All Tokens Matter: Token Labeling for Training Better Vision Transformers

【译】Private Image Analysis with MPC Training CNNs on Sensitive Data

并查集--2018 UESTC Training for Data Structures J K L

2018 uestc training for data structures（智商恢复训练）

2018 UESTC Training for Data Structures 中堂系的困难任务

2018 UESTC Training for Data Structures 好吃不过饺子

2018 UESTC Training for Data Structures 小埋的steam愿望单

论文阅读 Jointly Optimize Data Augmentation and Network Training

2018 UESTC Training for Data Structures--并查集

【阅读笔记】Training Deep Neural Networks on Imbalanced Data Sets

Android学习开发文档（Training）05 saving data

【论文笔记】The Impact of Imbalanced Training Data for CNN

【论文精读】Select Via Proxy: Efficient Data Selection For Training DeepNetworks

Towards Scalable Emotion Classification in Microblog Based on Noisy Training Data

UESTC 2020 Winter Training #1 Basic Data Structure【Animal Transport】

CDOJ1583-树状数组（2017 UESTC Training for Data Structures）

CDOJ-1592 (2017 UESTC Training for Data Structures B)

论文阅读 | Reinforced Training Data Selection for Domain Adaptation

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)