LLMs 缩放指令模型Scaling instruct models FLAN（Fine-tuned LAnguage Net，微调语言网络）

企业开发 2023-08-26 20:39:38 阅读次数: 0

本论文介绍了FLAN（Fine-tuned LAnguage Net，微调语言网络），一种指导微调方法，并展示了其应用结果。该研究证明，通过在1836个任务上微调540B PaLM模型，同时整合Chain-of-Thought Reasoning（思维链推理）数据，FLAN在泛化、人类可用性和零射推理方面相对于基础模型取得了改进。论文还详细介绍了如何评估这些方面。
在这里插入图片描述

这里是来自讲座幻灯片的图片，说明了在训练FLAN时使用的微调任务和数据集。任务选择在以前的工作基础上进行了扩展，通过整合来自Muffin的对话和程序合成任务，并将它们与新的Chain of Thought Reasoning任务集成。它还包括其他任务集合的子集，如T0和Natural Instructions v2。一些任务在训练期间被保留，后来用于评估模型在未见任务上的性能。

参考

https://www.coursera.org/learn/generative-ai-with-llms/supplement/aDQwy/scaling-instruct-models

猜你喜欢

转载自blog.csdn.net/zgpeace/article/details/132517722

LLMs 缩放指令模型Scaling instruct models FLAN（Fine-tuned LAnguage Net，微调语言网络）

GPT教程之LLMs大语言模型，Large Language Models大语言模型介绍

【开源AI大模型】WizardCoder: Empowering Code Large Language Models with Evol-Instruct

Recommender Systems in the Era of Large Language Models (LLMs)

【微调视觉-语言模型】Learning to Prompt for Vision-Language Models

LLMs 缩放法则和计算最优模型Scaling laws and compute-optimal models

【LLM】大语言模型学习之LLAMA 2：Open Foundation and Fine-Tuned Chat Model

LLMs指令微调 Instruction fine-tuning

LLaMA 2: Open Foundation and Fine-Tuned Chat Models

Exploring the Potential of Large Language Models (LLMs) in Learning on Graphs

Augmented Language Models（增强语言模型）

【LLM系列之FLAN-T5/PaLM】Scaling Instruction-Finetuned Language Models

LLMs：《A Survey on Evaluation of Large Language Models大型语言模型评估综述》理解智能本质(具备推理能力)、AI评估的重要性(识别当前算法的局限性+设

【论文阅读】Scaling Laws for Neural Language Models

LLMs之Baichuan 2：《Baichuan 2: Open Large-scale Language Models》翻译与解读

Paper：《Instruction Tuning for Large Language Models: A Survey—大型语言模型的指令调优的综述》翻译与解读

【LLM】self-instruct 构建指令微调数据集

LLMs多任务指令微调Multi-task instruction fine-tuning

[大语言模型应用于推荐系统]Large Language Models are Competitive Near Cold-start Recommenders for Language- and I

网络智能化/通信AI 大模型论文-通过大语言模型理解电信语言-Understanding Telecom Language Through Large Language Models

Fine-Tuning Language Models from Human Preferences

Distributed Inference and Fine-tuning of Large Language Models Over The Internet

【自然语言处理 | Language Models】Language Models 常见算法介绍合集（一）

【自然语言处理 | Language Models】Language Models 常见算法介绍合集（九）

【自然语言处理 | Language Models】Language Models 常见算法介绍合集（八）

【自然语言处理 | Language Models】Language Models 常见算法介绍合集（七）

【自然语言处理 | Language Models】Language Models 常见算法介绍合集（五）

【自然语言处理 | Language Models】Language Models 常见算法介绍合集（四）

【自然语言处理 | Language Models】Language Models 常见算法介绍合集（六）

语言模型language models 动手学深度学习v2

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)