Google｜OctoPack：指令微调代码大语言模型 - 代码天地

Google｜OctoPack：指令微调代码大语言模型

企业开发 2023-09-08 19:49:56 阅读次数: 0

美国康奈尔大学的大模型相关研究人员近日发布论文：

OctoPack：指令微调代码大语言模型

魔鬼就在错误中: 基于大型语言模型的细粒度机器翻译评估

原文链接 https://arxiv.org/abs/2308.07124 

项目要点

提出COMMITPACK，一个包含350种编程语言，总量4TB的代码提交(commit)数据集，用于指令微调(instruction tuning)，每个提交包含代码变更前后的对比、提交信息作为指令。
基于COMMITPACK过滤得到COMMITPACKFT，一个高质量子集，用于指令微调。
提出HUMANEVALPACK评估基准，扩展了之前的HUMANEVAL，包含3种任务:代码修复、代码解释和代码生成，覆盖6种语言，可以更全面评估代码生成模型的能力。
在StarCoder模型上微调各种指令数据，发现COMMITPACKFT数据集 mixed with OASST取得最佳效果，基于此训练了OCTOCODER和OCTOGEEX模型。
在HUMANEVALPACK上评测各模型，OCTOCODER在商用许可的模型中表现最好，封闭源的GPT-4效果最好。
讨论了一些模型的局限，如无法准确把控生成长度、只能处理单文件等，未来可考虑让模型执行代码、处理多文件、设计客观自动评测等。
COMMITPACK也可用于预训练，本文进行了相关实验，未来可研究指令调优和预训练的统一。

项目动机

当前机器翻译自动评估的指标往往只提供单一的质量得分，缺乏详细的错误信息。因此，本文的动机是提出一种使用大型语言模型(LLM)的提示技术来识别和分类翻译中的错误，以填补这一缺口，并通过错误范围与人工标注对齐来提供可解释性的评估。

项目方法

利用Git提交的自然结构，将代码变更与人类指令配对，编译了包含4TB的Git提交的数据集COMMITPACK，并在16B参数的StarCoder模型上与其他自然语言和合成代码指令进行对比评估。

项目优势

在Python基准测试中，COMMITPACK在未经OpenAI训练的模型中取得了最先进的性能（46.2% pass@1），而在HUMANEVALPACK的编码任务中，OCTOCODER和OCTOGEEX表现最佳，展示了COMMITPACK在更广泛的语言和自然编码任务上的优势。

猜你喜欢

转载自blog.csdn.net/specssss/article/details/132322893

Google｜OctoPack：指令微调代码大语言模型

大语言模型的指令微调（Instruction Tuning）最全综述：从数据集到技术全解析

大语言模型微调和PEFT高效微调

独家 | 何时微调大语言模型？

【LLM大模型】模型和指令微调方法

【LLM系列之指令微调】长话短说大模型指令微调的“Prompt”

[NLP]LLM---大模型指令微调中的“Prompt”

【自然语言处理】【大模型】极低资源微调大模型方法LoRA以及BLOOM-LORA实现代码

解读大模型的微调

大模型微调概览

LoRA微调语言大模型的实用技巧

语言大模型的分布式训练与高效微调指南

大语言模型LLM微调技术：P-Tuning

主流大语言模型从预训练到微调的技术原理

大语言模型LLM微调技术：Prompt Tuning

人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法

人工智能大语言模型微调技术：SFT 、LoRA 、Freeze 监督微调方法

LLaMA模型指令微调字节跳动多模态视频大模型 Valley 论文详解

NLP大模型微调答疑

NLP大模型微调原理

大模型微调方法综述

大模型微调技术汇总

大模型高效微调技术

微调大模型工具-LoRA

微软发布医学多模态大模型LLaVA-Med | 基于LLaVA的医学指令微调

自动化地挑选出大模型所需的高质量指令微调数据

LLMs 缩放指令模型Scaling instruct models FLAN（Fine-tuned LAnguage Net，微调语言网络）

哈工大团队开源医学智能问诊大模型 | 华佗: 基于中文医学知识的LLaMa指令微调模型

生成式大语言模型微调训练快速手册

【自然语言处理】大模型高效微调：PEFT 使用案例

今日推荐

wlnmp 一键安装包更新 240522

ChatGPT 严重宕机，结果被造谣“遭遇俄罗斯黑客入侵”

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

周排行

010-题目：利用条件运算符的嵌套来完成此题：学习成绩>=90分的同学用A表示，60-89分之间的用B表示，60分以下的用C表示。

接口测试-工作心得记录八（使用locust库书写接口并发）

物理分页和逻辑分页

Hive建表语句详解--CREATE TABLE

爬虫学习----学习get和post请求

PDF生成类库

POJ 2139

前端路由基本原理

I/O多路转接之epoll

.NET开源项目 QuarkDoc 一款自带极简主义属性的文档管理系统

每日归档

更多

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)