【论文笔记 & fintune 】羊驼

企业开发 2023-05-07 20:06:54 阅读次数: 0

1.论文

这些开发由两个关键组件提供动力：大型预训练语言模型（LM）和人工编写的指令数据。

1.1 背景

目前的训练太吃数据了，需要使用一些替代方法减少对数据的依赖
有微调过的数据集效果远好于没有微调
用什么数据集微调呢？
基于人类指令性命令及其期望结果的数据集
data越大，潜在可完成的任务就越多

这篇论文旨在通过减少对人工注释的依赖来解决这个瓶颈。

1.2

基本上一张图可以涵盖这篇论文的内容
在这里插入图片描述

2. fintune

【网址】alpaca-lora
我12G4070显卡非常极限的完成了训练
参数如下：

python finetune.py     --base_model 'decapoda-research/llama-7b-hf' \
    --data_path 'yahma/alpaca-cleaned'     --output_dir './lora-alpaca' \
   --batch_size 16     --micro_batch_size 1     --num_epochs 2   \
   --learning_rate 3e-4     --cutoff_len 256     --val_set_size 2000   \
   --lora_r 8     --lora_alpha 16     --lora_dropout 0.05     --lora_target_modules '[q_proj,v_proj]'  \
   --train_on_inputs     --group_by_length

2.1 out of memory 问题

在保存权重的时候出现oom，bitsandbytes版本问题
建议版本：

pip install bitsandbytes==0.37.2

2.2 transform 版本

某些transform版本会出现AutoModelForCausalLM等的错误

猜你喜欢

转载自blog.csdn.net/weixin_50862344/article/details/129990340

【论文笔记 & fintune 】羊驼

python量化羊驼法则

导致皇家羊驼黑下巴的原因

[QUANTAXIS量化分析]羊驼策略1

快速的在Adobe Illustrator中创建羊驼插图教程

在 “Baby 容器” WasmEdge 里运行 Baby 羊驼 llama 2

【论文笔记】ZFNet论文笔记

Kalman论文笔记

论文笔记

SEDA论文笔记

RFCN论文笔记

【论文笔记】SPPnet

SSD论文笔记

ResNet论文笔记

论文笔记模板

MobileNets 论文笔记

ResNeXt 论文笔记

Xception 论文笔记

YOLO 论文笔记

CRNN论文笔记

DenseNet 论文笔记

论文笔记：FPN

论文笔记的格式

论文笔记：IOUnet

VGGNet 论文笔记

AlexNet 论文笔记

论文笔记：FCN

论文笔记：YOLO

论文笔记：PointSIFT

论文笔记：PPFNet

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)