AllenNLP实践——fine-tune - 代码天地

AllenNLP实践——fine-tune

其他 2019-04-25 10:50:56 阅读次数: 0

AllenNLP的commands命令中有一个fine-tune命令，可以在新的数据集上训练模型，或者在原来的模型上继续训练。
fine-tune命令跳过配置文件的model部分，即网络结构是要固定下来的，其他参数可以变。
比如可以在配置文件设置trainer的no_grad，冻结一些层，让他们不进行参数更新，而其他层的参数正常更新。

以qanet.jsonnet为例

在windows中首先要去掉//的注释和变量，使它成为json的格式
执行dry-run命令，可以打印输出哪些层是可训练的，哪些层是冻结的
修改配置文件，在trainer中添加no_grad，其中用一个List的正则表达式，定义哪些层是需要冻结的
执行dry-run命令，验证是否设置成功

正则表达式

以下是我添加的no_grad，目的是冻结前面所有层，只训练最后的两个Linear。(“.”表示任意字符，“*”表示前面的字符可以重复多个，. * layer. *表示找到所有名字中带有layer的层)

"no_grad":
	    [".*text_field_embedder.*", ".*layer.*", ".*matrix.*"]

dry-run得到的结果，说明设置正确。
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/m0_38133212/article/details/88615209

AllenNLP实践——fine-tune

fine-tune

Fine-tune 的简介

干货 | 谷歌BERT模型fine-tune终极实践教程

干货 | 谷歌BERT模型fine-tune终极实践教程

谷歌BERT模型fine-tune终极实践教程

微调(Fine-tune)原理

caffe下fine-tune的demo

Pytorch-HED fine-tune实现

pytorch fine-tune 预训练的模型

caffe fine-tune微调网站备用

迁移学习&Fine-tune Training

迁移学习和fine-tune的区别

Pytorch—模型微调（fine-tune）

【LLM】语言模型微调 fine-tune

大模型fine-tune 微调

Baichuan2源码解析 fine-tune/fine-tune.py (一)

Keras：在预训练的网络上fine-tune

tensorflow 选择性fine-tune（微调）

pytorch参数初始化以及fine-tune

MXNET教程Fine-Tune训练图像分类模型

迁移学习、fine-tune和局部参数恢复

paper name:How to Fine-Tune BERT for Text Classification?

《How to Fine-Tune BERT for Text Classification》-阅读心得

迁移学习fine-tune示意图与代码详解

Fine-tune BERT for Extractive Summarization代码复现训练篇

yolov3模型微调(fine-tune)备忘

ocr中的densenet网络训练或者fine-tune

pytorch固定参数-模型的pretrain和fine-tune

浅谈feature-based 和 fine-tune

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)