生成模型finetune相关框架

生成模型finetune:

t5训练写诗和对联:https://github.com/hululuzhu/chinese-ai-writing-share

Fengshenbang-LM框架
t5训练qa:https://github.com/IDEA-CCNL/Fengshenbang-LM/blob/main/fengshen/examples/qa_t5/finetune_t5_cmrc.py
t5训练summary:https://github.com/IDEA-CCNL/Fengshenbang-LM/blob/main/fengshen/examples/mt5_summary/pretrain_mt5_summary.sh
预训练t5:https://github.com/IDEA-CCNL/Fengshenbang-LM/tree/main/fengshen/examples/pretrain_t5

textgen框架
https://github.com/shibing624/textgen
UDA(非核心词替换)/EDA:本项目参考Google的UDA(非核心词替换)算法和EDA算法,基于TF-IDF将句子中部分不重要词替换为同义词,随机词插入、删除、替换等方法,产生新的文本,实现了文本扩增
BT(回译):本项目基于百度翻译API实现了回译功能,先把中文句子翻译为英文,再把英文翻译为新的中文
Seq2Seq:本项目基于PyTorch实现了Seq2Seq、ConvSeq2Seq、BART模型的训练和预测,可以用于文本翻译、对话生成、摘要生成等文本生成任务
T5:本项目基于PyTorch实现了T5和CopyT5模型训练和预测,可以用于文本翻译、对话生成、对联生成、文案撰写等文本生成任务
GPT2:本项目基于PyTorch实现了GTP2模型训练和预测,可以用于文章生成、对联生成等文本生成任务
SongNet:本项目基于PyTorch实现了SongNet模型训练和预测,可以用于规范格式的诗词、歌词等文本生成任务
TGLS:本项目实现了TGLS无监督相似文本生成模型,是一种“先搜索后学习”的文本生成方法,通过反复迭代学习候选集,最终模型能生成类似候选集的高质量相似文本

猜你喜欢

转载自blog.csdn.net/weixin_36378508/article/details/127905841
今日推荐