python工具方法35 实现SWA，再一次提升模型的性能 - 代码天地

python工具方法35 实现SWA，再一次提升模型的性能

企业开发 2022-09-26 21:00:21 阅读次数: 0

SWA是论文Averaging Weights Leads to Wider Optima and Better Generalization所提出的一种无痛涨点的方式，只需要在模型训练的最后阶段保存模型权重，然后取模型权重的平均值，就可以提升模型的权重。按照论文描述，针对不同的模型基本上可以涨一个点。论文：SWA Object Detection详细描述了实验SWA后，模型的涨点效果。

SWA的论文翻译：https://github.com/timgaripov/swa
SWA的项目地址：https://github.com/timgaripov/swa

为此，博主根据论文描述和SWA作者公布的源码，仿照ema的模型增强技术代码，重新实现了swa。这里的实现支持torch、paddle（博主亲测，tf2模型也应该是支持的，只是要修改权重加载与保存的部分）。这里的实现是针对模型权重，对于pytorch的mmdetection框架，paddle的paddledetection框架中的模型都是支持的。博主亲测，用swa提升了0.5的map。

按照swa论文所述，当模型带bn层时，swa_model中的bn层参数需要重新更新。因此，博主刻意实现了一个forward函数，用于更新bn层的参数【针对mmdetection、paddledetection等框架时无效】。

1、SWA实现

博主这里实现的SWA支持在训练过程中使用，也支持在模型训练完成后选择模型进行权重平均。
针对于用户只需要关注两个函数update和smooth_dir。update用于在训练过程中调用（在合适的epoch中[epoch数大于budget时]进行权重平均），smooth_dir用于在模型训练

猜你喜欢

转载自blog.csdn.net/a486259/article/details/126966337

python工具方法35 实现SWA，再一次提升模型的性能

再一次重新学习Python——Python语法基础

再一次重新学习Python——Json

再一次重新学习Python——错误、调试和测试

再一次重新学习Python——面向对象高级编程

再一次重新学习Python——函数式编程

再一次重新学习Python——高级特性

再一次重新学习Python——函数

Python制作快递查询系统，再一次感受到了Python的强大！

技术流：Python生成抖音字符视频，再一次感受到了Python的强大

记再一次的迷茫

再一次，明道云

再一次聊Binder 一

再一次对RxJava的理解和感悟，手写简单实现

（数据结构）栈的实现——再一次保姆级教学

再一次聊Binder 二

phpstorm神器再一次的奔溃

再一次在Eclipse下配置Android

再一次撸Handler、Looper、Message源码

再一次用merge优化update

再一次被入侵之潜伏的挖矿病毒

记再一次清除挖矿病毒

对于java的再一次学习

再一次利用with as 优化SQL

世界很大，请再一次问自己

再一次推倒重来

安卓实现按返回键回到桌面以及再一次按返回键退出应用

姐姐开始再一次学次vue的第一天的内容

再一次总结一下设计模式-概括

再一次，写一个最简单的.emacs

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)