pytorch 显示网络结构，显示优化器的设置代码， - 代码天地

pytorch 显示网络结构，显示优化器的设置代码，

其他 2019-03-29 03:35:49 阅读次数: 0

最近注意到在一些caffe模型中，偏置项的学习率通常设置为普通层的两倍。具体原因可以参考(https://datascience.stackexchange.com/questions/23549/why-is-the-learning-rate-for-the-bias-usually-twice-as-large-as-the-the-lr-for-t)，貌似没有文章提到这个。
Pytorch中也提供了对不同层设置不同学习率以及衰减因子的方法。
主要方法是传递一个dict给optimizer，而不是list。

下面以restnet18进行说明：
首先加载resnet18 模型，并打印其参数设置：

import torch, torchvision
model = torchvision.models.resnet18()
paras = dict(model.named_parameters())

for k, v in paras.items():
print(k.ljust(30), str(v.shape).ljust(30), ‘bias:’, v.requires_grad)

输出为：

设置优化器参数，并打印

paras_new = []
for k, v in paras.items():
     if 'bias' in k:
        paras_new += [{'params': [v], 'lr': 0.02, 'weight_decay': 0}]
     else:
        paras_new += [{'params': [v], 'lr': 0.01, 'weight_decay': 0.00004}]
optimizer = torch.optim.SGD(paras_new, momentum=0.9)

for p in optimizer.param_groups:
outputs = ‘’
for k, v in p.items():
if k is ‘params’:
outputs += (k + ': ’ + str(v[0].shape).ljust(30) + ’ ')
else:
outputs += (k + ': ’ + str(v).ljust(10) + ’ ')
print(outputs)

结果为:

猜你喜欢

转载自blog.csdn.net/m0_37192554/article/details/88734392

pytorch 显示网络结构，显示优化器的设置代码，

pytorch显示网络结构

Pytorch 的网络结构

pytorch打印网络结构

pytorch Resnet 网络结构

pytorch | 打印网络结构

查看pytorch代码里面各层网络结构

解析DeepLabv3+的网络结构及代码【Pytorch版】

pytorch:定义自己的网络结构

Pytorch YOLOv3 网络结构

Pytorch 网络结构可视化

Pytorch网络结构可视化

根据网络结构采用Pytorch实现

[pytorch]网络结构查询和提取

YOLOX：pytorch实现网络结构

pytorch tensorboard模型结构显示

Faster RCNN原理及Pytorch代码解读——RPN（二）：RPN网络结构

使用pytorch，搭建VGGNet神经网络结构（附代码）

pytorch中的pretrain模型网络结构修改

Pytorch的网络结构可视化（tensorboardX）（详细）

Pytorch 模型的网络结构可视化

pytorch 更改预训练模型网络结构

pytorch获取可视化网络结构

基于Pytorch理解attention decoder网络结构

Pytorch 用cfg构建网络结构

Pytorch 模型的网络结构可视化 pytorchviz

【pytorch】实现U-Net网络结构

pytorch的summary和画网络结构图

【深度学习】U-net网络结构搭建 | pytorch

Pytorch 中打印网络结构及其参数的方法与实现

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)