Pytorch学习0.01:cudnn.benchmark= True的设置 - 代码天地

Pytorch学习0.01:cudnn.benchmark= True的设置

其他 2019-11-26 22:34:11 阅读次数: 0

设置这个 flag 可以让内置的 cuDNN 的 auto-tuner 自动寻找最适合当前配置的高效算法，来达到优化运行效率的问题。

应该遵循以下准则：

如果网络的输入数据维度或类型上变化不大，也就是每次训练的图像尺寸都是一样的时候，设置 torch.backends.cudnn.benchmark = true 可以增加运行效率；
如果网络的输入数据在每次 iteration 都变化的话，会导致 cnDNN 每次都会去寻找一遍最优配置，这样反而会降低运行效率。

torch.backends.cudnn.benchmark = true

不知道为什么好多人写dropout和batchnormalization，这个只要稍微理解他们的原理就明白肯定要对train的值进行判断的，train值的功能目前也仅限于这两个层，对于别的层来说，train(True)和train(False)是没有任何区别的。而输入变量的volatile这个确实是个小坑，不光能加快速度，还可以大大减小内存开销。

有几条小技巧分享一下：

torch.backends.cudnn.benchmark = True 在程序刚开始加这条语句可以提升一点训练速度，没什么额外开销。我一般都会加有时候可能是因为每次迭代都会引入点临时变量，会导致训练速度越来越慢，基本呈线性增长。

2.开发人员还不清楚原因，但如果周期性的使用torch.cuda.empty_cache()的话就可以解决这个问题。这个命令是清除没用的临时变量的。torchvision.transforms里的各种坑，等有空再说。

作者：功长真金
链接：https://www.zhihu.com/question/67209417/answer/303290223
来源：知乎

猜你喜欢

转载自www.cnblogs.com/captain-dl/p/11938864.html

Pytorch学习0.01:cudnn.benchmark= True的设置

pytorch: cudnn.benchmark=True

[转载]什么情况下应该设置 cudnn.benchmark = True？

【pytorch】cudnn.benchmark和cudnn.deterministic

pytorch中cudnn.benchmark和cudnn.deterministic的作用

torch.backends.cudnn.benchmark = true

torch.backends.cudnn.benchmark = true何时使用

设置 "fielddata": true

pytorch torch.backends.cudnn设置作用

(Android) RadioButton设置setCheck（true）无效

dev控件ASPxComboBox设置ReadOnly="true"后

（原创）RadioButton设置setChecked(true)的异常

true

python学习——while True的用法

'true'!=True

查看pytorch cuda cudnn的方式 & cuda 环境变量设置

怎么将cookie中httponly属性设置为true

连接数据库超时设置autoReconnect=true

solrj 对应 multiValued="true"情况，@Field必须设置

webwork.devMode设置为true会报ognl异常原因

TextBox ReadOnly 设置为 true 的时候后台无法取值的问题

xadmin下设置“use_bootswatch = True”无效的原因

Hibernate设置布尔型字段默认值为True

mybatis进行批量操作时的需要设置allowMultiQueries=true

RocketMQ4.3.X关于设置useEpollNativeSelector = true报错问题

调用 close 函数，设置了 SO_LINGER 为 true

eureka设置healthCheck为true后报NoClassDefFoundError

将v-if设置为true为何获取不到元素

android里面RadioButton设置setChecked(true)失效的解决方案

MySQL数据库字段设置true和false类型

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)