mmclassification测试时卡死 - 代码天地

mmclassification测试时卡死

企业开发 2023-10-01 01:30:06 阅读次数: 0

mmclassification测试时卡死

服务器：6张1080ti
系统：Ubuntu16.04
cuda：10.2
pytorch：1.8.2
mmcv-full：1.8.0+cu102
mmclassification：20220511

描述：在使用mmclassification，测试模型准确率时，发生卡死情况，从进度条看，数据全部正向推理完成，但是一直不输出最后的准确率；

解决方式

通过阅读源码，插入print语句，发现mmclassification中分布式计算需要通过collect_results_cpu函数把所有的结果收集起来，每个gpu会把结果写到临时文件夹.dist_test下，然后在rank=0时，再重新load到内存里，
通过这种方式把分散的计算结果统一起来。

进一步调试发现gpu-id=4时，无法正常保存临时结果，导致程序卡死。

通过CUDA_VISIBLE_DEVICES环境变量，把id=4的gpu屏蔽掉，只用其他5块就正常了。

总结

估计mmlab的其他工程都有类似逻辑，如果服务器gpu质量不好，均可能产生此类问题。

猜你喜欢

转载自blog.csdn.net/bcfd_yundou/article/details/124716285

mmclassification测试时卡死

hibernate 查询时卡死

eclipse 同步svn时卡死

mmclassification安装与调试

OpenMMLab MMClassification代码实战

qtspim加载文件时卡死

oracle 执行存储过程时出现卡死

oracle执行update时卡死问题

Ubuntu安装时卡死在启动界面

Tensorflow GPU训练模型时假卡死

Xcode 10 Archive 时电脑卡死

FreeRTOS 使用 printf("%f") 时卡死

Idea新建maven项目时卡死

mmclassification backbone01-AlexNet

mmclassification 标注文件生成

mmclassification训练数据准备脚本

oracle执行update时卡死问题的解决办法

VirtualBoxanzUbunto14在installation时卡死解决方式

oracle 执行update时卡死问题解决

装ubunt时出行进入界面卡死

android studio 新建或者导入项目时缓慢或卡死的问题

使用Vim、Xshell、远程终端时莫名卡死

Oracle执行update时卡死问题的解决方法

C# 串口关闭时主界面卡死原因分析

树莓派图形界面卡死时的处理

C/C++动态数组delete时卡死或报错解决

unity gradle构建失败，building gradle project时卡死

Horizon daas 租户管理平台发布桌面时卡死在90%

PyQt5 使用多个槽函数时程序卡死

解决 umount 命令卸载 CIFS 时卡死的问题

今日推荐

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

Spring Boot 3.0：未来企业应用开发的基石

Java 的 AI 前景光明

国内首个智能体生态大会！2024百度万象大会定档5月30日

开源一周年，青语言新版发布

深入浅出：大型语言模型（LLM）的全面解读

顶会ICLR2024论文Time-LLM：基于大语言模型的时间序列预测

周排行

学习笔记(01):Python入门教程-计算机如何区分数字和字符

命令行提示符_颜色

五步轻松搞定Linux下的文件同步(备份)

Visio 2010，如何打开多个窗口

西安新起点|MBA考研十大热门城市

BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation

【蓝桥杯】ADV-73 数组输出

[DeeplearningAI笔记]卷积神经网络4.11一维和三维卷积

Java 逻辑运算符

Python爬虫入门——2. 5 利用正则表达式爬取豆瓣电影 Top 250

每日归档

更多

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)