pytorch框架写的bug心路历程

1、GPU内存不足错误

错误描述,我在实验室配置的电脑跑NER任务的过程中(当然数据比较大)前六轮数据是没有什么错误的,但是当到了第六轮的时候,我也一直在监控我的任务管理器的cpu和GPU的变化情况,发现GPU前几轮一直处于稳定增加的,第六轮出现忽然闪到99%,但是迅速降下来了。反正最后还是扛不住,崩掉了。 。。我还以为是自己的程序有bug,检查实在找不出, 最后我让实验室的大佬们,帮我用实验室的显卡跑一遍,毫无压力跑了1000多轮。

后续会继续更新此篇博客,今天才想到收集这些bug。。。。

猜你喜欢

转载自blog.csdn.net/annilingmo/article/details/80401179
今日推荐