Transfomrer Benchmark3090对比3090Ti(跟李沐学AI作业简化版)

在看完李沐老师装机双卡3090Ti作为深度学习工作机的视频后,我决定装一台双卡3090的机器作为深度学习主机。本文主要进行3090和3090Ti性能的对比测试,对比一下看跟李沐老师的工作机差距有多大。
环境:
Ubuntu20.04
AMD5800 8core 16Thread
RTX3090
Pytorch1.13(gpu)
Python3.9

一. micro_bench性能展示

沐神源代码
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述

请添加图片描述
请添加图片描述

二. transformers性能展示

沐神源代码
由于目前机器只有单卡3090,MultiGPU的测试随后进行补充。
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
总结:单精度跟3090TI有一些差距(10~15%),半精度几乎无差距。

猜你喜欢

转载自blog.csdn.net/m0_46339652/article/details/129468748