跑项目怎样选择GPU,不同GPU特点总结

GPU非常重要,尽管GPU并不直接参与深度学习模型计算,但GPU需要提供大于模型训练吞吐的数据处理能力。

下面是一些GPU型号的简介:

  • Tesla P40,显存24GB,单精(FP32)11.76T,半精(FP16)11.76T,它是比较老的Pascal架构GPU,对于cuda11.x之前且对大显存有需求的算法是非常不错的选择
  • TITAN Xp,显存12GB,单精(FP32)12.15T,半精(FP16)12.15T,它是比较老的Pascal架构GPU,用作入门比较合适。
  • 1080Ti,显存11GB,单精11.34T,半精11.34T,它和TITANXp是同时代的卡,同样适合入门,但是11GB的显存偶尔会比较尴尬。
  • 2080Ti,显存11GB,单精13.45,半精53.8,它是图灵架构GPU,性能还不错,老一代型号中比较适合做混合精度计算的GPU,性价比高。
  • V100,显存16/32GB,单精15.7T,半精125T,它是老一代专业计算卡皇,半精性能高适合做混合精度计算
  • 3060,显存12GB,单精12.74T,半精约24T,如果1080Ti的显存正好尴尬,3060是不错的选择,适合新手,需要使用cuda11.x
  • A4000显存16GB,单精19.17T,半精约76T,显存和算力都比较均衡,适合进阶过程使用,需要使用cuda11.x
  • 3080Ti,显存13GB,单精34.10T,半精约70T,性能钢炮,如果对显存要求不高则非常适合的选择,需要使用cuda11.x
  • A5000,显存24GB,单精27.77T,半精约117T,性能钢炮,如果觉得3080Ti的显存不够用A5000是合适的选择,并且半精算力高适合混合精度,需要使用cuda11.x
  • 3090,显存24GB,单精35.58T,半精度约71T,可以先做3080Ti的扩显存版,性能和显存大小都非常够用,使用性非常强性价比首选,需要使用cuda11.x
  • A40,显存48GB,单精37.42T,半精149.7T,可以看做是3090的扩显存版,算力和3090基本持平,因此根据显存大小进行选择,需要使用cuda11.x
  • A100SXM4,显存40/80GB,单精19.5T,半精312T,新一代人专业计算卡皇,除了贵没缺点,显存大,非常适合做半精计算,因为有NVLinK加持,多卡并行加入比非常高,需要使用cuda11.x

猜你喜欢

转载自blog.csdn.net/m0_73939236/article/details/132042884
GPU