Summit中的Power服务器的带宽计算

Summit Power服务器的带宽的计算

  • 看CPU之间的SMP的速度,SMP的单向带宽:16GT/s*32bit/8=64GB/s;
  • 看CPU和内存之间的带宽的计算,内存8通道*2666MHz*64bit/8/1000=8*21.328GB/s=170.624GB/s=166.625GiB/s
  • 看CPU和GPU之间的带宽的计算,使用了2条NVLink 2.0,单向的带宽为:25GT/s*2Link*8Lan/8=50GB/s;GPU之间的带宽也是这样的;
  • 看CPU和网卡之间的带宽,X16的PCIe Gen4=16GT/s*16bit/8*128/130=32GB/s*128b/130b=31.51GB/s
  • 看EDR的IB网卡上行的端口的带宽:100Gb/s/8=12.5GB/s;两个端口一共是25GB/s

Summit 中Power服务器的浮点性能的计算

  • 单个Power 9的处理器的,22Core,不知道频率和浮点性能,但是知道最终的双精度浮点性能是:540.3GFLOPs
  • 单个 PCIe版本的Nvidia Tesla V100,是[email protected],其理论的双精度浮点性能是:2560Core*1.245GHZ*2FLOPs/Cycle=6374.4GFLOPs=6.3TFLOPs
  • NVLink的版本的Tesla V100可能更多的核心,更好的工作频率,浮点性能是7.8TFLOPs
  • 一个计算节点,CPU的浮点性能=2*540.3GFLOPs=1080.6GFLOPs=1.08TFLOPs;GPU的浮点性能是=6*7.8=46.8TFLOPs
  • 256个机柜,每个18个计算节点,合计4608个计算节点‘;GPU算力=215PFLOPs;CPU算力=5PFLOPs,计算节点的CPU+GPU的算力达到220PFLOPs;

下图是IBM Power 服务器的逻辑结构,地址:  https://en.wikichip.org/wiki/supercomputers/summit

还有一些信息是从Power处理的页面看到的,地址:  https://en.wikichip.org/wiki/ibm/microarchitectures/power9

猜你喜欢

转载自www.cnblogs.com/kongchung/p/11931098.html