Summit Power服务器的带宽的计算
- 看CPU之间的SMP的速度,SMP的单向带宽:16GT/s*32bit/8=64GB/s;
- 看CPU和内存之间的带宽的计算,内存8通道*2666MHz*64bit/8/1000=8*21.328GB/s=170.624GB/s=166.625GiB/s
- 看CPU和GPU之间的带宽的计算,使用了2条NVLink 2.0,单向的带宽为:25GT/s*2Link*8Lan/8=50GB/s;GPU之间的带宽也是这样的;
- 看CPU和网卡之间的带宽,X16的PCIe Gen4=16GT/s*16bit/8*128/130=32GB/s*128b/130b=31.51GB/s
- 看EDR的IB网卡上行的端口的带宽:100Gb/s/8=12.5GB/s;两个端口一共是25GB/s
Summit 中Power服务器的浮点性能的计算
- 单个Power 9的处理器的,22Core,不知道频率和浮点性能,但是知道最终的双精度浮点性能是:540.3GFLOPs
- 单个 PCIe版本的Nvidia Tesla V100,是[email protected],其理论的双精度浮点性能是:2560Core*1.245GHZ*2FLOPs/Cycle=6374.4GFLOPs=6.3TFLOPs
- NVLink的版本的Tesla V100可能更多的核心,更好的工作频率,浮点性能是7.8TFLOPs
- 一个计算节点,CPU的浮点性能=2*540.3GFLOPs=1080.6GFLOPs=1.08TFLOPs;GPU的浮点性能是=6*7.8=46.8TFLOPs
- 256个机柜,每个18个计算节点,合计4608个计算节点‘;GPU算力=215PFLOPs;CPU算力=5PFLOPs,计算节点的CPU+GPU的算力达到220PFLOPs;
下图是IBM Power 服务器的逻辑结构,地址: https://en.wikichip.org/wiki/supercomputers/summit
还有一些信息是从Power处理的页面看到的,地址: https://en.wikichip.org/wiki/ibm/microarchitectures/power9