CPU, GPU, FPGA计算能力 - 代码天地

CPU, GPU, FPGA计算能力

其他 2018-08-05 05:16:59 阅读次数: 0

背景

现在AI火热，带动了异构计算的发展，让GPU, FPGA这类加速芯片从辅助设备逐步进入了主流计算设备的行列，开始挑战传统CPU的绝对统治地位，那么我们为什么经常听说GPU, FPGA相对于CPU计算能力要强的多，原因是为什么呢？

芯片设计

CPU在芯片设计上，绝大部分空间其实并不属于ALU(算数逻辑单元）。CPU作为通用处理器，除了满足计算要求，为了更好的响应人机交互的应用，它要能处理复杂的条件和分支，以及任务之间的同步协调，所以芯片上需要很多空间来实现分支预测与优化(control), 保存各种状态(cache)以降低任务切换时的延时。

GPU则走了一个极端，它在芯片设计上突出计算输出最大化，几乎将所有的空间都给了ALU，所以对于AI，HPC，图形渲染这样简单粗暴的浮点矩阵运算，GPU的优势肯定就非常明显了。

峰值浮点

CPU

一颗E5 2680 V4, 14核心，3G左右频率，那么其峰值浮点能力为3X14x32(32是V4处理器支持SIMD的速算因子，即一个时钟周期内能做32次浮点计算）= 1.34Tflops.

Intel V3 Haswell架构处理器，支持AVX256, 即每个时钟周期能做(256/32)x2=16次单精度浮点，x2是因为每个时钟CPU能同时发出一次加法和一次乘法指令。

Intel V4 Broadwell支持FMA（融合乘加）指令，即a*b+c, 所以再x2=32。

Intel V5 Skylake支持AVX512, 所以再x2=64。

GPU

比如是Tesla P100, 3584个cuda core, 核心频率大概是1.5G左右，那么其峰值浮点能力为3584x1.5x2(2是GPU的FMA速算因子）= 10Tflops左右，即使是便宜多的Tesla P4, 峰值浮点也能到5Tflops。

FPGA

比如xilinx的ultrascale, 我查了下，它有1,440 个DSP based加法器，频率为 0.5G，还有6,743个Logic based的加法器，频率为0.6G，1440x0.5+6743x0.6=4.5Tflops。

价格上看, 大概可以认为，E5 2680 V4 = Tesla P4 = xilinx ultrascale，所以很清楚了。

转自：

猜你喜欢

转载自blog.csdn.net/qinghuaci666/article/details/80952625

CPU, GPU, FPGA计算能力

深度学习，CPU、GPU、DSP、FPGA运算能力对比

CPU, DSP, GPU, FPGA对比

浅析GPU计算——CPU和GPU的选择

GPU 与 CPU?什么是 GPU 计算?|NVIDIA

CPU与GPU计算耗时对比

云计算芯片、GPU、CPU

FPGA为什么比CPU和GPU快

深度学习硬件：CPU、GPU、FPGA、ASIC

FPGA与CPU、GPU、ASIC的区别，FPGA在云计算中的应用方案

GPU与CPU

CPU与GPU并行计算联系与区别

Tensorflow 之 CPU/GPU计算效率对比

CPU/GPU理论计算极限评估

高性能计算系列之四-高性能计算中FPGA,GPU和CPU

高性能计算之五-FPGA可以取代CPU和GPU？

深入理解CPU和异构计算芯片GPU/FPGA/ASIC

深入理解CPU和异构计算芯片GPU/FPGA/ASIC （下篇）

深度学习CPU，GPU，NPU，TPU以及其计算能力单位

CPU_GPU_FPGA_ARM_DSP_单片机

AI 领域 FPGA、ASIC、CPU、GPU 简单对比

什么是ASIC芯片？与CPU、GPU、FPGA相比如何？

通俗易懂讲解CPU、GPU、FPGA的特点

NVIDIA GPU 计算能力

计算机视觉之CPU和GPU

C++矩阵乘法计算 || GPU && CPU 实现

CPU+GPU异构计算编程简介

如何检测tensorflow是否使用CPU还是GPU计算

高性能计算SIMD实验CPU SIMD+GPU SIMD

GPU与CPU的区别

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)