Самый полный в мире список параметров GPU NVDIA: V100, A100, A800, H100, 3090, 4090, A40, A30 и другие параметры производительности.

-1)GeForce RTX 4090

GeForce RTX 4090

Технические характеристики графического процессора: Количество ядер NVIDIA CUDA® 16384
Частота ускорения (ГГц) 2,52
Базовая частота (ГГц) 2,23
Спецификации памяти: Стандартная конфигурация памяти 24 ГБ GDDR6X
пропускная способность памяти 384 бита
Техническая поддержка: Ядро трассировки лучей 3-е поколение
Тензорные ядра 4-е поколение
Архитектура NVIDIA Есть Лавлейс
Поддерживает  NVIDIA DLSS 3
Поддержка  NVIDIA Reflex да
Поддержка  вещания NVIDIA да
Поддерживает PCI Express четвертого поколения. да
Поддержка изменяемого размера BAR да
Поддерживает  NVIDIA® GeForce Experience™ да
Поддержка  NVIDIA Ансель да
Поддерживает NVIDIA FreeStyle. да
Поддержка  NVIDIA ShadowPlay да
Поддержка NVIDIA Highlights да
Поддерживает  NVIDIA G-SYNC® да
Готовый к игре драйвер да
Поддержка  драйвера NVIDIA Studio да
Вселенная NVIDIA да
Поддерживает  Microsoft DirectX® 12 Ultimate да
Поддерживает NVIDIA GPU Boost™ да
Поддерживает NVIDIA NVLink™ (SLI-Ready) нет
Поддержка Vulkan RT API, OpenGL 4.6 да
Кодировщик NVIDIA (NVENC) 2x 8-го поколения
Кодек NVIDIA (NVDEC) 5-е поколение
Кодировка AV1 да
Декодирование AV1 да
CUDA-совместимый 8,9
Поддержка  VR Готов да
Поддержка дисплея: Самое высокое цифровое разрешение и частота обновления (1) 4K 240 Гц или с поддержкой технологии DSC, отображение 8K 60 Гц с эффектом HDR
Стандартный интерфейс дисплея HDMI(2), 3x DisplayPort(3)
Количество поддерживаемых мультимониторов 4(5)
HDCP 2.3
Размер видеокарты: длина 304 мм
ширина 137 мм
слот 3 слота (61 мм)
Характеристики температуры и мощности: Максимальная температура графического процессора (°C) 90
Мощность видеокарты (Вт) 450 Вт
Требуемая мощность системы (Вт) (4) 850 Вт
Вспомогательный интерфейс питания 3 8-контактных кабеля адаптера PCIe (адаптер входит в комплект) или
1 кабель питания интерфейса PCIe Gen 5 с номинальной мощностью 450 Вт и выше

0) Видеокарта GeForce RTX 3090, вроде нет данных одинарной или двойной точности?

GeForce RTX 3090 Ti GeForce RTX 3090
Технические характеристики графического процессора: Количество ядер NVIDIA CUDA® 10752 10496
Частота ускорения (ГГц) 1,86 1,70
Базовая частота (ГГц) 1,67 1,40
Спецификации памяти: Стандартная конфигурация памяти 24 ГБ GDDR6X 24 ГБ GDDR6X
пропускная способность памяти 384 бита 384 бита
Техническая поддержка: Ядро РТ 2-е поколение 2-е поколение
Тензорные ядра 3-е поколение 3-е поколение
Архитектура NVIDIA Ампер Ампер
Microsoft DirectX® 12 Максимальная да да
NVIDIA DLSS да да
NVIDIA Рефлекс да да
Трансляция NVIDIA да да
PCI Express поколения 4 да да
Изменяемый размер BAR да да
NVIDIA® GeForce Experience™ да да
NVIDIA Ансель да да
NVIDIA FreeStyle да да
NVIDIA ShadowPlay да да
Основные характеристики NVIDIA да да
NVIDIA G-SYNC® да да
Поддержка драйверов Game Ready да да
Драйвер NVIDIA Studio да да
Вселенная NVIDIA да да
NVIDIA GPU Boost™
NVIDIA NVLink™ (SLI-Ready)
Vulkan RT API、OpenGL 4.6
HDMI 2.1
DisplayPort 1.4a
NVIDIA 编码器 第 7 代 第 7 代
NVIDIA 解码器 第 5 代 第 5 代
CUDA 能力 8.6 8.6
VR Ready
显示支持: 最高数字分辨率 (1) 7680x4320 7680x4320
标准显示器接口 HDMI(2), 3x DisplayPort(3) HDMI(2), 3x DisplayPort(3)
可支持的多显示器数 4 4
HDCP 2.3 2.3
Founders Edition 显卡尺寸: 长度 12.3" (313 mm) 12.3" (313 mm)
宽度 5.4" (138 mm) 5.4" (138 mm)
高度 3 插槽 3 插槽
Founders Edition 热功率规格: 最高 GPU 温度 (℃) 92 93
显卡功率 (W) 450 350
推荐系统功率 (W) (2) 850 750
辅助电源接口 3 个 PCIe 8-Pin 辅助供电接口(盒装适配器)或负载可达 450W 或更高的第五代 PCIe 接口 2 个 PCIe 8-Pin 接口

1)

A40:

The NVIDIA A40 accelerates the most demanding visual computing workloads from the data center, combining the latest NVIDIA Ampere architecture RT Cores, Tensor Cores, and CUDA® Cores with 48 GB of graphics memory. From powerful virtual workstations accessible from anywhere to dedicated render nodes, NVIDIA A40 brings nextgeneration NVIDIA RTX™ technology to the data center for the most advanced professional visualization workloads.

居然没有单双精度。

带宽也不行。

2)

A30:

Built for AI inference at scale, the same compute resource can rapidly re-train AI models with TF32, as well as accelerate high-performance computing (HPC) applications using FP64 Tensor Cores. Multi-Instance GPU (MIG) and FP64 Tensor Cores combine with fast 933 gigabytes per second (GB/s) of memory bandwidth in a low 165W power envelope, all running on a PCIe card optimal for mainstream servers.

 3)A100

 NVIDIA A100 GPU采用全新Ampere安培架构的超大核心GA100,7nm工艺,542亿晶体管,826平方毫米面积,6912个核心,搭载5120-bit 40/80GB HBM2显存,带宽近1.6TB/s,功耗400W。

NVIDIA A100 Tensor Core GPU 可在各个规模下为 AI、数据分析 和高性能计算(HPC)应用提供出色的加速性能,为全球的 高性能弹性数据中心提供强劲助力。作为 NVIDIA 数据中心平台 的引擎,与前一代 NVIDIA Volta™ 相比,A100 可使性能提升高达 20 倍。A100 可高效扩展,也可借助多实例 GPU (MIG)技术划分 为 7 个独立的 GPU 实例,从而提供统一的平台,助力弹性数据中 心根据不断变化的工作负载需求动态进行调整。 NVIDIA A100 Tensor Core 技术支持广泛的数学精度,可针对每个 工作负载提供单个加速器。最新一代 A100 80GB 将 GPU 显存 加倍,提供 2TB/s 的全球超快显存带宽,可加速处理超大型模型 和海量数据集。 A100 是完整 NVIDIA 数据中心解决方案的一部分,该解决方案由 硬件、网络、软件、库以及 NGC™ 目录中经优化的 AI 模型和 应用等叠加而成。作为适用于数据中心且功能强大的端到端 AI 和 HPC 平台,A100 可助力研究人员获得真实的结果,并能将解决 方案大规模部署到生产环境中。

可惜不让在中国卖,万恶的鬼佬。

 4)V100

Графический процессор NVIDIA® V100 с тензорными ядрами — это мощный ускоритель для глубокого обучения, машинного обучения, высокопроизводительных вычислений (HPC) и графических вычислений. Основанный на архитектуре NVIDIA Volta™, графический процессор V100 с тензорными ядрами может обеспечить производительность почти 32 процессоров в одном графическом процессоре, позволяя исследователям решать ранее недоступные задачи. V100 уже превзошел MLPerf, первый в отрасли эталонный тест искусственного интеллекта, доказав, что это самая мощная вычислительная платформа в мире с высокой масштабируемостью и универсальностью.

Не хуже А100, но лучше А30.

Американские мозги тоже забавные

5)А800

 NVIDIA выпустит новый графический процессор A800 для китайских пользователей взамен A100, что соответствует политике экспортного контроля правительства США. Согласно политике правительства США, скорость передачи данных чипов на экспорт не должна превышать 600ГБ/с, а NVIDIA A800 установлена ​​на уровне 400ГБ/с. Но неясны другие характеристики, такие как количество ядер, рабочая частота, видеопамять, энергопотребление и т.д.

, Nvidia и AMD заявили, что продукты, включая чипы Nvidia для центров обработки данных A100 и H100, были включены в список экспортного контроля Министерства торговли США.

И, по словам Nvidia, новый A800 может заменить A100, оба из которых являются процессорами GPU (графический процессор). Согласно информации о графическом процессоре NVIDIA A800, представленной на официальном сайте дилера чипов OMNISKY Rongtian, скорость передачи данных нового чипа составляет 400 ГБ в секунду, что ниже, чем 600 ГБ в секунду у A100, что представляет собой значительное снижение производительности. центра обработки данных. Более того, A800 поддерживает пропускную способность памяти до 2 ТБ/с при незначительном изменении других параметров.

6) Взорванный H100

NVIDIA H100 является частью общей платформы центра обработки данных NVIDIA для искусственного интеллекта, высокопроизводительных вычислений и анализа построения данных, ускорения платформы.

Более 3000 приложений и данных, которые распространяются от центра до периферии, обеспечивая при этом значительный прирост производительности и возможности экономии средств.

Производительность двойной точности достигла 34TFlops! Бог

FP16 достигает 2TFlops, косвенно монстр ИИ!

Пропускная способность доступа к памяти достигает 3,35 ТБ

Пропускная способность NVLINK достигает 900 ГБ/с, боже мой  

Guess you like

Origin blog.csdn.net/anlongstar/article/details/128004074