La lista de parámetros de GPU NVDIA más completa del mundo: V100, A100, A800, H100, 3090, 4090, A40, A30 y otros parámetros de rendimiento

-1) GeForce RTX 4090

GeForce RTX 4090

Especificaciones del motor GPU: Recuento de núcleos NVIDIA CUDA® 16384
Frecuencia de aceleración (GHz) 2.52
Frecuencia básica (GHz) 2.23
Especificaciones de la memoria: Configuración de memoria estándar 24 GB GDDR6X
ancho de banda de memoria 384 bits
Apoyo técnico: Núcleo de trazado de rayos 3ra generación
Núcleos tensoriales 4ta generación
Arquitectura NVIDIA hay lovelace
Soporta  NVIDIA DLSS 3
Compatibilidad con  NVIDIA Reflex
Admite  transmisión de NVIDIA
Soporta PCI Express Gen 4
Soporte BAR de tamaño variable
Compatible con  NVIDIA® GeForce Experience™
Soporte para  NVIDIA Ansel
Admite estilo libre de NVIDIA
Compatibilidad con  NVIDIA ShadowPlay
Soporte para aspectos destacados de NVIDIA
Soporta  NVIDIA G-SYNC®
Controlador listo para jugar
Compatibilidad con  el controlador NVIDIA Studio
Omniverso de NVIDIA
Compatible con  Microsoft DirectX® 12 Ultimate
Admite NVIDIA GPU Boost™
Compatible con NVIDIA NVLink™ (listo para SLI) No
Compatibilidad con API Vulkan RT, OpenGL 4.6
Codificador NVIDIA (NVENC) 2x octava generación
Códec NVIDIA (NVDEC) 5ta generación
codificación AV1
decodificación AV1
compatible con CUDA 8.9
Soporte  VR listo
Soporte de pantalla: La resolución digital y frecuencia de actualización más altas (1) 4K 240Hz o con el soporte de la tecnología DSC, muestra el efecto HDR 8K 60Hz
Interfaz de pantalla estándar HDMI(2), 3x DisplayPort(3)
Número de monitores múltiples admitidos 4(5)
HDCP 2.3
Tamaño de la tarjeta gráfica: longitud 304mm
ancho 137mm
ranura 3 ranuras (61 mm)
Especificaciones de temperatura y potencia: Temperatura máxima de la GPU (°C) 90
Potencia de la tarjeta gráfica (W) 450W
Potencia necesaria del sistema (W) (4) 850W
Interfaz de alimentación auxiliar 3 cables adaptadores PCIe de 8 pines (adaptador incluido) o
1 cable de alimentación de interfaz PCIe Gen 5 compatible con 450 W y potencia nominal superior

0) Tarjeta gráfica GeForce RTX 3090, ¿parece que no hay datos de precisión simple o doble?

GeForce RTX 3090 Ti GeForce RTX 3090
Especificaciones del motor GPU: Recuento de núcleos NVIDIA CUDA® 10752 10496
Frecuencia de aceleración (GHz) 1.86 1.70
Frecuencia básica (GHz) 1.67 1.40
Especificaciones de la memoria: Configuración de memoria estándar 24 GB GDDR6X 24 GB GDDR6X
ancho de banda de memoria 384 bits 384 bits
Apoyo técnico: Núcleo RT 2da generación 2da generación
Núcleos tensoriales 3ra generación 3ra generación
Arquitectura NVIDIA Amperio Amperio
Microsoft DirectX® 12 último
NVIDIA DLSS
reflejo de NVIDIA
Difusión de NVIDIA
PCI Express Generación 4
BARRA redimensionable
Experiencia NVIDIA® GeForce™
Ansel NVIDIA
Estilo libre de NVIDIA
NVIDIA ShadowPlay
Aspectos destacados de NVIDIA
NVIDIA G-SYNC®
Compatibilidad con controladores Game Ready
Controlador NVIDIA Studio
Omniverso de NVIDIA
NVIDIA GPU Boost™
NVIDIA NVLink™ (SLI-Ready)
Vulkan RT API、OpenGL 4.6
HDMI 2.1
DisplayPort 1.4a
NVIDIA 编码器 第 7 代 第 7 代
NVIDIA 解码器 第 5 代 第 5 代
CUDA 能力 8.6 8.6
VR Ready
显示支持: 最高数字分辨率 (1) 7680x4320 7680x4320
标准显示器接口 HDMI(2), 3x DisplayPort(3) HDMI(2), 3x DisplayPort(3)
可支持的多显示器数 4 4
HDCP 2.3 2.3
Founders Edition 显卡尺寸: 长度 12.3" (313 mm) 12.3" (313 mm)
宽度 5.4" (138 mm) 5.4" (138 mm)
高度 3 插槽 3 插槽
Founders Edition 热功率规格: 最高 GPU 温度 (℃) 92 93
显卡功率 (W) 450 350
推荐系统功率 (W) (2) 850 750
辅助电源接口 3 个 PCIe 8-Pin 辅助供电接口(盒装适配器)或负载可达 450W 或更高的第五代 PCIe 接口 2 个 PCIe 8-Pin 接口

1)

A40:

The NVIDIA A40 accelerates the most demanding visual computing workloads from the data center, combining the latest NVIDIA Ampere architecture RT Cores, Tensor Cores, and CUDA® Cores with 48 GB of graphics memory. From powerful virtual workstations accessible from anywhere to dedicated render nodes, NVIDIA A40 brings nextgeneration NVIDIA RTX™ technology to the data center for the most advanced professional visualization workloads.

居然没有单双精度。

带宽也不行。

2)

A30:

Built for AI inference at scale, the same compute resource can rapidly re-train AI models with TF32, as well as accelerate high-performance computing (HPC) applications using FP64 Tensor Cores. Multi-Instance GPU (MIG) and FP64 Tensor Cores combine with fast 933 gigabytes per second (GB/s) of memory bandwidth in a low 165W power envelope, all running on a PCIe card optimal for mainstream servers.

 3)A100

 NVIDIA A100 GPU采用全新Ampere安培架构的超大核心GA100,7nm工艺,542亿晶体管,826平方毫米面积,6912个核心,搭载5120-bit 40/80GB HBM2显存,带宽近1.6TB/s,功耗400W。

NVIDIA A100 Tensor Core GPU 可在各个规模下为 AI、数据分析 和高性能计算(HPC)应用提供出色的加速性能,为全球的 高性能弹性数据中心提供强劲助力。作为 NVIDIA 数据中心平台 的引擎,与前一代 NVIDIA Volta™ 相比,A100 可使性能提升高达 20 倍。A100 可高效扩展,也可借助多实例 GPU (MIG)技术划分 为 7 个独立的 GPU 实例,从而提供统一的平台,助力弹性数据中 心根据不断变化的工作负载需求动态进行调整。 NVIDIA A100 Tensor Core 技术支持广泛的数学精度,可针对每个 工作负载提供单个加速器。最新一代 A100 80GB 将 GPU 显存 加倍,提供 2TB/s 的全球超快显存带宽,可加速处理超大型模型 和海量数据集。 A100 是完整 NVIDIA 数据中心解决方案的一部分,该解决方案由 硬件、网络、软件、库以及 NGC™ 目录中经优化的 AI 模型和 应用等叠加而成。作为适用于数据中心且功能强大的端到端 AI 和 HPC 平台,A100 可助力研究人员获得真实的结果,并能将解决 方案大规模部署到生产环境中。

可惜不让在中国卖,万恶的鬼佬。

 4)V100

La GPU NVIDIA® V100 Tensor Core es un potente acelerador para el aprendizaje profundo, el aprendizaje automático, la informática de alto rendimiento (HPC) y la informática gráfica. Impulsada por la arquitectura NVIDIA Volta™, la GPU V100 Tensor Core puede ofrecer el rendimiento de casi 32 CPU en una sola GPU, lo que permite a los investigadores abordar desafíos que antes eran inaccesibles. El V100 ya superó MLPerf, el primer punto de referencia de IA de la industria, lo que demuestra que es la plataforma informática más poderosa del mundo con escalabilidad y versatilidad masivas.

No peor que A100, pero mejor que A30.

Los cerebros estadounidenses también son divertidos.

5)A800

 NVIDIA lanzará una nueva GPU A800 para usuarios chinos para reemplazar la A100, que está en línea con la política de control de exportaciones del gobierno de EE. UU. De acuerdo con la política del gobierno de EE. UU., la velocidad de transferencia de datos de los chips para exportación no debe exceder los 600 GB/s, y NVIDIA A800 se establece en 400 GB/s. Pero otras especificaciones no están claras, como la cantidad de núcleos, la frecuencia de funcionamiento, la memoria de video, el consumo de energía, etc.

, Nvidia y AMD dijeron que los productos que incluyen los chips de centro de datos A100 y H100 de Nvidia fueron incluidos en la lista de control de exportación del Departamento de Comercio de EE. UU.

Y según Nvidia, el nuevo A800 puede reemplazar al A100, los cuales son procesadores GPU (unidad de procesamiento de gráficos). Según la información de la GPU NVIDIA A800 presentada por el sitio web oficial del distribuidor de chips OMNISKY Rongtian, la tasa de transferencia de datos del nuevo chip es de 400 GB por segundo, que es inferior a los 600 GB por segundo de A100, lo que representa una disminución significativa en el rendimiento. del centro de datos. Además, el A800 admite un ancho de banda de memoria de hasta 2 TB/s, con pocos cambios en otros parámetros.

6) H100 despiezado

NVIDIA H100 es parte de una plataforma general de centro de datos de NVIDIA para IA, HPC y análisis de construcción de datos, aceleración de plataforma

Más de 3000 aplicaciones y los datos son ubicuos desde el centro hasta el perímetro, al mismo tiempo que brinda ganancias significativas en el rendimiento y oportunidades de ahorro de costos.

¡El rendimiento de doble precisión alcanzó los 34TFlops! Dios

¡FP16 alcanza 2TFlops, indirectamente un monstruo de IA!

El ancho de banda de acceso a la memoria alcanza los 3,35 TB

El ancho de banda de NVLINK alcanza los 900 GB/s, omg  

Supongo que te gusta

Origin blog.csdn.net/anlongstar/article/details/128004074
Recomendado
Clasificación