[Tutorial] Ver la topología y la información del sistema de la arquitectura de CPU y GPU

Indique la fuente al reimprimir: Big Bang Life de Senior Xiaofeng [xfxuezhang.cn]

algunos conceptos

  • Paquete : paquete de procesador. En un sistema multiprocesador, cada chip de CPU físico generalmente se empaqueta en un paquete separado, que se denomina Paquete. Un paquete puede contener uno o más núcleos de CPU físicos. Cada paquete suele estar conectado a uno o más controladores de memoria para proporcionar acceso a la memoria del sistema.
  • Nodo NUMA : nodo NUMA. NUMANode es un concepto importante en la arquitectura NUMA. En la arquitectura NUMA, la memoria del sistema se divide en varios nodos NUMA. Cada nodo NUMA contiene una parte de la memoria del sistema y un conjunto de núcleos de CPU asociados. Un nodo NUMA es una combinación lógica de procesadores y memoria que comparten ciertos recursos físicos, como controladores de memoria y cachés.
  • Enchufe : enchufe. Por lo general, se usa para describir el zócalo o el zócalo de un chip de CPU físico , que es la interfaz física en la placa base donde se inserta el chip de CPU. Los PC domésticos suelen tener un único zócalo y los servidores suelen admitir 2 zócalos, pero también 4 u 8 zócalos. Los diferentes enchufes suelen estar conectados por un bus de alta velocidad.
  • Afinidad NUMA : Afinidad NUMA. Hace referencia a la capacidad de asociar una tarea o proceso con un nodo NUMA específico . Al configurar la afinidad NUMA, puede especificar que las tareas se ejecuten en nodos NUMA específicos para minimizar el acceso a la memoria remota y mejorar el rendimiento. Cuando una tarea está asociada con un nodo NUMA en particular, es más probable que use la memoria local asociada con ese nodo. La memoria local es la memoria asociada con una CPU en el mismo nodo NUMA en el que se ejecuta la tarea. Este acceso a la memoria local es más rápido porque está conectado directamente a la CPU, mientras que el acceso a la memoria remota debe accederse a través de la interconexión de memoria entre nodos, que es más lento.
  • Afinidad de CPU : afinidad de CPU. Hace referencia a la capacidad de asociar tareas o procesos informáticos específicos con núcleos de CPU o grupos de CPU específicos . Se utiliza para especificar qué núcleo de CPU o grupo de núcleos de CPU asignar a la tarea a ejecutar. Al configurar CPU Affinity, puede controlar cómo se programan y ejecutan las tareas en un sistema multinúcleo para optimizar el rendimiento o satisfacer necesidades específicas.
  • Root Complex : un puente de host de nivel superior en una estructura de bus PCIe . Por lo general, se encuentra en el chip de la CPU y es responsable de conectar la CPU con otros dispositivos, como GPU, tarjeta de red, controlador de almacenamiento, etc. El complejo raíz es el punto de partida de toda la jerarquía de bus PCIe, que se conecta a otros dispositivos o puentes a través de PCIe para formar una red PCIe extendida. El complejo raíz actúa como controlador del bus PCIe, que gestiona y coordina la interacción de los flujos de datos a través del bus PCIe. Es responsable de la transferencia de datos y la comunicación entre diferentes dispositivos PCIe, así como del manejo de la asignación de direcciones y las solicitudes de DMA (Acceso directo a la memoria).

  • PCIe : es un estándar de bus de expansión en serie de alta velocidad que se utiliza para conectar varios dispositivos externos y tarjetas de expansión en un sistema informático. Es una evolución y sustitución del bus PCI. El bus PCIe utiliza transmisión de datos en serie, que tiene un mayor ancho de banda y una latencia más baja que el bus PCI transmitido en paralelo. Es un estándar de conexión de uso común en los sistemas informáticos modernos y se utiliza para conectar varios dispositivos, como GPU, adaptadores de red, controladores de almacenamiento, tarjetas de sonido, etc. El estándar PCIe define diferentes tamaños y versiones de ranuras físicas, como PCIe x1, PCIe x4, PCIe x8 y PCIe x16, que representan diferentes cantidades de carriles físicos y anchos de banda. PCIe también admite enlaces multigeneracionales y topologías de varios niveles para necesidades de mayor rendimiento y configuraciones del sistema.

Topología

  • Compruebe la cantidad de nodos NUMA, sockets, núcleos, núcleos por socket, subprocesos por núcleo, etc.
lscpu

Por lo tanto, hay 2 ranuras físicas + 2 CPU, y cada CPU se inserta en una ranura. Cada CPU tiene 20 núcleos y cada núcleo tiene 2 hiperprocesos. El modelo de placa base es Intel y NUDA utiliza un método de numeración en serie, y cada nodo NUMA se asigna a 2 grupos de núcleos de CPU.

  • Ver topología de GPU
nvidia-smi topo -m

Por lo tanto, GPU0, GPU1 y GPU2 están conectados al mismo conmutador PCIe; GPU3, NIC0 y NIC1 están conectados a otro conmutador PCIe. Además, los dos conmutadores PCIe están conectados bajo los dos complejos raíz de la misma CPU;

  • Ver información de la GPU
nvidia-smi

  • Ver la versión PCIe de la GPU
nvidia-smi -q

  • Ver conexiones de hardware
sudo apt install hwloc
lstopo

Mensaje del sistema

sudo apt install hardinfo
hardinfo

Puede ver diversa información de hardware del sistema.

Supongo que te gusta

Origin blog.csdn.net/sxf1061700625/article/details/131887534
Recomendado
Clasificación