Slurm에 있는 클러스터 구성 파일의 slurm_node.conf

1. slurm_node.conf 소개

        slurm_node.conf는 Slurm 클러스터의 노드 구성 파일이며 클러스터 노드에 대한 정보 및 설정을 포함합니다. 노드별 정보를 구성하려면 각 노드에 slurm_node.conf 파일이 있어야 합니다. 이 파일은 일반적으로 노드의 /etc 디렉터리에 있지만 노드 구성 파일의 위치는 slurm.conf 파일에서 NodeName 속성을 설정하여 지정할 수 있습니다. 

        slurm_node.conf 파일에는 노드 이름, IP 주소, 아키텍처 유형, CPU 코어 수, 메모리 용량, GPU 유형 및 번호 등과 같은 노드의 많은 구성 정보가 포함되어 있습니다. 이 정보는 Slurm 관리자(slurmctld)에서 작업 및 리소스를 할당하고 노드에서 작업을 실행하는 데 사용됩니다. 따라서 Slurm 클러스터의 정상적인 동작을 위해서는 slurm_node.conf 파일에 노드 정보를 올바르게 설정하는 것이 매우 중요합니다.

        또한 slurm_node.conf 파일에는 노드에서 작업을 실행할 때 다른 특정 구성을 지정하는 다른 사용자 지정 속성이 포함될 수 있습니다. 예를 들어 slurm_node.conf 파일에서 PartitionName 속성을 설정하여 노드가 속한 파티션을 지정하고 노드의 유휴 임계값(IdleProcs) 및 최대 작업 수(MaxJobs)와 같은 속성을 설정할 수 있습니다. 이러한 속성은 일반적으로 Slurm 클러스터의 리소스 활용을 더욱 최적화하도록 설정됩니다.

2. Slurm_node.conf 구성 항목

slurm 노드 구성 파일 slurm_node.conf에는 각 노드의 구성 정보가 포함되어 있습니다. 다음은 몇 가지 일반적인 구성 항목입니다.

NodeName : 노드의 이름으로, 고유해야 하며 slurm.conf 파일의 노드 이름과 동일해야 합니다.

소켓 : 노드의 CPU 소켓 수입니다.

CoresPerSocket : 각 CPU 소켓의 코어 수입니다.

ThreadsPerCore : 각 코어의 스레드 수입니다.

RealMemory : 노드의 실제 메모리 양(MB)입니다.

상태 : 노드 상태, 일반적으로 UNKNOWN, IDLE, MIXED 또는 ALLOCATED.

Weight : 스케줄 결정에 사용되는 노드의 가중치.

PartitionName : 노드가 속한 파티션의 이름입니다.

기능 : CPU 모델, GPU 유형, 네트워크 속도 등과 같은 노드의 기능 또는 레이블입니다.

IdleProcs : 노드의 유휴 프로세스 수입니다.

MaxTasksPerNode : 노드에서 동시에 실행할 수 있는 최대 작업 수입니다.

Gres : GPU, FPGA 등 노드의 일반 리소스

위는 몇 가지 일반적인 slurm_node.conf 구성 항목이며 다른 클러스터 및 노드 구성은 다를 수 있습니다. slurm_node.conf 파일을 수정한 후 적용하려면 slurmd 데몬 프로세스를 다시 시작해야 합니다 .

아래 그림과 같이 구성된 slurm_node.conf에 대한 정보를 구성합니다.

추천

출처blog.csdn.net/lovebaby1689/article/details/129882234