溫馨提示×

在Ubuntu下如何設(shè)置Slurm

小樊
104
2024-08-16 02:14:40
欄目: 智能運維

在Ubuntu系統(tǒng)中設(shè)置Slurm可以按照以下步驟操作:

  1. 安裝Slurm軟件包:在終端中運行以下命令安裝Slurm軟件包。
sudo apt update
sudo apt install slurm-llnl
  1. 配置Slurm集群:編輯Slurm配置文件/etc/slurm-llnl/slurm.conf,配置集群節(jié)點和參數(shù)。根據(jù)實際情況修改以下參數(shù):
ControlMachine=master
NodeName=compute-0-[0-1] Procs=4
PartitionName=normal Nodes=compute-0-[0-1] Default=Yes
  1. 啟動Slurm服務:在終端中運行以下命令啟動Slurm服務。
sudo systemctl start slurmd
sudo systemctl start slurmctld
  1. 驗證Slurm配置:運行以下命令驗證Slurm集群的配置。
sinfo
scontrol show nodes

如果能夠顯示節(jié)點信息,說明Slurm已成功設(shè)置。

  1. 配置用戶權(quán)限:編輯/etc/slurm-llnl/slurm.conf文件,配置用戶權(quán)限和賬號。根據(jù)實際情況添加以下參數(shù):
AccountingStorageType=accounting_storage/none
AccountingStoreEvents=NONE
JobAcctGatherType=jobacct_gather/none
  1. 重啟Slurm服務:在終端中運行以下命令重啟Slurm服務。
sudo systemctl restart slurmd
sudo systemctl restart slurmctld

完成以上步驟后,Slurm集群將在Ubuntu系統(tǒng)中成功設(shè)置并運行。

0