热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

slurm安装使用(centos7)

1、准备3台机器并设置hostsecho192.168.108.138m1>>etchostsecho192.168.108.139s2>>

1、准备3台 机器 并设置 hosts

echo 192.168.108.138 m1 >> /etc/hosts
echo 192.168.108.139 s2 >> /etc/hosts

echo 192.168.108.140 s3 >> /etc/hosts

echo $hostname > /etc/hostname

hostnamectl set-hostname $hostname

2、创建slurm 用户(id 一定要是 412)

export SLURMUSER=412 
groupadd -g $SLURMUSER slurm 

useradd -m -c "SLURM workload manager" -d /var/lib/slurm -u $SLURMUSER -g slurm -s /bin/bash slurm

id slurm

3、 关闭防火墙 SElinux

systemctl stop firewalld
systemctl disable firewalld
 vim /etc/selinux/config  中 SELINUX=disabled  永久需重启

setenforce 0

4、安装ohpc 源

yum install http://build.openhpc.community/OpenHPC:/1.3/CentOS_7/x86_64/ohpc-release-1.3-1.el7.x86_64.rpm

5、安装依赖

yum install openssl openssl-devel pam-devel numactl numactl-devel hwloc hwloc-devel lua lua-devel readline-devel rrdtool-devel ncurses-devel man2html libibmad libibumad -y

6、安装server 端(m1 机器)

yum -y install ohpc-slurm-server
vim  /etc/slurm/slurm.conf

COntrolMachine=m1
###***  CPUs=1 = Sockets*CoresPerSocket*ThreadsPerCore
NodeName=m1,s[2-3] CPUs=1 RealMemory=1024 Sockets=1 CoresPerSocket=1 ThreadsPerCore=1 Procs=1 State=IDLE

PartitiOnName=clients Nodes=s[2-3] Default=YES MaxTime=INFINITE State=UP

7. 安装 client 端 (s2,s3)

yum -y  install ohpc-slurm-client

scp -pr $m1IP:/etc/slurm/slurm.conf  /etc/slurm/
scp -pr $m1IP:/etc/scp -pr $m1IP:/etc/slurm/slurm.conf  /etc/slurm/

munge/munge.keyscp -pr $m1IP:/etc/munge/munge.key /etc/munge/munge.key

8 启动服务

server 端 (m1)
systemctl start munge

systemctl start slurmctld

client 端(s2,s3)
systemctl start munge
systemctl start slurmd

9、 sinfo 查看状态

# sinfo
PARTITION AVAIL  TIMELIMIT  NODES  STATE    NODELIST

normal*      up         infinite            2        drain     s[2-3]

### drain 状态修复 

scontrol update NodeName=s[2-3] State=RESUME

# sinfo
PARTITION AVAIL  TIMELIMIT  NODES  STATE    NODELIST

normal*      up         infinite            2        idle     s[2-3]

10、运行作业

#srun  hostname
s2

# srun -N 2 -l hostname
0: s2

1: s3

11、 其他命令

squeue -a  #查询作业

scancel   #取消作业

# scontrol show config
# scontrol show partition
# scontrol show node

# scontrol show jobs

12 、对比 PBS(参考 https://blog.csdn.net/weixin_39497034/article/details/79100799)
Command                 PBS Pro                 SLURM
Submit batch job         qsub [job script]        sbatch [job script]
Request interactive shell qsub -I /bin/bash        srun –pty /bin/bash
Delete job                 qdel [job id]                scancel [job id]
Queue status                  qstat -q                        sinfo
Job status                 qstat -f [job id]        scontrol show job [job id]
Node status                 pbsnodes [node name] scontrol show node [node id]



推荐阅读
  • k8s(十一)helm安装premetheus
    1prometheus基础知识1.1prometheus简介Prometheus是一套开源的系统监控报警框架。和Kubernetes类似,它也发源于Google的Borg体系,其原 ... [详细]
  • 十一、构建我们自己的包在本章中,我们将学习如何构建自己的包。编写包可以让我们创建可以在许多应用 ... [详细]
  • 分享_Jenkits搭建芝波分享
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了Jenkits搭建------芝波分享相关的知识,希望对你有一定的参考价值。   ... [详细]
  • 两种方式实现Flink异步IO查询Mysql
    如官网所描述的Flink支持两种方式实现异步IO查询外部系统http ... [详细]
  •  在使用PHP多年之后,我对PHP的优势和劣势已经非常清楚,与后起之秀Golang相比,两者已经不在一个重量级。 PHP更像是70kg级别的选手,脚本语言,极速开发,部署方便,性能 ... [详细]
  • python 英文关键词提取_如何提取文章的关键词(Python版)
    项目需求:我们采集来的文章没有关键词,在发布的时候无法设定标签,我们通过代码自动提取出文章的关键词,达到对数据加工的目的。 ... [详细]
  • fromkeras.modelsimportSequentialfromkeras.layersimportDense,Dropoutfromkeras.layersimp ... [详细]
  • 在Docker中,将主机目录挂载到容器中作为volume使用时,常常会遇到文件权限问题。这是因为容器内外的UID不同所导致的。本文介绍了解决这个问题的方法,包括使用gosu和suexec工具以及在Dockerfile中配置volume的权限。通过这些方法,可以避免在使用Docker时出现无写权限的情况。 ... [详细]
  • Webmin远程命令执行漏洞复现及防护方法
    本文介绍了Webmin远程命令执行漏洞CVE-2019-15107的漏洞详情和复现方法,同时提供了防护方法。漏洞存在于Webmin的找回密码页面中,攻击者无需权限即可注入命令并执行任意系统命令。文章还提供了相关参考链接和搭建靶场的步骤。此外,还指出了参考链接中的数据包不准确的问题,并解释了漏洞触发的条件。最后,给出了防护方法以避免受到该漏洞的攻击。 ... [详细]
  • 本文介绍了Linux Shell中括号和整数扩展的使用方法,包括命令组、命令替换、初始化数组以及算术表达式和逻辑判断的相关内容。括号中的命令将会在新开的子shell中顺序执行,括号中的变量不能被脚本余下的部分使用。命令替换可以用于将命令的标准输出作为另一个命令的输入。括号中的运算符和表达式符合C语言运算规则,可以用在整数扩展中进行算术计算和逻辑判断。 ... [详细]
  • Go Cobra命令行工具入门教程
    本文介绍了Go语言实现的命令行工具Cobra的基本概念、安装方法和入门实践。Cobra被广泛应用于各种项目中,如Kubernetes、Hugo和Github CLI等。通过使用Cobra,我们可以快速创建命令行工具,适用于写测试脚本和各种服务的Admin CLI。文章还通过一个简单的demo演示了Cobra的使用方法。 ... [详细]
  • 阿里云主机实战应用之centos7上的防火墙设置
    最近公司又上了一台服务器,以前都是用centos6系统,这次选择使用了centos7系统的安装镜像,因为现在程序版本在centos7上一般php默认就是5.4以上的,mysql也 ... [详细]
  • 错误:requireluasql.mysqlstdin:1:moduleluasql.mysqlnotfound:nofieldpackage.preload[lua ... [详细]
  • centos7如何利用yum安装mysql 8.0.12
    这篇文章将为大家详细讲解有关centos7如何利用yum安装mysql8.0.12,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有 ... [详细]
  •  参考自:https:linux.cnarticle-6719-1.html一、安装  首先通过xshell5先登陆来到字符界面(xshell通过SSH连接请参见之前随笔)  先下载redis, ... [详细]
author-avatar
李老鱼儿_654
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有