首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Slurm设置:连接slurm流套接字时出错

Slurm设置:连接slurm流套接字时出错
EN

Stack Overflow用户
提问于 2019-01-29 20:21:30
回答 1查看 4.2K关注 0票数 3

我正在尝试用slurm建立一个新的集群。我已经安装了一个客户端和一个控制机器。(我对此并不熟悉.)

  1. 当我在控制机器上输入sinfo -vvv时,显示的是

“sinfo: debug2: slurm_connect失败:连接拒绝sinfo: debug2:连接slurm流套接字192.168.155.142:6817:连接拒绝”

我的slurm配置为使用6817端口(完整配置在这里可用https://pastebin.com/X4yDe99z )。

SlurmctldPort=6817

端口是开放的(我也尝试过禁用ufw )

6817 (v6) ALLOW Anywhere (v6)

  1. 当我尝试slurmctld -Dvvv时,它显示了此错误。

slurmctld: error: this host (xxxx/xxx) not a valid controller (gaia or (null))

我的/etc/host文件是127.0.0.1 localhost 192.168.155.142 gaia

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-01-30 07:27:01

参数ControlMachineslurm.conf (启动slurmctld的机器)中的值必须是该机器上hostname -s的确切输出,才能启动守护进程。

您机器上的hostname -s似乎没有输出gaia。将gaia替换为隐藏在xxxx/xxx后面的内容。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54429016

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档