使用gridengine-master 6.2u5-7.3 (Ubuntu ),我们的/var/lib/gridengine/spool/qmaster/messages经常被以下内容填充:
12/07/2016 04:11:43|worker|tools-grid-master|E|got load report of unknown exec host "tools-exec-1204.eqiad.wmflabs"(tools-exec-1204.eqiad.wmflabs是一个不再存在的主机。)
如何说服网格主程序“继续”,即“接受”它确实收到了来自未知主机的负载报告,或者“删除”其收件箱中的加载报告?
发布于 2016-12-08 03:39:13
显然,问题在于主机已被关闭并从DNS中删除,但仍在host_aliases中引用。从host_aliases中删除主机的条目并重新启动网格主程序以重新读取host_aliases (service gridengine-master restart)会导致错误停止。
https://serverfault.com/questions/819195
复制相似问题