我已经设置了Ganglia(Ganglia Core 3.6.0和Ganglia Web 3.5.10)来监视我的集群。
当gmond在机器中重新启动时,来自所有其他gmond机器的指标也会停止,例如,我无法在Ganglia Web中看到从其他机器发布的指标。我还可以看到主机数量增加到0,主机数量减少到13(机器总数)。随着时间的推移,主机数量又回到了13个。
我是不是错过了什么?谁能帮帮我..。
发布于 2013-10-24 15:14:24
如果它总是同一台机器,那么它应该是一个gmond“端点”。gmetad守护进程只查询一个gmond (无冗余),如果他崩溃了,所有人似乎都会崩溃。如果存在冗余(例如,数据源中的多个主机),如果第一个数据源由于超时之前的TCP查询次数而关闭,则可能会出现一些延迟。
https://stackoverflow.com/questions/19558567
复制相似问题