在我的基础设施中,我有服务器,这些服务器定期做一些繁重的工作。比方说,每10分钟cpu利用率是100%,持续时间不超过5分钟。如果服务器在此状态下工作超过15分钟,那么我希望得到通知,否则短时间内的峰值利用率是正常的。
因此,我在$SHINKEN_ETC/packs/company_packs/template.cfg中创建了一个特殊的主机类,如下所示:
(...)
define host {
name linux_1min_15tries_every1min
use linux
max_check_attempts 15
check_interval 1
retry_interval 1
flap_detection_enabled 0
register 0
}
(...)然后,我在$SHINKEN_ETC/hosts/company_hosts.cfg中像这样使用它:
(...)
define host{
use linux_1min_15tries_every1min
contact_groups admins
host_name serv1
address 10.10.16.1
}
(...)同时,每次使用高峰时,新肯的主机都会进入临界状态。看上去它在第一次检查后就达到了硬状态。而且,柜台从来没有上去过。它总是保持在1/15拉特。有什么办法解决这个问题吗?
Shinken版本为1.4.2

发布于 2015-08-14 08:55:21
好的,我的问题是修改了主机检查,基本上是ping,但没有修改服务检查,这就是cpu和内存监视的处理方式。在这样做之后,一切都如预期的那样工作。
https://stackoverflow.com/questions/31917913
复制相似问题