我有一个运行Ubuntu的nagios服务器,它有一个2.0 GHz英特尔处理器、一个RAID10数组和400 MB内存。它在8台主机上总共监视了42个服务,其中大多数是使用check_http插件检查的,甚至5分钟,有些是每分钟检查一次。最近nagios服务器上的负载已经超过4,通常高达6。服务器还运行仙人掌,每分钟为6台主机收集统计数据。
我想知道,这样的硬件应该能处理多少个服务?负载如此之高是因为我正在突破硬件的限制,还是这个硬件应该能够处理42次服务检查加上仙人掌?如果硬件不足,我应该增加更多的RAM,更多的内核,还是更快的核心?哪些硬件/服务检查正在运行?
发布于 2010-01-28 18:21:08
你得弄清楚你的瓶颈在哪里..。
我运行了一个nagios监视器,它使用http、ping和ssh检查400+主机。(连同许多其他的被动检查和nscd)
这是在RAID10中有4个SAS磁盘的2xQuadCore服务器上。
我怀疑您有IO争用,因为给许多rrds写信是非常低效的。
你需要弄清楚是哪个过程占用了你的资源。(仙人掌,纳古斯或其他东西)
对于IO检查,我喜欢iotop。安装iotop ( 9.04软件包在8.04上工作)
但是,否则顶也会帮助你找到你的负荷。
仙人掌一分钟一次很有侵略性。(我每隔5米跑一次)
我听说过rrd写争用的一种方法是将rrd存储放在ramdisk/tmpfs上。(请确保不时地将其同步到持久存储)
祝好运。
发布于 2010-01-28 21:12:15
在一个具有256 On内存的旧PIII上,我正在积极地监视大约230种不同的服务。同一台机器还为所有传入的传真运行MRTG和HylaFAX,而且运行起来相当舒服。
发布于 2010-01-28 18:58:03
您应该能够使用该硬件运行一船nagios检查。我们运行了一个类似的设置,大约有70张支票和Nagiosgraph -主要的区别是增加了RAM (它很便宜,所以我会把这个盒子提高到2Gb)。
尝试运行top或ps -aux来查看CPU是否超载,但我对此表示怀疑。您还可能希望检查nagios 并行化文档,以确定您的安装是否试图一次运行太多的检查,而不是序列化它们。
https://serverfault.com/questions/107278
复制相似问题