目前,我们正在使用vFabric Hyperic4.5.2.2来监视许多系统。
警报和类似的设置是在我加入这个团队之前设置的,但是我一直在寻找改进它们的方法,即在不影响足够覆盖率的情况下最小化监视对生产服务器的影响。
我注意到,通常Hyperic只会敲击服务器,有时会使CPU达到30秒到一分钟的最大值。
虽然我知道减少监视器/警报的数量会有所帮助,但在进行其他系统架构和布局更改之前,我可能无法做到这一点。
同时,是否有一种方法来安排页面请求的时间表或强迫它们交错?我已经找到了如何更改集合间隔--但这并不能真正解决核心问题。
此外,我不确定是否仅仅是HTTP监视器导致了这些问题,尽管我很确定它们是造成问题的原因。
我找到了server.log,但是它要么缺少信息(也许是因为日志级别?)或者我不知道我在找什么。
我的问题越深入,我如何才能确定Hyperic正在做什么,这会导致被监视的服务器有时几乎被锁定?当然,这可能会导致其他问题,但我可以在这些问题出现时加以解决。
我已经查看了这个问题的答案,但是out hyperic并没有设置为扫描日志。
谢谢。
发布于 2012-09-12 22:03:28
我对Hyperic4.1.1也有类似的问题。在运行了2+数年之后,我们开始看到高cpu的使用。
我们把这件事交给了代理人。在我们的例子中,我们使用的是带有嵌入式jre的代理。
我们安装了v6 build 35 jre,并设置了HQ_JAVA_HOME:
(注意:不要将这个var设置为java bin dir。相反,将其设置为基本的jre6 dir,在windows上通常是: c:\program \java\jre6 6)
我们重新启动代理人,地球上就和平了!
http://pubs.vmware.com/vfabric5/index.jsp?topic=/com.vmware.vfabric.hyperic.4.6/Configure_JREs_为_高血压病_Components.html
https://serverfault.com/questions/391978
复制相似问题