我们使用Nagios来监视服务器。
每个web环境都有一个集群作为后端-Cassanra2.0。每个集群有3-5个节点.
问题是:我想为Nagios编写一个插件,用于Cassandra的节点监视。不幸的是-我不太熟悉卡桑德拉,也不确定-哪些参数需要检查?
我计划使用Nodetool工具从节点获取数据--但是它有很多命令,每个命令都提供了大量信息(例如- cfstats、info、status等)。
因此,为了进行监视,我需要获得一些关于每个节点的内存使用情况、使用过的磁盘空间的数据--可能是--其他的东西吗?
发布于 2016-02-01 02:21:41
基本上,您需要开始观察system.log,并且会收到越来越多的用于监视的错误。
发布于 2016-02-05 10:03:47
在我的集群中,我使用jolokia,这样我就可以使用HTTP访问JMX接口。通过这种方式,我可以使用Python创建监视Cassandra的脚本,并向Nagios发送警报。
你应该监测的是:
监视这些已保存了我的集群几次:)
我运行两个集群,一个在我的日常工作中,它有4个节点和3个TB数据(2个节点即将到来),在我自己的公司一个小的3节点集群。
https://dba.stackexchange.com/questions/107597
复制相似问题