首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Cassandra群监测

Cassandra群监测
EN

Database Administration用户
提问于 2015-07-21 08:03:59
回答 2查看 1.1K关注 0票数 5

我们使用Nagios来监视服务器。

每个web环境都有一个集群作为后端-Cassanra2.0。每个集群有3-5个节点.

问题是:我想为Nagios编写一个插件,用于Cassandra的节点监视。不幸的是-我不太熟悉卡桑德拉,也不确定-哪些参数需要检查?

我计划使用Nodetool工具从节点获取数据--但是它有很多命令,每个命令都提供了大量信息(例如- cfstatsinfostatus等)。

因此,为了进行监视,我需要获得一些关于每个节点的内存使用情况、使用过的磁盘空间的数据--可能是--其他的东西吗?

EN

回答 2

Database Administration用户

回答已采纳

发布于 2016-02-01 02:21:41

  1. 您可以对每个节点使用检查Java内存。像总的Java堆内存和使用Java内存。
  2. 最重要的是每个节点的CPU利用率。
  3. 设置错误警报。system.log有很多关于。
  4. 您可以为数据磁盘和日志磁盘设置警报。
  5. 心跳检查服务器,例如,如果你在几分钟内没有收到,它会收到通知给你。
  6. 还删除了突变,并暗示了隐藏的清晰警报。

基本上,您需要开始观察system.log,并且会收到越来越多的用于监视的错误。

票数 5
EN

Database Administration用户

发布于 2016-02-05 10:03:47

在我的集群中,我使用jolokia,这样我就可以使用HTTP访问JMX接口。通过这种方式,我可以使用Python创建监视Cassandra的脚本,并向Nagios发送警报。

你应该监测的是:

  1. Java堆和GC
  2. 待处理的契约
  3. 冲洗待决
  4. 暗示汉道夫待定
  5. 流言蜚语任务悬而未决
  6. 读/写延迟
  7. 键缓存命中率
  8. 下行终点计数

监视这些已保存了我的集群几次:)

我运行两个集群,一个在我的日常工作中,它有4个节点和3个TB数据(2个节点即将到来),在我自己的公司一个小的3节点集群。

票数 5
EN
页面原文内容由Database Administration提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://dba.stackexchange.com/questions/107597

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档