背景 bosun 是一个由 Stack Exchange 开源的监控和告警系统,可以对标的工具有 prometheus 的 alertmanager. bosun 的设计目的是用于配合各种 tsdb 配置监控告警系统 ,但是 bosun 同时又提供了一套 dsl 用于查询监控、评估指标,使得 bosun 本身也是一种 tsdb 无关(目前支持如 opentsdb, prometheus, influxdb, es 等多种 bosun 并不是一个非常火热的项目,目前有 3.1k star, 市面上介绍他的文档也比较少,大部分是对官方文档的直译。 本文的目的是从概念角度介绍 bosun 查询的方式(主要针对后端为 opentsdb),以及一些查询的技巧。 grafana bosun 插件 grafana bosun 插件中会有两个内置的变量 $ds: 建议的 downsampling interval, 这个变量很有用,在查询的使用比如 q("avg:$
Opserver的功能其实很强大,他可以用于连接任何支持Bosun, Orion, or direct WMI监控数据。 大概效果如下: ? 当然,官方推荐的是使用bosun +scollector+OpServer的形式来采集和显示 所以,我们下面就来讲讲(不过我本人并没有实践..资源实在有限) 2.通过bosun +scollector监控服务器 -p 8070:8070 stackexchange/bosun”,安装bosun,文件大概200多M,等待完成即可。 检查是否安装成功 访问网站http://docker-server-ip:8070,显示bosun界面,即安装成功。此时,本机监控数据已经被采集,可以查看相应数据。 2、服务器agent数据采集器(scollector) 可以到 http://bosun.org/scollector/ 下载scollector.
这个Tornado API服务,我们在系统中主要用它来: API的封装,对TSD、Bosun(告警模块)的API进行二次开发 可以作为对外接口,接收处理网络数据 因此,系统架构中API服务的实现也敲定了 告警-Bosun 最后,告警这个模块,我们采用了StackOverflow的Bosun。 Bosun是一个基于OpenTSDB开源的告警系统: GO语言和AngularJS开发,性能好且易于部署 通过灵活强大的表达式来定义告警规则 提供HTTP调用的告警方式 ?
博讯网络有限责任公司 – Bosun Network Co., Ltd.
开源地址:https://github.com/opserver/Opserver 它支持监控的内容有很多,如下: 服务器信息由Bosun,Orion采集的或者直接监控WMI的产品和系统.
对标的开源产品 备注 分布式共识系统、分布式锁服务 Chubby 书中描述为强一致性存储系统 ZooKeeper、Consul 监控服务 Borgmon Prometheus、Riemann、Heka、Bosun
虽然 Borgmon 仍是 Google 内部工具,但是近年来,监控系统也经历了爆发式增长:Prometheus、Riemann、Heka、Bosun 都是开源软件中与 Borgmon 理念类似的系统,
user_guide/query/index.html OpenTSDB提供了很多的操作、查询、分析数据的方法,可以通过使用CLI工具进行查询,然后将其展示为图型的方式,也可以直接使用Grafana和Bosun
.Net CIL 生成帮助器(在 C# 不够快的时候使用) NetGain – 高性能的 websocket 服务器 Opserver – 监控仪表板,可以直接轮询大多数系统,并且可以从 Orion、Bosun 或 WMI 中获取信息 Bosun – 后台的监控系统,使用 Go 编写 小编结语: 其实看下来,基本的所有大型的互联网站点,都基本符合这样一个套路,缓存用mongodb或者redis等nosql
告警组件: 提供了Trigger流式告警和基于Bosun的统一pull告警。通过推拉结合的告警引擎解决了大规模阈值告警和复杂同环比告警场景。
在查询方面,我们目前兼容 OpenTSDB 的查询语法,并可以通过像 Grafana、Bosun 或 OpenAPI 等方式进行业务接入。