打开防火墙 打开本地(RabbitMQ Server)防火墙 [root@rabbitmq ~]# netstat -ant | grep 15672 tcp 0 0 0.0.0.0:15672 0.0.0.0:* LISTEN [root@rabbitmq ~]# iptables -L -nv | grep 15672 [root@rabbitmq ~]# grep 15672 /etc/sysconf
0 [root@es_node tengine-2.1.2]# ll /usr/local/nginx/ total 24 drwxr-xr-x 2 root root 4096 Jan 6 19:46 conf drwxr-xr-x 2 root root 4096 Jan 6 19:46 html drwxr-xr-x 2 root root 4096 Jan 6 19:46 include drwxr-xr-x 2 root root 4096 Jan 6 19:46 logs drwxr-xr-x 2 root root 4096 Jan 6 19:46 modules drwxr-xr-x 2 root root 4096 Jan 6 19:46 sbin [root@es_node tengine-2.1.2]#
这里提示我们系统里没有安装 php ,我们给它装上,同时我们也装上 php-mysql ,它提供了php 连接 mysql 需要的DBI
但配置完成后,SCOM还无法对Azure的云、存储、虚拟机进行监控,那么本章内容就会进行监控的配置。 首先,打开创作,在管理包模版节点右键添加监视向导。 ? 添加云服务监控,选择ADD ? 点击搜索,然后选择需要监控的云服务,然后确定。 接下来进行虚拟机监控选择,还是点击ADD进行添加 ? 点击搜索,选择需要监控的虚拟机,确定。 ? 最后添加存储监控,方法同上,点击ADD进行添加 ? 搜索存储账户,然后添加,确定。 完成了所有配置,开始创建,如下图所示: ? 很快,完成创建,在Windows Azure Monitoring模版中我们可以看到刚创建的监控。 如下图所示: 接下来,打开监控节点,在Windows Azure监控下,我们可以看到监控状态已经正常了。 ? 在自定义管理包监视下,还可以创建一个图示视图,以拓扑图方式来展现监控。
(0) node_export : Node 主要监控主机硬件和系统资源相关指标,建议Windows用户使用Windows exporter。 ,并且可以允许临时任务和批处理作业向 Prometheus 公开其指标,再结合 Prometheus 统一收集监控。 (2) 基础示例 2.1) 基本常规监控 global config 的yaml文件示例 # - 全局配置 global: scrape_interval: 60s scrape_timeout -2B22-B222-2BB2222BB2B2 client_id: 333333CC-3C33-3333-CCC3-33C3CCCCC33C client_secret: mysecret description: "{{$labels.mountpoint }} 磁盘分区使用大于80%(目前使用:{{$value}}%)" # -- 业务监控规则 - name: 业务监控(Business
pm2 npm install -g pm2 npm install -g pm2-web //linux有效 command pm2 logs,实时显示日志 pm2 list,查看启动进程 pm2 stop id[name],关闭进程,all所有 pm2 kill,关闭所有 pm2 monit,查看详细信息 pm2 start,启动程序 –watch,修改app.js后自动重启 debug "request": "launch", "type": "node-terminal" }, package.json配置 "run":"pm2
指标监控 1、SpringBoot Actuator 1、简介 2、1.x与2.x的不同 3、如何使用 2、Actuator Endpoint 1、最常使用的端点 最常用的Endpoint 2、Health Endpoint 3、Metrics Endpoint 4、管理Endpoints 1、开启与禁用Endpoints 2、暴露Endpoints (监控端点) 定制 Endpoint 1、定制一个组件的 3.创建另一个服务器作为监控者,监控客户端数据 测试 详细使用还可以看下面这篇文章 ---- 1、SpringBoot Actuator 1、简介 未来每一个微服务在云上部署以后,我们都需要对其进行监控 1.x与2.x的不同 ---- 3、如何使用 引入场景 访问 http://localhost:8080/actuator/** (监控端点,有很多) 暴露所有监控信息为HTTP management ---- 2、Actuator Endpoint 1、最常使用的端点 最常用的Endpoint Health:监控状况 Metrics:运行时指标 Loggers:日志记录 ---- 2、Health
首先确定四分位数的位置: Q1的位置= (n+1) × 0.25 Q2的位置= (n+1) × 0.5 Q3的位置= (n+1) × 0.75 所以分位数,就是多少比例样本表示的数值是多少。
对于直接启动jar包的程序进行监控 # cat javarisk.ini [program:javarisk] command=/usr/bin/java -Xms1024m -Xmx1024m -jar killasgroup=true 配置完成后执行 supervisorctl update supervisorctl start javarisk supervisorctl status javarisk 监控 startup.sh来进行启动控制,需要使用catalina.sh run这种方式来进行启动,配置完成后重启即可 supervisorctl update supervisorctl start app 监控 stderr_logfile=/export/server/supervisor/logs/nginx_err.log stopasgroup=true killasgroup=true 需要注意的是,supervisor不能监控放在后台的服务 监控redis # cat redis.ini [program:redis-6379] command=/usr/bin/redis-server /etc/redis.conf autostart
()(64bit) for package: zabbix-server-mysql-2.4.7-1.el6.x86_64 --> Processing Dependency: libodbc.so.2( -> Package OpenIPMI-libs.x86_64 0:2.0.16-14.el6 will be installed ---> Package iksemel.x86_64 0:1.4-2. package: zabbix-web-2.4.7-1.el6.noarch --> Running transaction check ---> Package fping.x86_64 0:2.4b2- 473 k fping x86_64 2.4b2- 16.el6 iksemel.x86_64 0:1.4-2.el6 libXpm.x86_64 0:3.5.10-2.el6
上一篇我们了解了docker自带的监控子命令以及开源监控工具Weave Scope,这一篇我们来了解一下Google开发的容器监控工具cAdvisor。 [2e5ppdml1i.png] 三、使用cAdvisor 3.1 监控容器 cAdvisor提供了对Host和容器的监控,单击“Docker Containers”链接: [dikswdbv4j.png [s309xc0as2.png] 我们可以清楚地看到:CPU、内存、网络、文件系统的动态使用情况。 3.2 监控Host 除了监控容器之外,cAdvisor也提供了对Host的监控。 更为重要的是,它不能监控多个Host,而Weave Scope至少还可以监控多个Host。那么,为何我们还要学习它呢?
/qyapi.weixin.qq.com/cgi-bin/' # 企业微信api接口,统一定义 send_resolved: true # 设置发送警报恢复信息 to_party: '2' # 部门id,比如我的叫警报组,因此显示的是2,如果你DB组,就可能会是3,WEB组就是4,依次类推,另外需要接收警报的相关人员必须在这个部门里。 ww5421dksajhdasjkhj' api_url: 'https://qyapi.weixin.qq.com/cgi-bin/' send_resolved: true to_party: '2'
rocketmq_constant.py:定义不监控的topic,因为rocketmq安装后会有一些默认topic,如给benchmark用的BenchmarkTest等,正常情况下这些不需要纳入监控。 (2)基础镜像 位于: https://github.com/hepyu/hpy-rocketmq-exporter 以官方镜像python3.6为基准安装prometheus-client, flask 2.数据校验方面有遗漏,必须存在至少一个topic和consumer才正常,否则json解析失败,metrics获取失败。 (6).建议rocketmq集成prometheus监控到官方 建议rocketmq集成prometheus监控,这样可以全方位监控rocketmq集群的状态,比如其中一个很重要的维度就是高压力下消息发送失败 我们的生产做法参见文章: rocketmq1:集群主要结构和监控,以及性能测试与成本控制 如下图例,监控producer第一次发送消息失败的情况,以及重发结果的情况: ? 图片.png
横空大气排山去,砥柱人间是此峰 牛兆濂《登华岳南峰极顶七绝》 Zabbix Agent2监控docker容器 首先我们先来看一下zabbix agent2监控docker插件的实现原理,其实就是通过调用 docker的API来获取数据,插件目录位于zabbix-agent2/src/go/plugins/docker,我们先来看一下client.go文件 这里就是定义了使用UNIX套接字地址来进行docker 再来看一下docker.go,这里定义了docker的监控项的键值,以及对应的API请求路径,参数长度 ? 这里是实现了一个Query方法来对根据传来的API路径构造GET请求获取数据 ? 插件的实现思路后我们可以根据我们的需求进行扩展,添加对应的api获取数据就可以了,或者根据这个思路在zabbix agent上实现相同的自定义脚本,甚至可以根据docker插件的实现逻辑来自己编写插件实现其他的监控需求 下面我们来使用agent2的模板监控docker 链接docker模板 ?
目录 (1).核心原理与代码 (2).基础镜像 (3).结合grafana/prometheus/容器化 (4).一些瑕疵 (5).最终效果 (6).建议rocketmq集成prometheus监控到官方 rocketmq_constant.py:定义不监控的topic,因为rocketmq安装后会有一些默认topic,如给benchmark用的BenchmarkTest等,正常情况下这些不需要纳入监控。 (2).基础镜像 以官方镜像python3.6为基准安装prometheus-client, flask等必要组件。 cd python-docker-image sh . 2.数据校验方面有遗漏,必须存在至少一个topic和consumer才正常,否则json解析失败,metrics获取失败。 (5).最终效果 可以根据各个维度监控消息堆积,精确到进程粒度: ? (6).建议rocketmq集成prometheus监控到官方 建议rocketmq集成prometheus监控,这样可以全方位监控rocketmq集群的状态,比如其中一个很重要的维度就是高压力下消息发送失败
1.5 优势 Prometheus最大的优势在于简单灵活,可以实现监控的多维数据模型。用户可以轻松搭建容器集群的监控框架,还可以结合Grafana,进一步提高监控数据的可视化水平。 二、K8s监控之Sensu 2.1 简介 Sensu是多云端容器基础设施监控工具。 这样,外部监控工具的数据便可与Sensu的监控数据整合,形成基于事件的监控路径。 ? 2.3 核心组件 Sensu针对K8s容器优化了自动发现能力。 2.4 在K8s中的应用 Sensu可扩展性强,可随着部署应用和云环境的增加不断扩展,提供具体的功能监控服务。Sensu监控对象的数量没有上限,也不会因为监控对象的增加变得更加复杂。 便于管理配置监控设置。 能够监控整个基础设施。 四、结论 Sensu能够监控整个基础设施,且定制化水平高,上下文更丰富。
(一) 捕获数据 用法:sh capture.sh arg1 arg2 参数说明:arg1为采样频率,arg2为采样时长,单位都为秒 例子:2秒采集一次数据,采样时长10秒,共采样5次 sh capture.sh 2 10 capture.sh内容如下: #! /bin/bash # 获取要监控的本地服务器IP地址 IP=`ifconfig $4 | grep "inet addr" | cut -f 2 -d ":" | cut -f 1 -d " "` \t\t%.2f\t\t%.2f\t\t\t%.2f\t\t%.2f\t\t%.2f\t\t%s\n" $disk_sda_rs $disk_sda_ws $disk_sda_avgqu_sz $disk_sda_await 注:针对不同类型、版本的操作系统,以上脚本可能需要做适当修改才可适用 附脚本下载地址:Linux 性能监控之CPU&内存&I/O监控Shell脚本2.zip
在系列文章(1)中,实现了用云原生监控采集TKE集群中节点上守护进程的监控指标。接下来,进一步描述下如何用云原生监控来采集TKE集群外组件的监控指标,比如Kong。 前提:网络互通 采集方案 image.png 1 云原生监控支持的监控配置入口有三个:ServiceMonitors、PodMonitors、RawJobs,其中ServiceMonitors是已k8s 2 k8s集群中的service对象,可以单独创建endpoints来关联。 kong-monitor subsets: - addresses: - ip: 192.0.2.42 ports: - port: 8001 name: http 2 在云原生监控控制台上创建ServiceMonitors对象: image.png 当完成上诉步骤之后,就可以配置grafana面板了。
main] com.test.actuator.ActuatorApplication : Starting ActuatorApplication on DESKTOP-4MOUU2Q 大多数应用采用HTTP监控,这时,endpoint的ID就映射为一个接口URL。 度量指标类: 获取应用程序运行过程中用于监控的度量指标,比如内存信息、线程池信息、HTTP请求统计等。 操作控制类:提供对应用的关闭等操作类功能。 gauge.response.configprops": 167, "gauge.response.star-star": 8, "counter.status.302.docs": 2, 统中的各项监控功能,它们的监控内容、 数据收集频率都有所不同,如果每次都通过全量获取报告的方式来收集,略显粗暴。
最近在和MYSQL的监控方法的事情在嫐裱,深感周遭的事情变化快,一步跟不上就的紧倒持。 今天继续 MYSQL 中的 performance_schema 熟悉的过程。 1 线程的连接,在MYSQL的某些监控中是至关重要的,如果某个开发在上线某个程序后,发现MYSQL无法登陆了,除了你要预留一个额外的端口给你上去处理这个事情,那第二个事情就是要赶紧得到你MYSQL的连接数 我们可以通过 select * from performance_schema.accounts; 来进行一个信息的查询,当前有多少连接,历史连接数,我们通过这个信息在zabbix做一个监控是很容易的事情 current_events_table 记录当前线程发生了什么 history_table 发生事件的历史记录 summary_table 对各种事件的统计表 setup_intruments 为当前数据库是否开启了某项监控 setup_timers 监控的采样率 以上的内容让我想起,去年interview某个人问我的问题,问题是MYSQL 中有类似ORACLE AWR 报告之类的东西,当时告诉他的是不可以,没有,其实细想想