首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Grafana+Prometheus监控Flink on YARN系统搭建

Grafana+Prometheus监控Flink on YARN系统搭建

作者头像
用户4128047
发布2025-12-23 17:37:12
发布2025-12-23 17:37:12
2550
举报

1.简介 Flink支持多种监控指标的汇报reporter,例如jmx、slf4j、Prometheus、InfluxDB等。 Grafana+Prometheus是当前比较流行的监控可视化解决方案。如下图为Prometheus及相关组件组成的生态系统。

在这里插入图片描述
在这里插入图片描述

2.安装配置 Prometheus是采用拉模式的方式,从exporter拉取监控的数据。但Prometheus自动发现Flink on YARN作业的提交、结束以及自动拉取数据是比较困难的。PushGateway作为一个中转组件,通过配置Flink on YARN作业将监控指标推到PushGateway,Prometheus再从PushGateway拉取数据。 (1)首先拷贝监控用的jar包Flink的lib目录下 将flink的opt目录下面的flink-metrics-prometheus-1.7.2.jar包拷贝到flink的lib下:

代码语言:javascript
复制
cd /opt/flink-1.7.2
cp opt/flink-metrics-prometheus-1.7.2.jar lib

(2)Prometheus和PushGateway组件下载地址为:

代码语言:javascript
复制
https://github.com/prometheus/prometheus/releases/download/v2.12.0/prometheus-2.12.0.linux-amd64.tar.gz
https://github.com/prometheus/pushgateway/releases/download/v0.9.1/pushgateway-0.9.1.linux-amd64.tar.gz

(3)解压文件,并修改 Prometheus的配置文件prometheus.yml添加配置如下图; Prometheus的默认端口是9090,PushGateway的默认端口是9091。

代码语言:javascript
复制
  - job_name: 'flink'
    file_sd_configs:
     - files:
       - configs/flink.json

configs/flink.json的配置如下图:

代码语言:javascript
复制
[
 {
  "targets": ["172.30.11.15:9091"]
 }
]

(4)启动PushGateway和Prometheus。

代码语言:javascript
复制
nohup ./pushgateway --web.listen-address :9091 > /var/log/pushgateway.log 2>&1 &
nohup ./prometheus --config.file=prometheus.yml > /var/log/prometheus.log 2>&1 &

若Prometheus为生产环境热启动,只需要在服务器上执行如下命令即可:

代码语言:javascript
复制
curl -X POST http://172.30.11.15:9090/-/reload

(5)编辑flink-conf.yaml,添加Flink与PushGateway集成的参数

代码语言:javascript
复制
metrics.reporter.promgateway.class: org.apache.flink.metrics.prometheus.PrometheusPushGatewayReporter
# 这里写PushGateway的主机名与端口号
metrics.reporter.promgateway.host: 172.30.11.15
metrics.reporter.promgateway.port: 9091
# Flink metric在前端展示的标签(前缀)与随机后缀
metrics.reporter.promgateway.jobName: flink-metrics-ppg
metrics.reporter.promgateway.randomJobNameSuffix: true
metrics.reporter.promgateway.deleteOnShutdown: false

(6)配置grafana Grafana默认端口:3000,点击Create your first data source添加Prometheus数据源。如下图所示:

在这里插入图片描述
在这里插入图片描述

(7)启动flink (8)添加监控图表 点击New Dashboard->Add Query按钮,即可看到Flink下的监控指标。

在这里插入图片描述
在这里插入图片描述

选好监控指标,就可以从图表中看到监控数据的折线了。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2025-06-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档