我想启用kafka监控,我从单节点部署开始作为测试。我正在遵循https://alex.dzyoba.com/blog/jmx-exporter/的步骤
我尝试了以下步骤;最后一个检查jmx出口商HTTP服务器的命令报告为空。我相信这就是为什么我没有看到卡夫卡的度量标准的原因。
wget https://repo1.maven.org/maven2/io/prometheus/jmx/jmx_prometheus_javaagent/0.6/jmx_prometheus_javaagent-0.6.jar
wget https://raw.githubusercontent.com/prometheus/jmx_exporter/master/example_configs/kafka-0-8-2.yml
export KAFKA_OPTS='-javaagent:/opt/jmx-exporter/jmx_prometheus_javaagent-0.6.jar=7071:/etc/jmx-exporter/kafka-0-8-2.yml'
/opt/kafka_2.11-0.10.1.0/bin/kafka-server-start.sh /opt/kafka_2.11-0.10.1.0/conf/server.properties
netstat -plntu | grep 7071kafka broker登录控制台时没有任何错误消息。
我让Prometheus运行在一个容器中,http://IP:9090/metrics展示了许多度量标准。当我搜索“卡夫卡”的时候,它又回来了
# TYPE net_conntrack_dialer_conn_attempted_total counter
net_conntrack_dialer_conn_attempted_total{dialer_name="kafka"} 79
# TYPE net_conntrack_dialer_conn_closed_total counter
net_conntrack_dialer_conn_closed_total{dialer_name="kafka"} 0
net_conntrack_dialer_conn_established_total{dialer_name="kafka"} 0
# TYPE net_conntrack_dialer_conn_failed_total counter
net_conntrack_dialer_conn_failed_total{dialer_name="kafka",reason="refused"} 79
net_conntrack_dialer_conn_failed_total{dialer_name="kafka",reason="resolution"} 0
net_conntrack_dialer_conn_failed_total{dialer_name="kafka",reason="timeout"} 0
net_conntrack_dialer_conn_failed_total{dialer_name="kafka",reason="unknown"} 79
# TYPE prometheus_sd_discovered_targets gauge
prometheus_sd_discovered_targets{config="kafka",name="scrape"} 1
# HELP prometheus_target_sync_length_seconds Actual interval to sync the scrape pool.
# TYPE prometheus_target_sync_length_seconds summary
prometheus_target_sync_length_seconds{scrape_job="kafka",quantile="0.01"} NaN
prometheus_target_sync_length_seconds{scrape_job="kafka",quantile="0.05"} NaN
prometheus_target_sync_length_seconds{scrape_job="kafka",quantile="0.5"} NaN
prometheus_target_sync_length_seconds{scrape_job="kafka",quantile="0.9"} NaN
prometheus_target_sync_length_seconds{scrape_job="kafka",quantile="0.99"} NaN
prometheus_target_sync_length_seconds_sum{scrape_job="kafka"} 0.000198245
prometheus_target_sync_length_seconds_count{scrape_job="kafka"} 1我的猜测是,prometheous没有在端口7071上获得任何度量;这与先前发现JMX服务器在端口7071上没有响应的发现一致。
你能帮我用JMX-出口商和普罗米修斯来监控卡夫卡吗?
发布于 2019-10-29 07:10:45
我让普罗米修斯在一个容器里运行
您需要配置Prometheus来刮除您的外部LAN IP,然后因为您在容器外运行Kafka。
在这一行中,您可以看到当前设置正在拒绝连接。
net_conntrack_dialer_conn_failed_total{dialer_name="kafka",reason="refused"} 79
您应该在主机上运行Prometheus并刮掉localhost:7071。
如果您希望普罗米修斯能够发现kafka:7071,则可以在容器中运行Kafka。
https://stackoverflow.com/questions/58033823
复制相似问题