我有一个AWS帐户,有两个EKS集群,比如EKS_A和EKS_B。EKS_A在美国-东-1,EKS_B在我们-西-1相同的AWS帐户。在这些AWS EKS集群上,我有一个Prometheus名称空间,它运行下面的豆荚-
pod/kube-state-metrics
pod/prometheus-alertmanager
pod/prometheus-node-exporter
pod/prometheus-pushgateway
pod/prometheus-server
daemonset.apps/prometheus-node-exporter
deployment.apps/kube-state-metrics
deployment.apps/prometheus-pushgateway 现在,这些EKS集群都使用各自的端点公开度量,这两个端点被主Prometheus使用/使用(该主Prometheus拥有显示度量的web UI ),它设置在一个不同的Kubernetes集群中,而该集群不是AWS的一部分。
现在的问题是--主Prometheus能够显示或刮掉EKS_A集群在我们东部-1中公开的所有度量,但它不能在us 1中显示来自EKS_B集群的容器相关的度量。
这意味着以下容器度量标准在EKS_A集群的主Prometheus中可用,但它们没有显示在EKS_B集群中-
container_cpu_cfs_periods_total
container_cpu_cfs_throttled_periods_total
container_cpu_cfs_throttled_seconds_total
container_cpu_load_average_10s
container_cpu_system_seconds_total
container_cpu_usage_seconds_total
container_cpu_user_seconds_total
container_file_descriptors
container_fs_inodes_free
container_fs_inodes_total
container_fs_io_current
container_fs_io_time_seconds_total
container_fs_io_time_weighted_seconds_total
container_fs_limit_bytes
container_fs_read_seconds_total请注意,Prometheus能够显示来自EKS_B集群的所有指标,但上述container_*相关度量除外。
知道为什么会发生这种事吗?我需要怎么解决?
谢谢
发布于 2022-09-14 18:18:42
cAdvisor用于监测资源使用情况,并分析容器的性能。在Prometheus文件中,我没有使用cadvisor的名称,而是使用了引起此问题的Kubernetes-cadvisor。在将Kubernetes-cadvisor改为cadvisor之后,问题得到了解决。
https://stackoverflow.com/questions/73337797
复制相似问题