我试图在Grafana中为不同的API( java应用程序)构建仪表板。通过使用这些依赖项,我们开始将指标导出到Prometheus。
val prometheus_scdw = "io.prometheus" % "simpleclient_dropwizard" % "0.0.23"
val prometheus_schs = "io.prometheus" % "simpleclient_hotspot" % "0.9.0"
val prometheus_scg = "io.prometheus" % "simpleclient_guava" % "0.9.0"
Metrics which we can see in exporter is like this( just for example):
# HELP controllers_autouserprofilecontroller_autologin_post_seconds_max
# TYPE controllers_autouserprofilecontroller_autologin_post_seconds_max gauge
controllers_autouserprofilecontroller_autologin_post_seconds_max 0.075604753
# HELP controllers_autouserprofilecontroller_autologin_post_seconds
# TYPE controllers_autouserprofilecontroller_autologin_post_seconds summary
controllers_autouserprofilecontroller_autologin_post_seconds_count 2529959.0
controllers_autouserprofilecontroller_autologin_post_seconds_sum 80214.121718928我试着在GitHub中看到它的确切含义,当他们说计数、和或最大值时,但我没有找到任何解释。按照这些词的标准定义,如计数被切断,求和是送达请求的时间,最大值是送达请求的最高时间。
仍然想问是否有更好的方法或媒介来理解这些指标。
我还使用了对http_request_total吞吐量的查询来匹配ALB监视中的请求计数,这与此不匹配。使用的查询:sum(increase(http_request_total[1m]))
我在这里是否遗漏了什么,或者小比例的错配是可以接受的。
我的目标是为API性能构建某种仪表板,考虑到目前我们正在为所有API导出提到的度量类型。
发布于 2022-04-08 11:18:30
controllers_autouserprofilecontroller_autologin_post_seconds_count度量是一个计数器,它计算随时间变化的请求数量。因此,可以通过将费率()应用到controllers_autouserprofilecontroller_autologin_post_seconds_count中来计算平均RPS。
rate(controllers_autouserprofilecontroller_autologin_post_seconds_count[5m])[5m]是一个查找窗口--在本例中为5分钟--用于计算平均RPS。请参阅这些医生中允许的持续时间。
可以使用以下查询计算过去5分钟内的平均请求持续时间:
increase(controllers_autouserprofilecontroller_autologin_post_seconds_sum[5m])
/
increase(controllers_autouserprofilecontroller_autologin_post_seconds_count[5m])它使用增加()函数计算计数器在过去5分钟内的增量。
https://stackoverflow.com/questions/63538927
复制相似问题