我们只是在GCP中配置错误报告,它显示了一段时间内错误的直方图(按类型分组)。但我认为这些数据并不是那么有用。我的意思是,为了便于讨论,100个请求有100个错误意味着我们的服务中断了。但是对于1,000,000个请求,100个错误是可以接受的。
这就是为什么我在考虑使用P99/P95/P90方法添加警报/监控。我还想看看我们是否可以根据数据点的数量配置警报,即,如果P90上的错误计数在10分钟内>5,则警报。
这是可以在GCP中完成的事情吗?我相信这在AWS中是可能的,但在GCP中是不可能的。
发布于 2019-11-30 00:32:22
您可以为此配置Stackdriver监控和警报。Here's快速入门来帮助您设置此设置。
https://stackoverflow.com/questions/59106617
复制相似问题