我有大约3-4台服务器的目标组
从本周开始,我们开始看到间歇性的不健康警报

尽管它大多只有1个实例,而且非常短(1-2分钟),但你知道为什么会发生这种情况吗?我应该从哪里开始检查哪里出了问题?我可以确认当不健康事件发生时,我的应用程序没有崩溃
发布于 2019-05-23 13:23:57
这些指标只是指示运行状况检查失败。
您可以配置运行状况检查:
检查频率:多少次故障应该导致多少次"Unhealthy"
如果您发现实例即使被标记为不健康也工作正常,那么您可能希望增加检查之间的时间间隔,或者增加将实例标记为不健康所需的检查次数。
但是,您确实应该首先调查应用程序是否正确响应,以及可能导致运行状况检查失败的原因。您可以为>0 Unhealthy instances设置一个警报,通知您何时进行调查。
https://stackoverflow.com/questions/56267605
复制相似问题