我有一个已启用自动缩放的托管实例组。我有至少1和最多10的健康检查和cpu 0.8
每隔几分钟,实例数不断地在0到1.01之间切换。我无法找到GCP决定移除实例并立即将其添加回的原因。任何地方都没有健康检查记录。
更令人关切的是,所需的最低限度实例被违反了。
有什么想法?谢谢!
编辑:这可能是由于实例变得不健康,很可能是因为需要防火墙规则才能对实例进行健康检查。健康检查用于负载平衡,但似乎不适用于实例健康。我使用的是自定义网络,所以我需要添加防火墙规则。
将在一些监视时间后确认/更新。
发布于 2017-11-15 11:32:50
不要混淆两个不同的特性:自动治疗器和托管实例组的自动标度。
--min-num-replicas是自动分词器的一个参数,设置此参数您可以确保目标实例数永远不会设置在某个阈值以下。然而,自动愈合工作本身没有遵循自动标度的配置。因此,当实例属于托管组并未能通过健康检查时,如果启用了自动修复,则将它们视为死实例并从池中移除,而不考虑副本的最小数量。
最好的做法是验证健康检查是否正常工作,以避免这种不当行为。共同的问题是:
还请注意,如果健康检查稍微复杂一些,并且与某种软件交互,则需要确保实例在配置相应的初始延迟标志之前启动,即已知实例初始化期间的长度,即使不健康,也不应该自动恢复。
https://stackoverflow.com/questions/47253403
复制相似问题