我正在使用KEDA自动扩展我的ML工作负载pod。当队列规模缩小时,pods会根据队列项目的数量自动扩展,即使pods仍在处理队列工作负载。我已经设置了terminationGracePeriodSeconds,但是对于我们的工作负载来说要么太高要么太低。
阅读了有关SIGTERM signal和prestop的信息,但使用KEDA队列舵图找不到任何可以解决此问题的示例
发布于 2021-06-02 16:35:01
我们通过增加deployment.YAML中的terminationGracePeriodSeconds修复了这个问题。这可能不是正确的修复,但它对我们有效。希望对有同样问题的人有所帮助。
apiVersion: extensions/v1beta1
kind: Deployment
metadata:
name: test
spec:
replicas: 1
template:
spec:
containers:
- name: test
image: ...
terminationGracePeriodSeconds: 300如果您使用的是函数app,也要减小批处理大小,这样pod就不会在更长的时间内被处理。
https://stackoverflow.com/questions/65305479
复制相似问题