Openshift 3.11 --在从spring 1.4.5升级到> 2.6.1时,我们观察到间隔期超时,以便探测活性,并发出以下警告:
Liveness probe failed: Get http://172.40.23.99:8090/monitoring/health: net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting headers)
通信量非常少,内存/cpu/线程远远超出限制阈值。该问题在不同的集群计算节点上重现。
部署配置/硬件/资源没有作为升级的一部分进行更改。
活性探测的部署配置:
Liveness: http-get http://:8090/monitoring/health delay=90s timeout=3s period=50s #success=1 #failure=5
码头基地形象:"name": "redhat-openjdk-18/openjdk18-openshift","version": "1.12"
从访问日志中,ms中完成的健康检查--对活性的定义超时为3秒:
尝试禁用作为执行器健康检查(db、redis、diskspace、ping、刷新.)的一部分检查的所有组件--相同的行为。
一个重要的观察是,当增加更多的实例时,警告就会被拒绝,也就是通过阻塞任何传入的流量,警告也不会出现。在某种程度上,这个问题似乎是与资源相关的,而且某些东西是周期性地被扼杀的,但是所有可用的指标都很好。有什么建议吗?
发布于 2022-09-13 13:49:21
猫达到了最大的连接并导致了这种行为。由于一些不清楚的原因,在默认设置为10000时,环境中的server.tomcat.max-connections设置为1000。由于server.tomcat.max-connections属性在1.5.0版本中引入,而对1.4.5没有影响,所以这个问题在旧的spring引导(1.4.5)中是不可重现的。(运行时默认为- 10k)。
https://stackoverflow.com/questions/73680531
复制相似问题