当ambari版本为2.6.x时,我们有带有872台数据节点计算机的ambari集群
我们现在有一些网络问题,
经过长时间的调查,我们发现在某些机器上运行的ambari代理与ambari服务器的通信不太好。
因此,我们从ambari仪表板,中得到了5个死区数据节点的奇怪行为,同时数据节点机器也是健康的。
在ambari代理配置中是否有可能给出更多的容忍值,以便ambari代理与ambari服务器之间的ack在较短的时间后才能忽略网络问题?
类似于ambari代理与ambari服务器之间的超时或时间连接之类的内容。
发布于 2020-07-18 02:15:27
首先,您需要了解为什么Data显示为Dead的问题的根源。
service ambari-agent status检查特定节点中的Ambari代理状态。同样,您可以在worker节点中检查ambari-agent.log,以检查Ambari代理为什么停止工作。。
发布于 2020-05-09 21:33:02
您可以在ambari代理中为服务任务( http超时值)配置http超时。
https://github.com/apache/ambari/blob/trunk/ambari-agent/conf/unix/ambari-agent.ini
有一个HTTP超时部分,您可以根据网络吞吐量来配置它。
该文件应位于/etc/ambari-agent/ambari.properties中。
https://stackoverflow.com/questions/61640279
复制相似问题