我有一个两个节点的RabbitMQ 3.6.1集群(在AWS中的CentOS 6.8上),它似乎每30分钟定期重新启动一次。我只是通过这两台机器上的日志(/var/log/rabbitmq/rabbit@<hostname>.log)进行跟踪,以获得发生情况的时间轴。我已经把他们重新安排在这个名单上了:
Stopping RabbitMQ -> Stopped RabbitMQ applicationStatistics database startedKeep rabbit@10-101-100-173.ec2.internal listeners: the node is already backStopping RabbitMQ -> Stopped RabbitMQ applicationStatistics database startedKeep rabbit@10-101-101-48.ec2.internal listeners: the node is already back然后在19:52:11世界协调时才有更多的日志条目,在那里整个过程重复。当单个服务器重置时,与该服务器的任何连接都将关闭。
我有两个服务器之间的5672端口负载平衡,并且实际上可以看到这两个服务器在负载均衡器池中的健康检查都失败了,因此没有任何客户端可以连接。很明显,这会给我带来麻烦。

有谁知道为什么这两个节点每隔30分钟就会定期重新启动一次又一次?这些都是非常普通的万豪RabbitMQ安装,使用SaltStack自动集群来停止应用程序,使用其他主机名进行集群,然后启动应用程序。
发布于 2016-10-12 17:25:47
我想出了这个问题的答案。这是由我的盐州配置造成的。当我第一次设置系统时,我遵循RabbitMQ 聚类指南到一个T,这样我就设置了一个盐状态来停止应用程序,与所有RabbitMQ节点进行集群,然后重新启动应用程序。不管是否有新的节点集群,它都会这样做。
事实证明,它是重新启动的,因为我已经将我的高州时间表设置为每30分钟在这些系统上运行高级状态。因此,这是停止和启动RabbitMQ应用程序!通过测试rabbitmq_cluster.joined状态,我了解到它将首先检查集群状态,然后只在需要将host添加到集群时才停止/联接/启动。
谜团解开了!
https://serverfault.com/questions/808246
复制相似问题