我正在设计一个架构,其中所有的微服务都是集群的。例如:5个web服务器,1个集群数据库,1个集群队列系统,8个集群工作者(如发送电子邮件、发送sms等)队列中的用户(任务由web服务器推送)
我想知道最好的做法是检测每个“微服务集群”是健康的,以及在这种情况下如何“快速故障”整个服务,其中一个微服务不可用。
所有的服务都在nginx for ha代理的后面--应该是nginx监视一切并失败吗?如何检查所有微服务的健康状况?
发布于 2015-02-24 08:36:41
您应该使用像Pingometer这样的外部监控服务。
这使您可以设置简单的运行状况检查(HTTP、HTTPS、Ping等)并在节点发生故障、不可用或未使用正确的内容响应时接收警报。
在您的联系人中,您可以设置一个在服务关闭时触发的webhook。您可以使用webhook触发故障转移、更改DNS记录等。
我们设置了类似的东西,它工作得很好。
你也可以在内部使用一些东西来监控nGinX本身(例如,降低工人的成本+重新培养他们),但这不会让你知道一个服务在外部运行(就像一个监控服务那样)。
https://stackoverflow.com/questions/28664781
复制相似问题