如何在分布式应用程序中具有容错性?据我所知,监督树只是用来监督当地的过程(如果我是对的话?)如何监督在远程节点上生成的远程进程。我需要监督他们,在失败的情况下重启他们?
发布于 2014-05-17 10:20:43
看看OTP设计原则,特别是第9个分布式应用程序章和9.4故障转移和9.5接管子章节。
如果你对主题感兴趣,你应该看看著名的论文在软件错误的情况下建立可靠的分布式系统,还有一堆关于主题的出版书籍。一些材料也是在线3免费电子书和关于Erlang的教程.例如,有关分发远距离的讨论。
TL;TR?长话短说,正如您所写的,您必须监视对方的主管树,并在发生故障时重新启动。您甚至可以重新发明轮子,因为Erlang本身为它提供了很好的工具,或者使用现有的解决方案--从裸OTP到核心。
https://stackoverflow.com/questions/23709783
复制相似问题