当分布式系统(如raft节点)发生意外行为时,请求或数据流的逻辑趋势通常只能由日志来分析。然而,由于分布式系统,这是困难的。我发现像希维兹这样的工具可以可视化通过日志的请求或数据流,但需要修改源代码。还有其他类似的入侵工具吗?
发布于 2022-06-14 04:00:23
有两种主要方法。一个是拥有一个工具,它可以访问每台服务器并搜索它们的日志。另一种选择是为日志设置一个中心位置,所有节点都将日志推送到该存储区--这就是AWS CloudWatch的工作方式。
在任何一种情况下,从运算符的角度来看,都有一个工具可以搜索所有日志。
第二部分你的问题-如何使这一分析有效。
首先,原木的质量应该很好。这是一件天真的事情,但它是非常重要的。我数不清我分析了多少次详细但无用的日志。
第二个挑战--如何分析跨越多个节点的进程。这就更复杂了。这里有两个主要特点:
https://stackoverflow.com/questions/72583567
复制相似问题