我正在寻找一种以事件驱动的方式收集单个hadoop作业的所有计数器和度量的方法,以便在elasticsearch中存储所有这些数据,以便以后进行故障排除和分析。
目前,我发现了一些似乎符合要求的方法:
那么,我想问的是,是否还有更简单的方法来收集单个hadoop作业的度量和计数器?
发布于 2016-09-14 21:14:25
实际上,您可以将度量标准提供给任何收件人:实现自己的MetricsSink并配置hadoop来使用它。
或者,您可以使用已经与Hadoop发行版捆绑在一起的MetricsSink,如GraphiteSink,并在Graphite中获取度量标准。
注意,在作业完成之前,某些计数器是不可用的(成功与否)。
另外,选项2也有可能使HistoryServer陷入麻烦(当您使用大量映射器进行投票以获得一份工作时,它可能是OOM)。
https://stackoverflow.com/questions/39490108
复制相似问题