我知道Apache Livy是用于从任何地方与spark进行交互的rest接口。那么,使用Apache Livy而不是spark-jobserver有什么好处呢?使用Livy作为替代的spark-jobserver的缺点是什么?我在网上找不到太多关于这个的信息。你能帮我弄清楚这一点吗。
谢谢,
发布于 2019-01-30 22:58:42
这里有几个与我的用例相关的主要区别。
Livy的优势:
SJS的优势:
此外,SJS有更好的文档,尽管在这两种情况下,它都不全面。当然,请记住,这两个项目都是v1之前的版本,所以事情可能很快就会发生变化。
在我的例子中,我们最终选择了SJS,因为我不需要提交代码片段,而Jar管理和HOCOCN配置很方便。然而,我正在考虑在不久的将来重新访问Livy,以进行更彻底的评估。
资料来源:
发布于 2018-09-28 01:38:18
截至2018年9月,Livy和(Ooyala) Spark Job-server之间唯一的主要区别是,尽管(当前版本的) Livy是基于Spark 2.2.0构建的,但运行Livy时使用的Spark版本不需要与用于构建Livy的版本相匹配。Livy internally handles the differences between different Spark versions.
这种行为与Spark作业服务器不同,Spark作业服务器使用的是Spark版本的tight coupling。
https://stackoverflow.com/questions/48855392
复制相似问题