我们的分析设置如下: cloudera安装程序存在于unix服务器中。我们的web应用程序将对大数据平台进行rest调用(我们的web是在私有云中,ssh不允许从我的云中)。我需要从web向spark服务器( cloudera安装程序的一部分)发出rest请求,因此我们决定使用livy或spark作业服务器。现在,我需要知道我们必须在哪里安装livy或spark作业服务器...is,它必须安装在datanode中,或者在纱线的情况下,我需要在安装资源管理器的地方安装它,或者我们可以在一个完全不同的unix框中安装它。
发布于 2020-12-30 18:13:53
现在,我需要知道我们必须在哪里安装livy或spark作业服务器...is,它必须安装在datanode中,或者在纱线的情况下,我需要在安装资源管理器的地方安装它,或者我们可以在一个完全不同的unix框中安装它。
它们只是另一种软件,所以您可以在任何服务器上安装它们,比如安装spark集群的地方,或者网络中的任何服务器。这些作业服务器的工作是提交您的作业以触发。
发布于 2018-10-19 14:30:14
您可以在hadoop集群的任何服务器上安装livy。
服务器不必是datanode,您可以将其添加为集群的网关。
网关节点是集群网络中的服务器,也可以充当访问集群的外部服务的网关。
您可以在这里找到关于如何设置网关节点的更多信息:setup.html
https://stackoverflow.com/questions/52891331
复制相似问题