我已经设置了AWS Glue来输出Spark事件日志,以便它们可以导入到Spark History Server中。AWS为此提供了一个CloudFormation stack,我只想在本地运行历史服务器并导入事件日志。我想使用Docker来做这件事,这样同事们就可以很容易地运行同样的东西。
我遇到了问题,因为历史服务器是一个守护进程,所以容器启动并立即关闭。
如何使Docker镜像保持活动状态?
我的Dockerfile如下
ARG SPARK_IMAGE=gcr.io/spark-operator/spark:v2.4.4
FROM ${SPARK_IMAGE}
RUN apk --update add coreutils
RUN mkdir /tmp/spark-events
ENTRYPOINT ["/opt/spark/sbin/start-history-server.sh"]我使用以下命令开始:
docker run -v ${PWD}/events:/tmp/spark-events -p 18080:18080 sparkhistoryserver发布于 2019-11-05 19:58:55
https://stackoverflow.com/questions/58710917
复制相似问题