首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Windows: Apache火花历史服务器Config

Windows: Apache火花历史服务器Config
EN

Stack Overflow用户
提问于 2016-07-17 08:53:45
回答 2查看 2.7K关注 0票数 0

我想使用Spark的历史服务器来使用我的Web的日志机制,但是我发现在我的Windows机器上运行这段代码有些困难。

我做了以下工作:

将星星之火-defaults.conf文件设置为反映

代码语言:javascript
复制
spark.eventLog.enabled=true
spark.eventLog.dir=file://C:/spark-1.6.2-bin-hadoop2.6/logs
spark.history.fs.logDirectory=file://C:/spark-1.6.2-bin-hadoop2.6/logs

我的火花-env.sh反映:

代码语言:javascript
复制
SPARK_LOG_DIR    "file://C:/spark-1.6.2-bin-hadoop2.6/logs"
SPARK_HISTORY_OPTS   "-Dspark.history.fs.logDirectory=file://C:/spark-1.6.2-bin-hadoop2.6/logs"

我使用Git-BASH运行启动历史记录-server.sh文件,如下所示:

代码语言:javascript
复制
USERA@SYUHUH MINGW64 /c/spark-1.6.2-bin-hadoop2.6/sbin
$ sh start-history-server.sh

我得到了一个错误:

代码语言:javascript
复制
USERA@SYUHUH MINGW64 /c/spark-1.6.2-bin-hadoop2.6/sbin
$ sh start-history-server.sh
C:\spark-1.6.2-bin-hadoop2.6/conf/spark-env.sh: line 69: SPARK_LOG_DIR: command not found
C:\spark-1.6.2-bin-hadoop2.6/conf/spark-env.sh: line 70: SPARK_HISTORY_OPTS: command not found
ps: unknown option -- o
Try `ps --help' for more information.
starting org.apache.spark.deploy.history.HistoryServer, logging to C:\spark-1.6.2-bin-hadoop2.6/logs/spark--org.apache.spark.deploy.history.HistoryServer-1-SGPF02M9ZB.out
ps: unknown option -- o
Try `ps --help' for more information.
failed to launch org.apache.spark.deploy.history.HistoryServer:
  Spark Command: C:\Program Files (x86)\Java\jdk1.8.0_91\bin\java -cp C:\spark-1.6.2-bin-hadoop2.6/conf\;C:\spark-1.6.2-bin-hadoop2.6/lib/spark-assembly-1.6.2-hadoop2.6.0.jar;C:\spark-1.6.2-bin-hadoop2.6\lib\datanucleus-api-jdo-3.2.6.jar;C:\spark-1.6.2-bin-hadoop2.6\lib\datanucleus-core-3.2.10.jar;C:\spark-1.6.2-bin-hadoop2.6\lib\datanucleus-rdbms-3.2.9.jar -Xms1g -Xmx1g org.apache.spark.deploy.history.HistoryServer
  ========================================
full log in C:\spark-1.6.2-bin-hadoop2.6/logs/spark--org.apache.spark.deploy.history.HistoryServer-1-SGPF02M9ZB.out

输出的完整日志可以在下面找到:

代码语言:javascript
复制
Spark Command: C:\Program Files (x86)\Java\jdk1.8.0_91\bin\java -cp C:\spark-1.6.2-bin-hadoop2.6/conf\;C:\spark-1.6.2-bin-hadoop2.6/lib/spark-assembly-1.6.2-hadoop2.6.0.jar;C:\spark-1.6.2-bin-hadoop2.6\lib\datanucleus-api-jdo-3.2.6.jar;C:\spark-1.6.2-bin-hadoop2.6\lib\datanucleus-core-3.2.10.jar;C:\spark-1.6.2-bin-hadoop2.6\lib\datanucleus-rdbms-3.2.9.jar -Xms1g -Xmx1g org.apache.spark.deploy.history.HistoryServer
========================================

我正在运行一个sparkR脚本,在该脚本中,我初始化我的spark上下文,然后调用init()。

请告知我是否应该在运行星火脚本之前运行历史服务器?

非常感谢继续前进的指针和提示(关于日志)。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2016-07-17 11:00:41

在Windows上,您需要运行星火(而不是.sh )的.cmd文件。据我所见,没有用于星火历史服务器的.cmd脚本。所以基本上它需要手动运行。

我遵循了历史服务器Linux脚本,为了在Windows上手动运行它,您需要执行以下步骤:

  • 所有历史服务器配置都应该设置在spark-defaults.conf文件(删除.template后缀),如下所述
  • 您应该转到spark目录并将spark.history.*配置添加到%SPARK_HOME%/conf/spark-defaults.conf中。详情如下: spark.eventLog.enabled true spark.history.fs.logDirectory file:///c:/logs/dir/path
  • 配置完成后,从%SPARK_HOME%运行以下命令 bin\spark-class.cmd org.apache.spark.deploy.history.HistoryServer
  • 输出应该是这样的: 16/07/22 18:51:23 INFO Utils: Successfully started service on port 18080. 16/07/22 18:51:23 INFO HistoryServer: Started HistoryServer at http://10.0.240.108:18080 16/07/22 18:52:09 INFO ShutdownHookManager: Shutdown hook called

希望这会有帮助!

票数 4
EN

Stack Overflow用户

发布于 2017-05-12 18:46:42

如果有人得到浮动异常:

代码语言:javascript
复制
17/05/12 20:27:50 ERROR FsHistoryProvider: Exception encountered when attempting
 to load application log file:/C:/Spark/Logs/spark--org.apache.spark.deploy.hist
ory.HistoryServer-1-Arsalan-PC.out
java.lang.IllegalArgumentException: Codec [out] is not available. Consider setti
ng spark.io.compression.codec=snappy
        at org.apache.spark.io.CompressionCodec$$anonfun$createCodec$1.apply(Com

只需转到SparkHome/config/smack-defaults.conf并设置spark.eventLog.compress false

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/38419493

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档