首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >无法用火花运行火花--1.6.1-bin-hadoop1

无法用火花运行火花--1.6.1-bin-hadoop1
EN

Stack Overflow用户
提问于 2016-05-17 15:40:39
回答 1查看 166关注 0票数 1

我正在尝试使用Spark-1.6.1-bin- hadoop 1(Hadoop1.X的预构建包)运行火花特瑞索

当我试图运行火花:

代码语言:javascript
复制
./bin/spark-submit --class com.github.ehiggs.spark.terasort.TeraGen  ~/spark-terasort/target/spark-terasort-1.0-jar-with-dependencies.jar 100G hdfs:///input_terasort

我知道错误:

线程"main“java.lang.IncompatibleClassChangeError中的异常:找到类org.apache.hadoop.mapreduce.JobContext,但接口是预期的

这可能与不同的Hadoop版本有关(火花和火花-terasort之间)。我试过玩pom.xml (以前编译火花-terasort),但没有成功。

如何使用火花-1.6.1-bin-hadoop1 1?

EN

回答 1

Stack Overflow用户

发布于 2016-05-17 15:57:53

spark-terasort是旧的:

代码语言:javascript
复制
  <scala.binary.version>2.10</scala.binary.version>
  <spark.version>1.2.1</spark.version>

我正在考虑修补它。会回来..。

Update --我尝试过使用1.6.0-SNAPSHOT和TeraGen --工作得很好。

代码语言:javascript
复制
Input size: 1000KB
Total number of records: 10000
Number of output partitions: 2
Number of records/output partition: 5000
===========================================================================
===========================================================================
Number of records written: 10000

这是针对本地文件系统运行时的情况。我将在大约12小时后看到真正的hdfs。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37280725

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档