首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用大喷丝试验火花

用大喷丝试验火花
EN

Stack Overflow用户
提问于 2015-10-08 23:09:46
回答 1查看 364关注 0票数 2

我已按照指示安装了Tachyon和Spark:

http://tachyon-project.org/documentation/Running-Spark-on-Tachyon.html

然而,作为一名新手,我不知道如何将文件"X“放入塔奇扬文件系统,就像他们说的:

代码语言:javascript
复制
$ ./spark-shell
$ val s = sc.textFile("tachyon-ft://stanbyHost:19998/X")
$ s.count()
$ s.saveAsTextFile("tachyon-ft://activeHost:19998/Y")

我所做的就是指向一个现有的文件(我通过管理UI找到了这个文件):

代码语言:javascript
复制
scala> val s = sc.textFile("tachyon-ft://localhost:19998/root/default_tests_files/BasicFile_THROUGH")
s: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[1] at textFile at <console>:21

当我运行count时,我得到以下错误:

代码语言:javascript
复制
scala> s.count()
java.lang.NullPointerException: connectionString cannot be null

我想我的路错了。所以有两个问题:

  1. 如何将文件复制到塔奇扬?
  2. 它的FS的正确路径是什么?

对不起,非常新来的!!

更新1

我不确定tachyon-ft://localhost:19998/root/default_tests_files/BasicFile_THROUGH是否正确的路径。我无法通过浏览器或wget获得它。

这就是我在文件系统浏览器中看到的。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-10-12 21:19:22

我发现了问题。不是我干的

sc.hadoopConfiguration.set("fs.tachyon.impl", "tachyon.hadoop.TFS")

在我完成这个练习http://ampcamp.berkeley.edu/5/exercises/tachyon.html#run-spark-on-tachyon之后,我发现正确的途径是:

val file = sc.textFile("tachyon://localhost:19998/LICENSE")

所以我的设计还是不错的。这里的文档http://tachyon-project.org/documentation/Running-Spark-on-Tachyon.html给我带来了很多困惑。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/33027419

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档