问将文件指向hadoop集群
EN

Stack Overflow用户

提问于 2015-11-25 04:05:04

回答 1查看 65关注 0票数 0

我在服务器上存储了一个文件。我希望在运行spark时将文件指向Hadoop集群。我所拥有的是，我可以将星火上下文指向hadoop集群，但是由于它指向集群，所以不能在spark中访问数据。我将数据存储在本地，所以为了访问数据，我必须在本地指向它。但是，这会导致大量内存错误。我希望做的是在集群上指出星火，但同时访问本地存储的数据。请给我一些方法，我可以做这件事。

scala

apache-spark

bigdata

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-12-19 10:57:57

Spark (在Hadoop上)无法读取本地存储的文件。记住spark是一个运行在多台机器上的分布式系统，因此它不能直接读取某个节点(本地主机除外)上的数据。

您应该将该文件放在HDFS上，并让spark从那里读取它。

要在本地访问它，应该使用hadoop fs -get <hdfs filepath>或hadoop fs -cat <hdfs filepath>命令。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/33908309

复制

相似问题

问将文件指向hadoop集群
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将文件指向hadoop集群EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将文件指向hadoop集群
EN