问在HDFS或S3以外的分布式文件系统上运行Spark或Flink
EN

Stack Overflow用户

提问于 2020-03-31 19:42:54

回答 1查看 83关注 0票数 0

有没有一种方法可以在分布式文件系统上运行Spark或Flink，比如lustre，或者除了HDFS或者S3之外的任何东西。

因此，我们可以使用Unix集群创建分布式文件系统框架，我们是否可以在集群模式下运行spark/flink，而不是独立运行。

发布于 2020-04-01 00:26:29

如果每个节点都可以访问公共路径，并且*您的应用程序已配置为使用这些公共路径来共享源库、源数据、中间数据和最终数据，则您可以使用file:///作为DFS

像lustre这样的东西往往会做到这一点，并且/或者有一个特定的hadoop文件系统客户端库来包装/扩展它。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/60949777

复制

相似问题

问在HDFS或S3以外的分布式文件系统上运行Spark或FlinkEN