首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在HDFS或S3以外的分布式文件系统上运行Spark或Flink

在HDFS或S3以外的分布式文件系统上运行Spark或Flink
EN

Stack Overflow用户
提问于 2020-03-31 19:42:54
回答 1查看 83关注 0票数 0

有没有一种方法可以在分布式文件系统上运行Spark或Flink,比如lustre,或者除了HDFS或者S3之外的任何东西。

因此,我们可以使用Unix集群创建分布式文件系统框架,我们是否可以在集群模式下运行spark/flink,而不是独立运行。

EN

回答 1

Stack Overflow用户

发布于 2020-04-01 00:26:29

如果每个节点都可以访问公共路径,并且*您的应用程序已配置为使用这些公共路径来共享源库、源数据、中间数据和最终数据,则您可以使用file:///作为DFS

像lustre这样的东西往往会做到这一点,并且/或者有一个特定的hadoop文件系统客户端库来包装/扩展它。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60949777

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档