我有一个小型集群,其中一个节点具有RAID存储,几个功能强大的无盘计算节点通过PXE引导。所有节点都通过InfiniBand (和1G以太网进行引导)连接。
我需要在这个集群上部署Hadoop。
请建议最佳配置,因为我理解默认配置意味着所有计算节点都具有自小存储,但在我的情况下(如果我有NFS共享),它将通过网络复制太多。我已经找到了有关使用Hadoop和Lustre的资源,但是我不知道如何配置它。
发布于 2015-03-11 21:05:06
您所描述的可能是可能的,但是--而不是使用Hadoop特性--您正试图找到一种绕过它们的方法。
https://stackoverflow.com/questions/28970433
复制相似问题