我需要使用现有数据从多个服务器构建分布式防故障(尽可能)集群。我刚接触Hadoop,但据我所知,Hadoop比其他产品更能满足我的需求。问题是,我已经有一些数据(相当大的文件),我希望在Hadoop中可用。是否可以将已有数据的服务器作为DataNode添加到Hadoop中?我该怎么做才能做到这一点呢?
发布于 2015-10-26 13:05:43
这似乎是不可能的,除非在该计算机上部署DataNode后将现有数据移动到HDFS
https://stackoverflow.com/questions/33267461
复制相似问题