我们已经设置了一个包含6个从节点的集群。当其中一个DataNode死亡时,我想看看复制是如何发生的。
我登录其中一个奴隶,并使用杀害-9命令杀死了DataNode。过了一段时间,DataNode会自动重新启动,HDFS恢复到健康状态。我要验证这一点,因为DataNode的PID已经改变了。
我没有看到任何关于DataNode的上述行为的文档。这是Apache或Cloudera特性吗?如对文件有任何参考,将不胜感激。
发布于 2014-09-01 10:16:16
由于datanode的pid已被更改,我不认为它是datanode的行为。如果使用Cloudera管理集群,则有一个选项可以在datanode守护进程失败时重新启动它(自动重新启动进程)。默认情况下将设置此选项。当datanode进程失败或终止时,当设置了自动重新启动选项时,Cloudera Scm agent将启动datanode守护进程。
对于自动重新启动选项:选择HDFS服务->,转到配置部分,->搜索automatic restart。
这个特性在CM 4.X发行版中也是可用的。
https://stackoverflow.com/questions/25592541
复制相似问题