我已经使用Hortonworks Data Platform 2.5设置了一个Hadoop集群。我使用1个主节点和5个从(工作)节点。
每隔几天,我的一个(或多个)工作节点就会出现高负载,并且似乎会自动重启整个CentOS操作系统。重新启动后,Hadoop组件不再运行,必须通过Amabri管理UI手动重新启动。
下面是“崩溃”节点的屏幕截图(大约4小时前高负载值后重启):

下面是另一个“健康”工作节点的屏幕截图(所有其他工作节点都有相似的值):

节点在5个工作节点之间轮流崩溃,主节点似乎运行没有问题。
导致此问题的原因是什么?这些高负载值是从哪里来的?
发布于 2017-07-13 16:02:54
这似乎是一个内核问题,因为日志文件(例如/var/spool/abrt/vmcore-127.0.0.1-2017-06-26-12:27:34/backtrace)如下所示
Version: 3.10.0-327.el7.x86_64
BUG: unable to handle kernel NULL pointer dereference at 00000000000001a0在运行sudo yum update之后,我得到了内核版本
[root@myhost ~]# uname -r
3.10.0-514.26.2.el7.x86_64自从操作系统更新后,这个问题就不再发生了。我会观察这个问题,并在必要时给出反馈。
https://stackoverflow.com/questions/44762555
复制相似问题