几乎每天都会下降一次。
FATAL namenode.FSEditLog (JournalSet.java:mapJournalsAndReportErrors(398)) -
**Error: flush failed for required journal** (JournalAndStream(mgr=QJM to [< ip >:8485, < ip >:8485, < ip >:8485], stream=QuorumOutputStream starting at txid <>))
java.io.IOException: Timed out waiting 20000ms for a quorum of nodes to respond.
at org.apache.hadoop.hdfs.qjournal.client.AsyncLoggerSet.waitForWriteQuorum(AsyncLoggerSet.java:137)
at org.apache.hadoop.hdfs.qjournal.client.QuorumOutputStream.flushAndSync(QuorumOutputStream.java:107)
at org.apache.hadoop.hdfs.server.namenode.EditLogOutputStream.flush(EditLogOutputStream.java:113)
at 有人能给我建议一下,要解决这个问题,我需要做些什么?
我使用VM作为日志节点和主节点。会引起什么问题吗?
发布于 2017-12-07 23:59:34
在我的例子中,这个问题是由于集群节点之间的系统时间不同造成的。
为了保持系统时间同步,我们可以在每个节点中执行下面的命令。
sudo service ntpd stop
sudo ntpdate pool.ntp.org # Run this command multiple times
sudo service ntpd start如果hue关闭,请在hue服务器计算机上运行以下命令
sudo service hue start如果namenode已关闭,则启动namenode。
循环修复
在环境的所有节点上为根用户添加一个crontab。
或
安装VM工具,以保持系统时间同步。
发布于 2016-05-03 01:14:34
从你粘贴的错误。您的日志节点似乎无法及时与NN对话。发生这件事的时候发生了什么?
既然您提到您的节点是vms,那么我猜您重载了虚拟机监控程序,或者从NN到JN和zk仲裁的对话很麻烦。
https://stackoverflow.com/questions/36778044
复制相似问题