文章/答案/技术大牛

发布

社区首页 >问答首页 >在启用HA的情况下，纱线上的闪烁会在尝试恢复时使所有RMs崩溃

问在启用HA的情况下，纱线上的闪烁会在尝试恢复时使所有RMs崩溃
EN

Stack Overflow用户

提问于 2017-03-08 21:54:33

回答 1查看 378关注 0票数 4

我试图让Flink (1.2.0)在启用了HA的Hadoop集群(CDH 5.10.0)上工作，但当我通过终止活动RM来测试它时，它会导致整个集群宕机。

我已经在flink-conf.yml中配置了Flink的HA

high-availability: zookeeper
high-availability.zookeeper.quorum: zookeeper1:2181,zookeeper2:2181,zookeeper3:2181
high-availability.zookeeper.storageDir: hdfs:///tmp/flink/recovery
high-availability.zookeeper.path.root: /flink
high-availability.zookeeper.path.namespace: /cluster1
yarn.application-attempts: 2

然后，我使用yarn-session.sh -n 2 -nm "Flink HA test"运行一个flink会话

当我尝试使用kill -9杀死活动RM时，YARN正确地切换到备用RM，并且我可以在一分钟内看到作为ACCEPTED的应用程序，但是很快备用RM崩溃抛出以下异常：

2017-03-08 12:29:36,997 FATAL org.apache.hadoop.yarn.server.resourcemanager.ResourceManager: Error in handling event type APP_ATTEMPT_ADDED to the scheduler
java.lang.NullPointerException
    at org.apache.hadoop.yarn.server.resourcemanager.scheduler.SchedulerApplicationAttempt.transferStateFromPreviousAttempt(SchedulerApplicationAttempt.java:601)
    at org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler.addApplicationAttempt(FairScheduler.java:698)
    at org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler.handle(FairScheduler.java:1303)
    at org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler.handle(FairScheduler.java:123)
    at org.apache.hadoop.yarn.server.resourcemanager.ResourceManager$SchedulerEventDispatcher$EventProcessor.run(ResourceManager.java:702)
    at java.lang.Thread.run(Thread.java:745)

如果我没有配置Flink的HA，问题就会消失。

你知道可能是什么引起的吗？

hadoop-yarn

apache-flink

cloudera-cdh

回答 1

Stack Overflow用户

发布于 2021-03-03 08:07:15

正如评论中所讨论的：

这可能是由于配置错误导致的纱线问题。

鉴于该问题只出现在非常旧的版本中(已经不支持)，可能不可能添加更多细节。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/42673204

复制

相似问题

问在启用HA的情况下，纱线上的闪烁会在尝试恢复时使所有RMs崩溃
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在启用HA的情况下，纱线上的闪烁会在尝试恢复时使所有RMs崩溃EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在启用HA的情况下，纱线上的闪烁会在尝试恢复时使所有RMs崩溃
EN