首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Flink插槽删除异常

Flink插槽删除异常
EN

Stack Overflow用户
提问于 2019-01-08 15:37:01
回答 5查看 3.2K关注 0票数 5

我得到以下异常

代码语言:javascript
复制
org.apache.flink.util.FlinkException: The assigned slot container_1546939492951_0001_01_003659_0 was removed.
at org.apache.flink.runtime.resourcemanager.slotmanager.SlotManager.removeSlot(SlotManager.java:789)
at org.apache.flink.runtime.resourcemanager.slotmanager.SlotManager.removeSlots(SlotManager.java:759)
at org.apache.flink.runtime.resourcemanager.slotmanager.SlotManager.internalUnregisterTaskManager(SlotManager.java:951)
at org.apache.flink.runtime.resourcemanager.slotmanager.SlotManager.unregisterTaskManager(SlotManager.java:372)
at org.apache.flink.runtime.resourcemanager.ResourceManager.closeTaskManagerConnection(ResourceManager.java:823)
at org.apache.flink.yarn.YarnResourceManager.lambda$onContainersCompleted$0(YarnResourceManager.java:346)
at org.apache.flink.runtime.rpc.akka.AkkaRpcActor.handleRunAsync(AkkaRpcActor.java:332)
at org.apache.flink.runtime.rpc.akka.AkkaRpcActor.handleRpcMessage(AkkaRpcActor.java:158)
at org.apache.flink.runtime.rpc.akka.FencedAkkaRpcActor.handleRpcMessage(FencedAkkaRpcActor.java:70)
at org.apache.flink.runtime.rpc.akka.AkkaRpcActor.onReceive(AkkaRpcActor.java:142)
at org.apache.flink.runtime.rpc.akka.FencedAkkaRpcActor.onReceive(FencedAkkaRpcActor.java:40)
at akka.actor.UntypedActor$$anonfun$receive$1.applyOrElse(UntypedActor.scala:165)
at akka.actor.Actor$class.aroundReceive(Actor.scala:502)
at akka.actor.UntypedActor.aroundReceive(UntypedActor.scala:95)
at akka.actor.ActorCell.receiveMessage(ActorCell.scala:526)
at akka.actor.ActorCell.invoke(ActorCell.scala:495)
at akka.dispatch.Mailbox.processMailbox(Mailbox.scala:257)
at akka.dispatch.Mailbox.run(Mailbox.scala:224)
at akka.dispatch.Mailbox.exec(Mailbox.scala:234)
at scala.concurrent.forkjoin.ForkJoinTask.doExec(ForkJoinTask.java:260)
at scala.concurrent.forkjoin.ForkJoinPool$WorkQueue.runTask(ForkJoinPool.java:1339)
at scala.concurrent.forkjoin.ForkJoinPool.runWorker(ForkJoinPool.java:1979)
at scala.concurrent.forkjoin.ForkJoinWorkerThread.run(ForkJoinWorkerThread.java:107)

当运行涉及连接两个非常大的数据集的批处理过程时。

这是我在概述中看到的。失败发生在一个没有得到任何输入的任务管理器上。奇怪的是,前一组(分区->平面映射->映射)没有向任务管理器发送任何东西,尽管前面有一个重新平衡。

正在电子病历上运行。我看到有一个slot.idle.timeout,这会有效果吗?如果有,我如何为该作业指定它?它能在命令行上完成吗?

EN

回答 5

Stack Overflow用户

发布于 2019-01-23 20:46:36

这可能是一个超时问题,但通常当这种情况发生在我身上时,是因为出现故障(例如,纱线杀死容器,因为它超出了pmem或vmem限制)。我建议仔细检查JobManager和所有TaskManager日志文件。

票数 4
EN

Stack Overflow用户

发布于 2019-05-11 08:53:43

您可以在java代码中添加以下行。

env.getCheckpointConfig().enableExternalizedCheckpoints(ExternalizedCheckpointCleanup.RETAIN_ON_CANCELLATION);

然后你的工作将自动开始取消。

票数 1
EN

Stack Overflow用户

发布于 2019-08-20 17:29:47

我有一个类似的问题,结果是过度伐木在我们的Flink工作。我猜这会导致任务管理器超时。移除或减少日志量解决了问题

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54095067

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档