我们有一个由Composer触发的DataFusion管道。这个管道提供了一个短暂的DataProc集群,在理想的情况下,集群在完成任务后终止。
在我们的例子中,有时,并不总是,这个短暂的DataProc集群处于运行状态。集群中的作业也处于运行状态,最后的日志消息如下:
INFO runtimejob.DataprocJobMain: Invoking initialize() on io.cdap.cdap.runtime.spi.runtimejob.DataprocRuntimeEnvironment with spark2_2.11
INFO runtimejob.DataprocJobMain: Invoking run() on io.cdap.cdap.internal.app.runtime.distributed.runtimejob.DefaultRuntimeJob
INFO runtimejob.DataprocJobMain: Invoking destroy() on io.cdap.cdap.internal.app.runtime.distributed.runtimejob.DefaultRuntimeJob
INFO runtimejob.DataprocJobMain: Runtime job completed.
Exception: java.lang.NoClassDefFoundError thrown from the UncaughtExceptionHandler in thread " STARTING-SendThread(cdap-<our-identifier>-1f11111b-1d11-11eb-b1a1-1a111fb11d11-m.c.<our-gcp-project-name>.internal:41409)"
Exception: java.lang.NoClassDefFoundError thrown from the UncaughtExceptionHandler in thread "threadDeathWatcher-2-1"在DataFusion端,标记为成功的管道。DataFusion日志如下:
Completed DEPROVISION subtask REQUESTING_DELETE for program run program_run: <data_fusion_namespace>.<pipeline_name>.-SNAPSHOT.workflow.DataPipelineWorkflow.<data_proc_id> //this message is repeated many-many times
DEBUG [provisioning-service-4:i.c.c.c.s.Retries@197] - Retries exhausted after 1 failures and 14 ms.有什么原因造成这个问题吗?
p.s.:将消息中的标识符替换为随机值
发布于 2021-03-29 20:41:41
你在运行哪一种版本的数据采集?另外,Dataproc集群的内存量是多少?有时,当Dataproc集群内存耗尽时,我们会发现这个问题。我建议增加记忆量。
https://stackoverflow.com/questions/66807255
复制相似问题