首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >运行状态下的GCP - CDAP Dataproc集群结构

运行状态下的GCP - CDAP Dataproc集群结构
EN

Stack Overflow用户
提问于 2021-03-25 20:37:34
回答 1查看 144关注 0票数 2

我们有一个由Composer触发的DataFusion管道。这个管道提供了一个短暂的DataProc集群,在理想的情况下,集群在完成任务后终止。

在我们的例子中,有时,并不总是,这个短暂的DataProc集群处于运行状态。集群中的作业也处于运行状态,最后的日志消息如下:

代码语言:javascript
复制
INFO runtimejob.DataprocJobMain: Invoking initialize() on io.cdap.cdap.runtime.spi.runtimejob.DataprocRuntimeEnvironment with spark2_2.11
INFO runtimejob.DataprocJobMain: Invoking run() on io.cdap.cdap.internal.app.runtime.distributed.runtimejob.DefaultRuntimeJob
INFO runtimejob.DataprocJobMain: Invoking destroy() on io.cdap.cdap.internal.app.runtime.distributed.runtimejob.DefaultRuntimeJob
INFO runtimejob.DataprocJobMain: Runtime job completed.
Exception: java.lang.NoClassDefFoundError thrown from the UncaughtExceptionHandler in thread " STARTING-SendThread(cdap-<our-identifier>-1f11111b-1d11-11eb-b1a1-1a111fb11d11-m.c.<our-gcp-project-name>.internal:41409)"
Exception: java.lang.NoClassDefFoundError thrown from the UncaughtExceptionHandler in thread "threadDeathWatcher-2-1"

在DataFusion端,标记为成功的管道。DataFusion日志如下:

代码语言:javascript
复制
Completed DEPROVISION subtask REQUESTING_DELETE for program run program_run: <data_fusion_namespace>.<pipeline_name>.-SNAPSHOT.workflow.DataPipelineWorkflow.<data_proc_id> //this message is repeated many-many times
DEBUG [provisioning-service-4:i.c.c.c.s.Retries@197] - Retries exhausted after 1 failures and 14 ms.

有什么原因造成这个问题吗?

p.s.:将消息中的标识符替换为随机值

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-03-29 20:41:41

你在运行哪一种版本的数据采集?另外,Dataproc集群的内存量是多少?有时,当Dataproc集群内存耗尽时,我们会发现这个问题。我建议增加记忆量。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66807255

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档