首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何列出活动的DISTCP作业?

如何列出活动的DISTCP作业?
EN

Stack Overflow用户
提问于 2017-08-02 10:54:21
回答 1查看 476关注 0票数 0

如何列出活动的DISTCP作业?

我在两个集群之间运行一个distcp作业。hadoop distcp hdfs://x/y /x/y

我想要不断地运行它,但是需要确保现有的distcp任务已经完成。

我在源集群和目标集群中都尝试了以下操作,但是我看不到复制操作。mapred job -list all

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-08-03 20:40:20

这基本上是Yarn api get applications by elapsedTime上的一个变化。在您的示例中,您可以使用RM集群应用程序API获取所有应用程序(不幸的是,它没有在name上进行筛选),然后过滤名称等于distcp的应用程序。以下说明如何使用jq进行筛选:

代码语言:javascript
复制
$ curl 'RMURL/ws/v1/cluster/apps' | jq '.apps.app[] | select (.name == "distcp")'

对于您的情况,如果您只对活动作业感兴趣,可以将states过滤器添加到API调用中。

代码语言:javascript
复制
$ curl 'RMURL/ws/v1/cluster/apps?states=NEW,NEW_SAVING,SUBMITTED,ACCEPTED,RUNNING' |\
    jq '.apps.app[] | select (.name == "distcp")'

API

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45458869

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档