首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在我的mesos框架中大约有5-10%的执行者丢失

在我的mesos框架中大约有5-10%的执行者丢失
EN

Stack Overflow用户
提问于 2015-05-28 06:34:52
回答 1查看 139关注 0票数 0

我有一个200节点的mesos集群,可以同时运行大约2700个执行器。大约5-10%的执行者在一开始就迷失了。它们只在解压executor tar文件之前执行。

代码语言:javascript
复制
WARNING: Logging before InitGoogleLogging() is written to STDERR I0617 21:35:09.947180 45885 fetcher.cpp:76] Fetching URI 'http://download_url/remote_executor.tgz' I0617 21:35:09.947273 45885 fetcher.cpp:126] Downloading 'http://download_url/remote_executor.tgz' to '/mesos_dir/remote_executor.tgz' I0617 21:35:57.551722 45885 fetcher.cpp:64] Extracted resource '/mesos_dir/remote_executor.tgz' into '/extracting_mesos_dir/'

如果其他人面临这个问题,请让我知道。

我使用python来实现调度器和执行器。executor代码是扩展基类“Executor”的python文件。我已经实现了Executor类的launchTasks方法,它只是执行executor应该做的事情。

executor信息为:

代码语言:javascript
复制
    executor = mesos_pb2.ExecutorInfo()
    executor.executor_id.value = "executor-%s" % (str(task_id),)
    executor.command.value = 'python -m myexecutor'

    # where to download executor from
    tar_uri = '%s/remote_executor.tgz' % (
        self.conf.remote_executor_cache_url)
    executor.command.uris.add().value = tar_uri
    executor.name = 'some_executor_name'
    executor.source = "executor_test"
EN

回答 1

Stack Overflow用户

发布于 2015-05-28 12:36:30

你能提供更多关于你的执行者应该做什么的细节(充其量是ExecutorInfo定义和执行者本身)吗?用来启动执行器的命令(CommandInfo)是什么?

例如,executor的定义可以看一下Rendler。它包括sample executorExecutorInfo definition。Rendler还包括Java、GO、Python、Scala和Haskell的示例。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30494267

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档