我正在使用德玛巨蟒提交和监控作业到SGE (太阳网格引擎)。我在GUI中有以下状态
有时我找不到地位未定的工作。当我在SGE主机的终端上使用qstat检查作业状态时,我可以看到所有作业都在运行,而没有一个作业失败。状态未确定通常会误导用户,因为用户可能会认为状态未定的作业存在某种问题。
因此,我知道问题不在于SGE,而在于drmaa库。
有人知道为什么drmaa不能确定状态吗?
发布于 2013-02-28 20:10:20
DRMAA只是DRMAA C库的一个瘦ctype包装器,没有任何专门的逻辑。因此,您所看到的待定状态就是SGE DRMAA C库在您要求的时刻提供的内容。
据我所知,有时SGE的DRMAA C库无法获取状态。我建议在python应用程序中添加一些自定义重试逻辑,以便简单地重新询问调度程序。
https://stackoverflow.com/questions/14253832
复制相似问题