我在一台有4个GPU的机器上运行Jenkins,并使用nvidia-docker运行Jenkins作业以使用GPU。有一个我可以传递给nvidia-docker的NVIDIA_VISIBLE_DEVICES属性,让我来指定哪些GPU可以在容器中访问。我想要做的是使用Jenkins来管理GPU资源并相应地对作业进行排队,即制作参数化作业,询问用户该作业需要多少GPU,当GPU可用时,它可以排队并启动作业。理想情况下,我希望在多个从节点上执行此操作,例如,每个节点都有4个GPU。
这看起来可能吗?
发布于 2018-06-02 19:29:43
lock这一步应该会让你走得更远。它提供了几个选项来创建和使用/锁定对在几个构建之间共享的资源的访问。
请注意,作业将被声明,然后在执行过程中被阻塞(所以不要将lock放在node分配中)。
https://stackoverflow.com/questions/50613053
复制相似问题