我正在编写一个可能在任何集群资源调度程序上运行的应用程序(SGE、LSF或斯隆,举几个例子),使用非常基本的功能。
我想知道是否存在一个框架/抽象层,用于以产品无关的方式与此类工具交互?
发布于 2012-04-16 19:54:39
所有主要的资源调度程序都直接或通过DRMAA插件支持libray。大多数产品都支持v1 API,但是它的范围非常有限,它基本上只处理作业提交,并且只提供一个通用的功能子集。v2 API提供了作业控制和监视功能,但据我所知,它尚未被广泛采用。
发布于 2012-04-16 17:59:31
分布式计算的主流还没有采用抽象层类型的软件,这主要是因为大多数集群之间没有共享用户和资源。也有一些例外,例如,一些大学和学术机构使用秃鹰来利用遍布校园的台式计算机,但它并不适合某些类型的工作。
不过,如果您使用的不是PBS变体,甚至在这些调度器之间,在尝试利用某些特性时,可能会出现一些奇怪的不一致。
https://serverfault.com/questions/379950
复制相似问题