我正在试图弄清楚我们是否应该在工作中尝试Condor或Sun Grid引擎(或者其他可能的东西)。
我们经常有很多未使用的WinXp工作站。希望我们可以使用wake-on-LAN,运行所有的作业,然后自动关闭。我们主要运行Matlab、Java或Python模拟来进行蒙特卡洛或参数探索。
以我对Condor的有限了解,听起来使用vm领域可能是一种无需修改现有代码即可处理快照的便捷方法。
对于这类工作,SGE或其他东西是否比condor更好?
发布于 2009-12-07 23:04:52
我会从Condor开始。它对Windows有很好的支持,当作业可以在某些机器上运行时,新版本具有内置的支持,可以通过一种非常可配置的方式发送wake- on -lan。它还可以根据用户定义的策略关闭机器。
发布于 2010-03-09 12:35:44
SGE并不真正支持windows。它与all kinds of caveats and missing bits on Windows一起提供。
我已经运行Condor pools很多年了,对于Linux和Windows机器上的周期窃取和专用的、永远在线的硬件,它都是一个极好的HTPC设置。它们最近添加的Rooster daemon允许您在作业周期之间将机器置于睡眠状态,并在池中出现新工作时唤醒它们。他们也有一个活跃的、非常有帮助的支持社区。检查点是Windows上唯一不可用的Condor特性。其他的都在那里了。随着VM的加入,检查点变得越来越不有用。真的:要成功地使用检查点,你需要能够重新链接整个代码堆栈。因此,如果您正在运行Matlab作业,即使是在Linux上,检查点也是不可能的。
如果你有关于在Windows上运行Condor的具体问题,我很乐意回答他们,分享我的经验。我在全球4个池中运行了Condor,所有池中总共有1500台专用计算机,另外还有大约1000台台式机可供用户捐赠。
发布于 2009-12-08 00:32:51
对于专用硬件,我会选择Grid Engine。
对于可能正在使用的机器上的清除时钟周期,我会使用Condor。
对于固定时间段的专用访问硬件,比如晚上和周末,我可能仍然会选择Condor,但也许能够说服自己使用Grid Engine。
https://stackoverflow.com/questions/1855129
复制相似问题