我刚刚加入了我的大学的一个研究实验室,并获得了访问集群的权限,以编译和运行我编写的c++代码。我使用SSH访问它,并像使用Linux终端一样简单地使用集群。
当我的代码运行时,我经常不得不等待相对较长的时间。我正在尝试找出是否有更有效的方式使用集群。例如,集群中有不同的CPU/节点,其中一些CPU/节点的使用率较高,另一些CPU/节点的使用率较低。如何访问特定的CPU?我可以访问"Ganglia“概述页面,其中提供了有关不同节点的信息。
另外,如果我在不同的SSH窗口中运行两个进程,它会自动使用不同的处理器或节点,还是必须手动指定。
我找不到任何文档来帮助我解决这些问题,所以我希望能得到一点帮助。
谢谢
发布于 2010-07-23 18:58:41
简单地在集群上运行一些东西并不意味着它完全利用了集群。默认情况下,它可能只在head节点上运行。需要专门为集群编写软件。
很可能会有某种调度器在运行,您需要与之交互。也许您还可以查看是否为您的特定集群安装和配置了distcc (用于在多台机器上执行编译)。还可能有一种特殊风格的MPI运行,以允许不同节点上的进程进行通信。
集群软件设置往往对硬件和计算环境非常专业。实际上,我建议您在提出这类问题之前先询问使用过该机器的人,因为您在这里收到的任何建议都不太可能完全准确地适用于您的特定集群。
https://stackoverflow.com/questions/3317391
复制相似问题