首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >无法在局域网内运行MPI群集

无法在局域网内运行MPI群集
EN

Stack Overflow用户
提问于 2016-06-04 10:31:41
回答 1查看 921关注 0票数 0

这是我的/etc/host文件的快照

卡萨帕是主人,客户是奴隶

我已经成功地完成了

  1. 设置无密码SSH
  2. 挂载sudo mount -t nfs karpathy:/home/mpiuser/cloud ~/cloud

我可以通过ssh client登录到我的客户

我关注过这个博客http://mpitutorial.com/tutorials/running-an-mpi-cluster-within-a-lan/

mpirun -np 5 -hosts karpathy ./cpi输出

mpirun -np 5 -hosts client ./cpi

获取误差

[mpiexec@karpathy] HYDT_dmxu_poll_wait_for_event (./tools/demux/demux_poll.c:77): callback returned error status [mpiexec@karpathy] HYD_pmci_wait_for_completion (./pm/pmiserv/pmiserv_pmci.c:179): error waiting for event [mpiexec@karpathy] main (./ui/mpich/mpiexec.c:397): process manager error waiting for completion

EN

回答 1

Stack Overflow用户

发布于 2016-09-01 12:39:59

我希望你已经找到了解决办法,万一你没有找到,我建议你做几件事。1.通过以下操作禁用两个节点上的防火墙

sudo ufw禁用

‘2.创建一个名为machinefile (或任何您喜欢的)的文件,并将CPU的数量与主机名一起存储在两个节点中。我的机器文件包含:

master:8 slave:4

主机名是主从名,而8和4是每个节点上的CPU数。

  1. 编译使用

mpicc -o文件名filename.cpp

  1. 要运行,请使用机器文件作为参数

mpirun -np 12 -f机器文件./文件名

12是工序的数目。因为这两个节点都有12个CPU,所以最好在12个进程上划分代码。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37629129

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档