主题:如何在单机上装mpich2
cepheid
[专家分:70] 发布于 2010-08-17 19:39:00
在单机上装mpich2,
/etc/hosts里
127.0.0.1 localhost.localdomain localhost
127.0.0.1 node1
127.0.0.2 node2
127.0.0.3 node3
127.0.0.4 node4
127.0.0.5 node5
ssh可以进入每个节点,但用mpirun -n 2 程序时却出现
conn error in connect_lhs: Connection refused
并且
mpdcheck -l
出现如下错误
gethostbyaddr failed for this hosts's IP ***.***.***.***
如何解决阿?
最后更新于:2010-08-17 21:51:00
回复列表 (共9个回复)
沙发
cgl_lgs [专家分:21040] 发布于 2010-08-17 22:13:00
运行服务程序了么?
板凳
cepheid [专家分:70] 发布于 2010-08-17 22:40:00
运行服务了,
mpdboot -n 1 -f mpd.hosts
得到如下错误
mpdboot_LL (handle_mpd_output 415): failed to connect to mpd on LL
3 楼
cgl_lgs [专家分:21040] 发布于 2010-08-17 22:44:00
呵呵,看这提示服务都没跑起来啊,那当然你没法儿用mpirun啦:)
4 楼
cepheid [专家分:70] 发布于 2010-08-17 23:12:00
[quote]呵呵,看这提示服务都没跑起来啊,那当然你没法儿用mpirun啦:)[/quote]
那可能是什么原因导致这个服务没跑起来呢?
5 楼
cgl_lgs [专家分:21040] 发布于 2010-08-17 23:28:00
可能是路径设置不对或是hosts不对吧。
你先用:
mpd &
试试看能不能用再说:)
6 楼
cepheid [专家分:70] 发布于 2010-08-17 23:59:00
[quote]可能是路径设置不对或是hosts不对吧。
你先用:
mpd &
试试看能不能用再说:)[/quote]
已经mpd&了,
不能用
出现这个错误mpdrun -n 2 a.out
LL_mpdman_1: conn error in connect_lhs: Connection refused
LL_mpdman_1: conn error in connect_lhs: Connection refused
LL_mpdman_1: conn error in connect_lhs: Connection refused
LL_mpdman_1: conn error in connect_lhs: Connection refused
LL_mpdman_1: conn error in connect_lhs: Connection refused
LL_mpdman_1: conn error in connect_lhs: Connection refused
LL_mpdman_1: conn error in connect_lhs: Connection refused
LL_mpdman_1: conn error in connect_lhs: Connection refused
LL_mpdman_1 (connect_lhs 918): failed to connect to lhs at 218.83.175.155 60703
LL_mpdman_1 (run 197): lhs connect failed
^Cmpiexec_LL (mpiexec 440): mpiexec: failed to obtain sock from manager
7 楼
cgl_lgs [专家分:21040] 发布于 2010-08-18 00:10:00
运行mpd没有输出任何错误提示?
8 楼
cepheid [专家分:70] 发布于 2010-08-18 19:42:00
[quote]运行mpd没有输出任何错误提示?[/quote]
是的,没有任何错误提示
9 楼
cgl_lgs [专家分:21040] 发布于 2010-08-18 23:17:00
mpirun -hosts 1 localhost a.out
试试?
我来回复