回 帖 发 新 帖 刷新版面

主题:如何在单机上装mpich2

在单机上装mpich2,
/etc/hosts里
127.0.0.1               localhost.localdomain   localhost
127.0.0.1 node1
127.0.0.2 node2
127.0.0.3 node3
127.0.0.4 node4
127.0.0.5 node5


ssh可以进入每个节点,但用mpirun -n 2 程序时却出现
 conn error in connect_lhs: Connection refused


并且

mpdcheck -l
出现如下错误
gethostbyaddr failed for this hosts's IP ***.***.***.***

如何解决阿?

回复列表 (共9个回复)

沙发

运行服务程序了么?

板凳


运行服务了,

mpdboot -n 1 -f mpd.hosts
得到如下错误
mpdboot_LL (handle_mpd_output 415): failed to connect to mpd on LL

3 楼

呵呵,看这提示服务都没跑起来啊,那当然你没法儿用mpirun啦:)

4 楼

[quote]呵呵,看这提示服务都没跑起来啊,那当然你没法儿用mpirun啦:)[/quote]
那可能是什么原因导致这个服务没跑起来呢?

5 楼

可能是路径设置不对或是hosts不对吧。
你先用:
mpd &
试试看能不能用再说:)

6 楼

[quote]可能是路径设置不对或是hosts不对吧。
你先用:
mpd &
试试看能不能用再说:)[/quote]

已经mpd&了,
不能用

出现这个错误mpdrun -n 2 a.out 
LL_mpdman_1: conn error in connect_lhs: Connection refused
LL_mpdman_1: conn error in connect_lhs: Connection refused
LL_mpdman_1: conn error in connect_lhs: Connection refused
LL_mpdman_1: conn error in connect_lhs: Connection refused
LL_mpdman_1: conn error in connect_lhs: Connection refused
LL_mpdman_1: conn error in connect_lhs: Connection refused
LL_mpdman_1: conn error in connect_lhs: Connection refused
LL_mpdman_1: conn error in connect_lhs: Connection refused
LL_mpdman_1 (connect_lhs 918): failed to connect to lhs at 218.83.175.155 60703
LL_mpdman_1 (run 197): lhs connect failed
^Cmpiexec_LL (mpiexec 440): mpiexec: failed to obtain sock from manager

7 楼

运行mpd没有输出任何错误提示?

8 楼

[quote]运行mpd没有输出任何错误提示?[/quote]
是的,没有任何错误提示

9 楼

mpirun -hosts 1 localhost a.out
试试?

我来回复

您尚未登录,请登录后再回复。点此登录或注册