トップ > メモ
Linux - MPICHで「p4_error: rm_start: net_conn_to_listener failed」と出て、実行ができない。
MPICHをインストールするときにあったエラーについて。
後の人のためにもメモを残しておく。
・環境
OS:CentOS 5.1(Network Install)
インストール時にいれたもの:拡張以外の「サーバ」や「仮想化」など全て
サーバ側:Pentium4 1.8GHz
クライアント側:Pentium3 700MHz
configure時の設定1:./configure -prefix=/usr/local/mpich-1.2.7
configure時の設定2:./configure --with-arch=LINUX --with-device=ch_p4 -prefix=/usr/local/mpich-1.2.7
・状況
インストールが完了してサンプルプログラムに対して「mpirun -np 1 cpi」などと
すると動作するが、プロセッサの数を増やして、ネットワーク経由で通信を
行おうとすると以下のようなエラーメッセージを出して、通信が開始されない。
[mpich@localhost examples]$ mpirun -np 3 cpi
rm_24622: p4_error: rm_start: net_conn_to_listener failed: 58309
p0_22481: p4_error: Child process exited while making connection to remote process on yasuharu-cs4: 0
rm_22485: p4_error: interrupt SIGx: 13
rm_22485: (8.210170) net_send: could not write to fd=4, errno = 32
rm_22485: (8.210319) net_send: could not write to fd=6, errno = 32
rm_22485: (8.210388) net_send: could not write to fd=7, errno = 32
rm_22485: (8.210422) net_send: could not write to fd=5, errno = 32
p0_22481: (10.339968) net_send: could not write to fd=4, errno = 32
いろいろとGoogleを使って調べてみたが、結局解決せず。
・対処
rshではなく、sshを使用して通信を行うようにした。
具体的には、configure時に
./configure --with-arch=LINUX -prefix=/usr/local/mpich-1.2.7 --enable-debug -rsh=ssh
とした。
sshは、パスワード無しで鍵を生成して、nfsを使って、/home/mpichを共有する。
(キーの生成方法は、他のサイトを参照してください)
これで、ひとつの鍵でお互いにアクセスできるようになる。
以上で、設定は完了。サンプルを動かしたら次のようになった。
[mpich@yasuharu-cs1 examples]$ mpirun -np 4 cpi
Process 0 on yasuharu-cs1
Process 1 on yasuharu-cs4
Process 2 on yasuharu-cs1
Process 3 on yasuharu-cs4
pi is approximately 3.1416009869231245, Error is 0.0000083333333314
wall clock time = 0.005795
一覧へ戻る
トップに戻る
作成日時:2008年 03月 15日 9時 43分 32秒