できた

MPICHのインストールが完了して、実行できることを確認した。
かなり、時間がかかったなぁ。。。

いまいち理由はわからないけど、rshではなく、パスワード無しの
sshに変えたら、うまく動くようになった。

とりあえず、後の人のためにも、参考程度にエラーメッセージとかを
貼り付けておく。

・環境
OS:CentOS 5.1(Network Install)
インストール時にいれたもの:拡張以外の「サーバ」や「仮想化」など全て
サーバ側:Pentium4 1.8GHz
クライアント側:Pentium3 700MHz
configure時の設定1:./configure -prefix=/usr/local/mpich-1.2.7
configure時の設定2:./configure --with-arch=LINUX --with-device=ch_p4 -prefix=/usr/local/mpich-1.2.7

・状況
インストールが完了してサンプルプログラムに対して「mpirun -np 1 cpi」などと
すると動作するが、プロセッサの数を増やして、ネットワーク経由で通信を
行おうとすると以下のようなエラーメッセージを出して、通信が開始されない。

[mpich@localhost examples]$ mpirun -np 3 cpi
rm24622: p4error: rmstart: netconntolistener failed: 58309
p022481: p4error: Child process exited while making connection to remote process on yasuharu-cs4: 0
rm22485: p4error: interrupt SIGx: 13
rm22485: (8.210170) netsend: could not write to fd=4, errno = 32
rm22485: (8.210319) netsend: could not write to fd=6, errno = 32
rm22485: (8.210388) netsend: could not write to fd=7, errno = 32
rm22485: (8.210422) netsend: could not write to fd=5, errno = 32
p022481: (10.339968) netsend: could not write to fd=4, errno = 32

いろいろとGoogleを使って調べてみたが、結局解決せず。

・対処
rshではなく、sshを使用して通信を行うようにした。
具体的には、configure時に

./configure --with-arch=LINUX -prefix=/usr/local/mpich-1.2.7 --enable-debug -rsh=ssh

とした。
sshは、パスワード無しで鍵を生成して、nfsを使って、/home/mpichを共有する。
(キーの生成方法は、他のサイトを参照してください)
これで、ひとつの鍵でお互いにアクセスできるようになる。

以上で、設定は完了。サンプルを動かしたら次のようになった。

[mpich@yasuharu-cs1 examples]$ mpirun -np 4 cpi
Process 0 on yasuharu-cs1
Process 1 on yasuharu-cs4
Process 2 on yasuharu-cs1
Process 3 on yasuharu-cs4
pi is approximately 3.1416009869231245, Error is 0.0000083333333314
wall clock time = 0.005795

Posted at : 2008-03-15 09:41:42 / Category : none

Comments

まだコメントはありません / No comment.

Send comment


Name


Mail-address (empty is OK. If you want to notify update, please fill mail-address.)


Bot check code (240329 と入力してください / Please input 240329.)