ファイヤープロジェクト
GbEクラスタのnetpipe計測結果
2003-08-04T18:00+09:00   matsu
ここではnetpipeバージョン2.4のtcp,mpi(lam,mpich)での計測結果を示す.特にnttcpやnetpipeのtcpでの100BASE-TXと1000BASE-Tの違いがmpiではどうなるかに注目したい.
計測環境はnttcpの時と同様,ギガビハブは特に断らないかぎりPLANEX-8Pで,100BASE-TXのネットワークのハブはNETGEAR-8Pである.Netpipeのバージョンは2.4である.
この記事での機器の略称一覧表.
NIC/HUB略称名称
NIC3COM3Com 10/100 Managed NIC 3C905CX-TX-M
NICMELCO-32Bメルコ LGY-PCI32-GT
NICMELCO-32メルコ LCI-G1000T32
NICMELCO-64メルコ LCI-G1000T64
HUBMELCO-8Pメルコ LSW-GT-8W
HUBPLANEX-8PPLANEX FXG-08TE
HUBNETGEAR-8PNETGEAR FS2108
tcpでのnetpipeの計測結果を以下に示す.パラメータはデフォルトである. データ.
上のグラフでは,縦軸にMpbs,横軸にブロックあたりのバイト数をとっている.横軸は対数としている.3COMの最高値は90Mbps弱で,MELCO-32の最高値は155Mbps弱だった.nttcpの場合と同様,MELCO-32は3COMの1.7倍程度のバンド幅である.
lamでのnetpipeの計測結果を以下に示す.パラメータはやはりデフォルトである.データ.
上のグラフでは,縦軸にMpbs,横軸にブロックあたりのバイト数をとっている.横軸は対数としている.ちょっとそれっぽい雰囲気のグラフとなった.グラフでは両者ともにブロックあたりのバイト数65,000あたりから値が少し下がっている.最高値は3COMは83Mbps程度,MELCO-32では143Mbps弱だった.当然NPtcpの結果よりも低い値となっているが,MELCO-32が3COMの1.7倍程度のバンド幅である点は同じである.
mpichでのnetpipeの計測結果を以下に示す.パラメータはやはりデフォルトである.データ.
上のグラフでは,縦軸にMpbs,横軸にブロックあたりのバイト数をとっている.横軸は対数としている.グラフでは両者ともにブロックあたりのバイト数100,000前後で一度下がっている.最高値は3COMは86Mbps程度でMELCO-32は143Mbps程度である.これらの値はlamの場合とさほどかわらない.MNELCO-32は3COMの1.6倍程度である.今回の計測ではMELCO-32においてブロックあたりのバイト数が98304バイトのときに26.897008と妙に大きな値がでている(他はほとんど0).普通通信誤りは上位からみれば限りなく0に近くなくてはならないはずだが,これはどういうことだろうか.
NPmpiではmachinefileに記述したネットワーク名にかかわらず,ホスト名を使用しているように見える.今回の実験環境のように,表裏二面のネットワークを持つ場合,裏のホスト名をmacinefileに記述しても,/etc/hostnameと表のホスト名が一致するため表のネットワークを使用してしまう.この問題に対処するため,今回は/etc/hostsにおいて
  • 表のホスト情報をコメントアウト
  • 裏のIPのホスト名の欄に表のホスト名を記述.
として対処したが,/etc/hostnameを書き換えるなど,他の対処方法もあるかもしれない.
今回は,Netpipeを使用して,3COMとMELCO-32のネットワーク性能を計測した.NetpipeではTCPレベル,MPIレベルの二つのレベルで計測した.MPIの実装としてmpichとlamの二つを使用した.
  • 3COM,MELCO-32ともに,MPIレベル(lam,mpich)でのバンド幅はTCPレベルのものよりも若干の劣化がある.
  • MPIレベルのバンド幅においても,MELCO-32は3COMの1.7倍程度の優位性がある.
  • MELCO-32,NPmpi(mpich)でおおきな通信誤りが発生した.
matsu(C)
Since 2002
Mail to matsu