ファイヤープロジェクト
問題作成
2003-12-07T00:00+09:00   matsu
このページでは練習用DBの問題作成を行なって,以降のページでそれをPostgreSQL上に構築し,その過程でSQL入門していこうと思う.
私はDB構築に関する経験がない.理由は,「日常生活でDBを使用するほど膨大なデータを扱って何かをする」という必要性がないからだ.興味はあるのだが,何せデータがない.ちょっとしたデータだとDBをやる面白味がないような気がして今まで取り掛かれずにいた.だが,いつまでもこういう状態では,一人の人間として問題があるような気がしないでもないので,思い切ってやってみようと思う.前置きが長くなったが,お題は
クラスタシステムのベンチマーク計測結果DB
にする.いろんなクラスタがあって,それぞれでいろんなベンチマークを計測してその結果を突っ込む.そして検索,参照する.
問題を作成してみる.あくまでDB構築の練習なので,ざっくりとしたものにする.クラスタのデータとして格納するデータは以下とする.
  • クラスタID
  • クラスタ名
  • CPU数
  • CPUクロック
  • メモリ容量
  • ネットワーク
ベンチマーク計測結果として格納するデータは以下とする.
  • 結果ID
  • クラスタID
  • パラメータ値
  • 計測結果
  • 計測日
ベンチマークによってパラメータが異なるので,ベンチマーク毎にテーブルを分ける.したがってベンチマーク名はフィールドとしてはない.
クラスタのデータを格納するテーブルclusterのサンプル.
クラスタIDクラスタ名CPU数CPUクロック(GHz)メモリ容量(MB)ネットワーク
1 hoge 256 1.5 512 100BASE-T
2 fuga 512 2 1024 1000BASE-TX
ベンチマークは二種類考えてみる.まずLinpackの計測結果を格納するテーブルresult-linpackのサンプル.パラメータがやたら多いので,抜粋.データの値は適当なので注意.
クラスタIDN(パラメータ)NB(パラメータ)Gflops(計測結果)計測日
110243212003-12-6
110246422003-12-7
120483232003-12-8
210246442003-12-9
210241652003-12-6
次にNetPipeの計測結果を格納するテーブルresult-netpipeのサンプル.
クラスタIDtype送受信データサイズ(パラメータ)Mbps(計測結果)計測日
1tcp1102003-11-1
1lam10502003-11-1
2tcp100102003-11-1
2tcp10001002003-11-1
2mpich100005002003-11-1
以上を踏まえてer図を書いてみた.
ちょととダメな雰囲気も感じるが,以降のページでこれをもとにDBを構築していく.
matsu(C)
Since 2002
Mail to matsu