PCクラスタのベンチマーク


PCクラスタを作ろうと思っているのだけど、どれくらい早いの?
そんな疑問に答えるページです。

LINPACK

まず、スーパーコンピュータのランキングに使われる(Top500)ベンチマークである線形代数の行列計算の速度

 マシン構成  計算能力  条件 
 1Core-1Node
 PentiumD 1台の片方のCPUのみ
 5.04 GFlops  N=12000 NB=100 P=1 Q=1
 2Cores-1Node
 PentiumD 1台の両方のCPU
 9.49 GFlops  N=12000 NB=100 P=1 Q=2
 8Cores-4Nodes
 PentiumD 4台、合計8CPU
 33.18 GFlops  N=28000 NB=100 P=2 Q=4

さすがに地球シミュレータの5120プロセッサを用いた35860GFlopsとは比べものにならないくらい低い値だけど、そもそも地球シミュレータでも1プロセッサあたり8GFlopsなので、健闘しているのだはないでしょうか。それより、計算機センターなど、普通に使えるスパコンが、どの程度の計算速度なのか調べて、実際にPCクラスタを作るか考えてもらいたいです。ただ、この計算環境を占有できるのは、おおきなメリットだと思います。

Gaussian

LINPACKの計算はあくまでもデモの計算なので、実際の化学計算がどれくらい速いかが重要である。Gaussiuanのテストファイルの中から、よくベンチマークに使われる入力を計算してみた。計測した時間は、実測のJOB投入前と後の実時間差である。

 マシン構成  test397.com   test415.com   OS 
 2Cores-1Node  3611 sec  1601 sec  Fedore Core 5 x86_64
 8Cores-4Nodes  1321 sec   1146 sec   CentOS 3.7 i386

この結果が早いか遅いかは、他のページや実際に現状の環境でテストしてみて比べてもらいたい。

VASP

化学系の計算プログラムGaussianに対して、物理系のVASPに関してもテスト計算をしてみました。用いた入力ファイルはbench.Hgで、こちらのページなどを参考にして下さい。OUTCARファイルの中のLOOP+の後のCPU TIMEの値を書き出しました。

 マシン構成   bench.Hg CPU time  
 1Core-1Node    163.3 sec  
 2Cores-1Node    92.0 sec  
 8Cores-4Nodes   42.9 sec
  26.7 sec

  vasp_gamma -wNGZhalf 

VASPのベンチマークは、CPUの数、ノードの数をいろいろ変化させて測定したので、下記グラフにまとめました。ベンチ水銀の入力ファイルはKPOINTS1点計算であるため、サンプリング点による計算の分散ができません。そのため、ネットワークがボトルネックとなって、CPU数を増やしても、計算速度の増加があまり見られません。ただ、一般的な固体結晶の計算を行なった場合は、K点のサンプリングによる並列計算は、ネットワークの負荷がほとんど無く、CPU数に比例した計算速度の増加が期待できます。

 


back home next

inserted by FC2 system