PCクラスタのベンチマーク
PCクラスタを作ろうと思っているのだけど、どれくらい早いの?
そんな疑問に答えるページです。
LINPACK
まず、スーパーコンピュータのランキングに使われる(Top500)ベンチマークである線形代数の行列計算の速度
マシン構成 |
計算能力 |
条件 |
1Core-1Node
PentiumD 1台の片方のCPUのみ |
5.04 GFlops |
N=12000 NB=100 P=1 Q=1 |
2Cores-1Node
PentiumD 1台の両方のCPU |
9.49 GFlops |
N=12000 NB=100 P=1 Q=2 |
8Cores-4Nodes
PentiumD 4台、合計8CPU |
33.18 GFlops |
N=28000 NB=100 P=2
Q=4 |
さすがに地球シミュレータの5120プロセッサを用いた35860GFlopsとは比べものにならないくらい低い値だけど、そもそも地球シミュレータでも1プロセッサあたり8GFlopsなので、健闘しているのだはないでしょうか。それより、計算機センターなど、普通に使えるスパコンが、どの程度の計算速度なのか調べて、実際にPCクラスタを作るか考えてもらいたいです。ただ、この計算環境を占有できるのは、おおきなメリットだと思います。
Gaussian
LINPACKの計算はあくまでもデモの計算なので、実際の化学計算がどれくらい速いかが重要である。Gaussiuanのテストファイルの中から、よくベンチマークに使われる入力を計算してみた。計測した時間は、実測のJOB投入前と後の実時間差である。
マシン構成 |
test397.com |
test415.com |
OS |
2Cores-1Node |
3611 sec |
1601 sec |
Fedore Core 5 x86_64 |
8Cores-4Nodes |
1321 sec |
1146 sec |
CentOS 3.7 i386 |
この結果が早いか遅いかは、他のページや実際に現状の環境でテストしてみて比べてもらいたい。
VASP
化学系の計算プログラムGaussianに対して、物理系のVASPに関してもテスト計算をしてみました。用いた入力ファイルはbench.Hgで、こちらのページなどを参考にして下さい。OUTCARファイルの中のLOOP+の後のCPU
TIMEの値を書き出しました。
マシン構成 |
bench.Hg CPU time |
|
1Core-1Node |
163.3 sec |
|
2Cores-1Node |
92.0 sec |
|
8Cores-4Nodes |
42.9 sec
26.7 sec |
vasp_gamma
-wNGZhalf |
VASPのベンチマークは、CPUの数、ノードの数をいろいろ変化させて測定したので、下記グラフにまとめました。ベンチ水銀の入力ファイルはKPOINTS1点計算であるため、サンプリング点による計算の分散ができません。そのため、ネットワークがボトルネックとなって、CPU数を増やしても、計算速度の増加があまり見られません。ただ、一般的な固体結晶の計算を行なった場合は、K点のサンプリングによる並列計算は、ネットワークの負荷がほとんど無く、CPU数に比例した計算速度の増加が期待できます。