SX-Aurora TSUBASAではじめるベクトルプログラミング(PDF)

【比較】理研日の丸スパコン「京」と「富岳」の違いを調べてみた!ついでもSXATも!

この記事は約5分で読めます。

みなさん、こんにちわ。Vectory(@vectorywork)です。

 

先日、富岳が無事出荷されましたね。

スーパーコンピュータ「富岳」の出荷を開始(2019年12月2日)

 

さて富岳は今までの京とはどう違うのか。

そのあたりを今回は見ていきたいと思います。

 

【比較】理研の日の丸スパコン「京」と「富岳」の違い

新しい日の丸スパコン「富岳」と一世代前の「京」との違いについてスペックを中心に比較していきたいと思います。

 

CPUがSPARCからArmへ変わった

富岳
参考リンクリンクリンク
共用開始2012年9月2021~2022年
開発費1100億円1100億円
PJリーダ渡辺 貞松岡 聡
アーキテクチャSPARC64 VIIIfxArmv8.2-A
SVE(Scalable Vector Extension)
プロセスルール45nm7nm
FMA4個2個
SIMD128bit512bit
CPUクロック2GHz1.8GHz(~2.2GHz?)
メモリDDR3HBM2
B/F0.50B/F0.37B/F
ノード間NWTofu InterconnectTofu Interconnect D
OSSPARC LinuxArm Linux

全体としての大きな違いは、CPUのアーキテクチャがSPARCからArmへ変わったことでしょう。

これによりアプリ開発者さんは色々変更を余儀なくされますが、その分きっと恩恵が受けられるのだと思います。

 

SVE(Scalable Vector Extension) 512bitということでベクトル命令を強化していて、メモリをDDR3からHBM2と強化しているとのことです。

 

ベクトル命令メモリ帯域強化と聞くと、なんだかSX-Aurora TSUBASAを彷彿とさせますね。

 

Byte/Flopは0.5→0.37に下がっているようで、演算性能重視のプロセッサになったようです。

 

ノード間ネットワークはTofuインターコネクトDという独自ネットワークです。

ここが富岳のキモなので期待したいところです!

 

目指すはアプリ性能100倍。(理論性能は40倍?)

富岳
コアピーク性能16GFLOPS57.6GFLOPS
メモリバンド幅8GB/s21.3GB/s
メモリ容量2GB0.66GB
CPUコア数8コア48コア
理論演算性能128GFLOPS2.7TFLOPS
メモリ帯域64GB/s1TB/s
メモリ容量16GB32GB
ノードCPU数1CPU1CPU
システムノード数82944ノード>150000ノード
ピーク性能10.62PFLOPS405PFLOPS

富岳の資料を見る限り、コア性能は4倍程度、システムとしての理論演算性能は405PFLOPS以上と書いてある。

これだと、目標の京の100倍には届かないので不思議だなと思ったところ以下記事を発見。

健康長寿社会の実現や防災、エネルギー問題、産業競争力の強化など9つの重点分野を設定。これらの分野で使われているソフトウエアが、京に比べて100倍の速度で動くようにすることを目指す。

ITMEDIA(https://www.itmedia.co.jp/news/articles/1908/13/news048.html)

なるほど。

アプリ性能100倍というわけですね。

確かに理論演算性能ばかり早くてもダメですもんね。

実効性能が大事です!

(しかしこのアプリってなんだろう。。後出しやなんでも良いんだったら意味がないので具体的な提示が必要かと。。。)

 

メモリはCPUあたりで見ると2倍ですが、コアあたりで見ると1/3くらいに減っていますね。

コアあたり650MBってなかなかですね。

まあ、ここはお金と電力がかかるところなので仕方ないんでしょうね。

 

SX-Aurora TSUBASAと比較

このサイトのテーマとしてSX-Aurora TSUBASAとも一応ちょっとだけ比較しておきましょうか。

富岳
商用機名FX100FX1000A500-64
アーキテクチャSPARC64Armv8.2-A10AE
理論演算性能128GF3.3TF2.4TF
メモリバンド幅64GB/s1TB/s1.35TB/s
B/F0.500.300.55
メモリ容量16GB32GB48GB

 

  • 横X軸:演算性能
  • 縦Y軸:メモリ性能

としてプロットすると次のような感じ。

特にどっちが良いというわけでもないです。

  • SX-Aurora TSUBASAはメモリ性能が良い。
  • 富岳(FX1000)は演算性能が高い。

そんな感じですかね。

 

大事なのは実際のアプリ性能

世の中スペックマニアがいます。

それはそれで指標になるので価値があります。

 

ただ、5年前のIntelパソコンと最新のIntelパソコンでExcelが爆速になったかというとそういうわけでも無いのが現実かなと思います。

 

実際のアプリケーションでどれくらい良い成果が出せるかが大事です。

それは1秒でも早く問題が解ければいいということではなくて、どれくらい良い研究成果が出せるかということだと思うんですよね。

 

京よりアプリケーションが100倍高速に動かせたとして、100倍良い成果が出るのか。

期待していきましょう◎

 

SX-Aurora TSUBASAもきっと成果が出せる領域があるのでそちらも楽しみにしています。(*^^*)

 

それじゃ今日はこの辺で!

おわりっ!