みなさん、こんにちわ。Vectory(@vectorywork)です。
先日、富岳が無事出荷されましたね。
→スーパーコンピュータ「富岳」の出荷を開始(2019年12月2日)
さて富岳は今までの京とはどう違うのか。
そのあたりを今回は見ていきたいと思います。
【比較】理研の日の丸スパコン「京」と「富岳」の違い
新しい日の丸スパコン「富岳」と一世代前の「京」との違いについてスペックを中心に比較していきたいと思います。
CPUがSPARCからArmへ変わった
京 | 富岳 | |
---|---|---|
参考リンク | リンク | リンク |
共用開始 | 2012年9月 | 2021~2022年 |
開発費 | 1100億円 | 1100億円 |
PJリーダ | 渡辺 貞 | 松岡 聡 |
アーキテクチャ | SPARC64 VIIIfx | Armv8.2-A SVE(Scalable Vector Extension) |
プロセスルール | 45nm | 7nm |
FMA | 4個 | 2個 |
SIMD | 128bit | 512bit |
CPUクロック | 2GHz | 1.8GHz(~2.2GHz?) |
メモリ | DDR3 | HBM2 |
B/F | 0.50B/F | 0.37B/F |
ノード間NW | Tofu Interconnect | Tofu Interconnect D |
OS | SPARC Linux | Arm Linux |
全体としての大きな違いは、CPUのアーキテクチャがSPARCからArmへ変わったことでしょう。
これによりアプリ開発者さんは色々変更を余儀なくされますが、その分きっと恩恵が受けられるのだと思います。
SVE(Scalable Vector Extension) 512bitということでベクトル命令を強化していて、メモリをDDR3からHBM2と強化しているとのことです。
ベクトル命令とメモリ帯域強化と聞くと、なんだかSX-Aurora TSUBASAを彷彿とさせますね。
Byte/Flopは0.5→0.37に下がっているようで、演算性能重視のプロセッサになったようです。
ノード間ネットワークはTofuインターコネクトDという独自ネットワークです。
ここが富岳のキモなので期待したいところです!
目指すはアプリ性能100倍。(理論性能は40倍?)
京 | 富岳 | ||
---|---|---|---|
コア | ピーク性能 | 16GFLOPS | 57.6GFLOPS |
メモリバンド幅 | 8GB/s | 21.3GB/s | |
メモリ容量 | 2GB | 0.66GB | |
CPU | コア数 | 8コア | 48コア |
理論演算性能 | 128GFLOPS | 2.7TFLOPS | |
メモリ帯域 | 64GB/s | 1TB/s | |
メモリ容量 | 16GB | 32GB | |
ノード | CPU数 | 1CPU | 1CPU |
システム | ノード数 | 82944ノード | >150000ノード |
ピーク性能 | 10.62PFLOPS | 405PFLOPS |
富岳の資料を見る限り、コア性能は4倍程度、システムとしての理論演算性能は405PFLOPS以上と書いてある。
これだと、目標の京の100倍には届かないので不思議だなと思ったところ以下記事を発見。
健康長寿社会の実現や防災、エネルギー問題、産業競争力の強化など9つの重点分野を設定。これらの分野で使われているソフトウエアが、京に比べて100倍の速度で動くようにすることを目指す。
ITMEDIA(https://www.itmedia.co.jp/news/articles/1908/13/news048.html)
なるほど。
アプリ性能100倍というわけですね。
確かに理論演算性能ばかり早くてもダメですもんね。
実効性能が大事です!
(しかしこのアプリってなんだろう。。後出しやなんでも良いんだったら意味がないので具体的な提示が必要かと。。。)
メモリはCPUあたりで見ると2倍ですが、コアあたりで見ると1/3くらいに減っていますね。
コアあたり650MBってなかなかですね。
まあ、ここはお金と電力がかかるところなので仕方ないんでしょうね。
SX-Aurora TSUBASAと比較
このサイトのテーマとしてSX-Aurora TSUBASAとも一応ちょっとだけ比較しておきましょうか。
京 | 富岳 | – | |
---|---|---|---|
商用機名 | FX100 | FX1000 | A500-64 |
アーキテクチャ | SPARC64 | Armv8.2-A | 10AE |
理論演算性能 | 128GF | 3.3TF | 2.4TF |
メモリバンド幅 | 64GB/s | 1TB/s | 1.35TB/s |
B/F | 0.50 | 0.30 | 0.55 |
メモリ容量 | 16GB | 32GB | 48GB |
- 横X軸:演算性能
- 縦Y軸:メモリ性能
としてプロットすると次のような感じ。
特にどっちが良いというわけでもないです。
- SX-Aurora TSUBASAはメモリ性能が良い。
- 富岳(FX1000)は演算性能が高い。
そんな感じですかね。
大事なのは実際のアプリ性能
世の中スペックマニアがいます。
それはそれで指標になるので価値があります。
ただ、5年前のIntelパソコンと最新のIntelパソコンでExcelが爆速になったかというとそういうわけでも無いのが現実かなと思います。
実際のアプリケーションでどれくらい良い成果が出せるかが大事です。
それは1秒でも早く問題が解ければいいということではなくて、どれくらい良い研究成果が出せるかということだと思うんですよね。
京よりアプリケーションが100倍高速に動かせたとして、100倍良い成果が出るのか。
期待していきましょう◎
SX-Aurora TSUBASAもきっと成果が出せる領域があるのでそちらも楽しみにしています。(*^^*)
それじゃ今日はこの辺で!
おわりっ!