テクノロジーでどこに投資するかが問題
─スパコンの性能には、個々のプロセッサー(CPU)の速度から、それらプロセッサー間の通信機能までさまざまな要素が絡んできますが、富岳の技術的成功には、どの部分が最も効いているのでしょうか。
一言でいうと、個々の技術的要素に対する投資の考え方がうまくいったと思います。
たとえば「TOP500」というランキングではCPUの演算性能、「HPCG」ではCPU同士をつなぐインターコネクトがとても重要になります。「Graph500」ではメモリアクセス性能と通信時間、「HPL─AI」では半精度演算(一六ビット演算)と通信ライブラリの最適化が効く。これらの要素はすべて複雑に関わり合い、トレードオフも生じますが、それを、アプリケーション性能の向上の観点から強化したことが、結果的にバランス良い実装につながったと考えています。
─「A64FX」はHPクレイも自社製マシンへの採用を決めるなど海外でも高く評価されています。成功の理由は何でしょうか。
同じく「そのテクノロジーでどこに投資するか」が重要です。A64FXはスパコン用ということもあって、(大規模アプリケーション性能に大きな影響を与える)メモリバンド幅に投資しています。逆にHPCの向上につながらない投資(実装)は抑えています。CPUのような半導体開発に魔法はなく、投資に関する取捨選択がポイントになるのです。
─日本の半導体産業は八〇年代までDRAMなどメモリ分野で世界を席巻していましたが、以降は日米半導体協定などを機に衰退していきました。往年の日本の半導体技術は一種のレガシーとしてA64FXの開発に活かされたのでしょうか。
メモリとCPUでは分野が違います。もちろん当時、日本はシリコンの製造技術という面では進んでいましたが、残念ながら今ではそうではありません。現在、シリコン(CPU)は台湾TSMCが製造しているのですが、テクノロジー周りの長い経験は、(A64FXの成功に)寄与したと思います。
─現在の富岳をチューンアップすれば来年Linpackでエクサ・フロップスを達成できますか。
富岳のピーク性能(理論的な性能値)は五三七ペタ・フロップスなので、エクサ・フロップスは超えられません。ただ、半精度演算であれば、既にHPL─AIで一・四二エクサ・フロップスに達しています。
─ピーク性能は結局、予算の規模で決まってしまう、という意見もありますが。
実際、その通りですが、ただピーク性能が高ければ良いというわけではありません。限られた予算の中で、実際のアプリケーション性能(実行効率)をどう引き出すかが本当の勝負なのです。「TOP500」では、京や富岳はピーク性能に対して八〇%以上の実行効率が得られています。他のスパコンは八〇%に達していません。そこがわれわれの技術だと思っています。