名古屋大学情報基盤センタースーパーコンピュータシステム「不老」について
名古屋大学情報基盤センター センター長
名古屋大学大学院情報学研究科知能システム学専攻 教授
森 健策
1.はじめに
名古屋大学情報基盤センターでは、2020年7月1日から、新しいスーパーコンピュータシステム「不老」の運用を開始しました(図1)。このスーパーコンピュータは、文部科学省共同利用共同研究拠点として、アカデミアにおける様々な研究開発を促進する大規模設備として導入されたものです。また、「不老」の計算資源の一部は、民間企業における研究開発にも提供され、産業界におけるコンピューティングを活用した研究開発の強化にも生かされる予定です。本稿では、スーパーコンピュータ「不老」の概要について紹介します。
2. スーパーコンピュータ「不老」
スーパーコンピュータ「不老」は、全体で15.88PFLOPSの演算性能であり、スーパーコンピュータ「富岳」をベースとした富士通の「FUJITSU Supercomputer PRIMEHPC FX1000」からなるType Iサブシステム、人工知能研究支援のためのGPUを搭載したTypeⅡサブシステム等から構成されます。また、大規模データ蓄積のためのホットストレージを30PB、データを長期保存可能なコールドストレージを6PB有します。さらに、湧水を用いたエコな冷却設備、および、夏季の電力ピーク時の消費電力を抑える電力管理システムを有しています。
「不老」におけるTypeIサブシステムは、令和3年度からの共用開始を目指している理化学研究所計算科学研究センター(R-CCS)に設置されるスーパーコンピュータ「富岳」をベースとしたスーパーコンピュータの世界初のサービス運用開始となりました。TypeIIサブシステムなどを加えた「不老」全体のシステムにより、台風のメカニズム解析、医療画像診断や遺伝子解析、自動運転への人工知能の適用等の研究を強力に推進する予定です。また、社会貢献の一環としての、民間企業の研究課題に対する計算資源の提供も、引き続き行う予定です。
「不老」の特徴をあげると、
- 東海地区で最大規模となる、15.88PFLOPSを有するスーパーコンピュータ
- 理化学研究所R-CCSに設置されるスーパーコンピュータ「富岳」をベースとしたスーパーコンピュータの世界初サービス運用開始(全系:2,304ノード、110,592コア)
- 台風のメカニズム解析、医療画像診断や遺伝子解析、自動運転への人工知能の適用等の研究を強力に推進
- スーパーコンピュータ「富岳」をベースとしたスーパーコンピュータからなるTypeIサブシステム(製品名: FUJITSU Supercomputer PRIMEHPC FX1000)、7.782 PFLOPS
- 2020年6月のTOP500で6.617PFLOPSを達成し、37位にランキング
- 人工知能研究支援のためのGPU(NVIDIA® Tesla™ V100 32GB)を884基搭載したTypeⅡサブシステム(製品名:FUJITSU Server PRIMERGY CX2570 M5)、7.489 PFLOPS
- 48TBの大規模メモリ搭載のTypeⅢサブシステム(製品名:HPE Superdome Flex)
- 大容量ホットストレージ30PB(製品名:FUJITSU Software FEFS および DDN SFA18KE)
- 国内のスーパーコンピュータサービスで初となる(名古屋大学調べ)、光ディスクによるコールドストレージ6PB(製品名:ソニー「オプティカルディスク・アーカイブPetaSite拡張型ライブラリーシステム)を提供
- 湧水を用いたエコな冷却設備
- 夏季の電力ピーク時の消費電力を抑える電力管理システム
のようになります。情報基盤センター付近で自然に湧き出る水を活用した冷却設備の導入は、極めてユニークなものです。詳しいシステムの説明は、この記事に続く、片桐先生、大島先生の記事を参考にしてください。
3. 機械学習の研究に是非TypeIIサブシステムの利用を!
情報関連の研究者の方は、機械学習や人工知能に関する研究を行っていると思います。その中では、GPUを活用してニューラルネットワークの学習とそれを用いた推論をたくさん行っていると思います。スーパーコンピュータ「不老」のType IIサブシステムは、約800台のnvidia製GPU V100を備えています。この多数のGPUを活用して、ニューラルネットワークの学習を大規模に行い、短期間で実験結果を得ることが可能になります。たとえば、ハイパーパラメータの探索において効果を発揮できると思います。 機械学習の研究では、Pythonを用いてPytorch、Keras, Tensorflowなどの種々のフレームワークを用いながらプログラムを作成し、実行していると思います。また計算拘束のためにCUDAを経由してGPUを利用されていると思います。「不老」Type IIサブシステムは、これらのプログラムの実行ができるようなっています。ただし、ソフトウエアのバージョンの問題もありますので、コンテナを作成して、その中にすべてを詰め込み、スパコン上で実行するのがいいと思います。コンテナとしてdockerを利用されている方も多いと思いますが、スパコンではsingularityをサポートしています。Dockerコンテナからsingularityコンテナへの変換はコマンド一つで実行可能です。現在お使いの機械学習プログラムをスーパーコンピュータ「不老」で是非実行し、研究を加速さえていただければ幸いです。
4.むすび
本短稿では、名古屋大学情報基盤センタースーパーコンピュータ「不老」の紹介をさせていただきました。情報学を含め幅広い分野で「不老」を活用していただけると幸いです。詳しい利用方法などは、名古屋大学情報基盤センターホームページをご覧ください。