チームが天の川構造シミュレーションを作成
ホームページホームページ > ブログ > チームが天の川構造シミュレーションを作成

チームが天の川構造シミュレーションを作成

Jul 02, 2023

2014 年 11 月 18 日

ケイティ・エリス・ジョーンズ著、オークリッジ国立研究所

今日、遠くから天の川銀河の写真を撮った場合、その写真には、星が密集した明るい中央の棒 (バルジと呼ばれることもあります) を持つ渦巻銀河が写るでしょう。 太陽は、写真では非常に見えにくいですが、この棒の外側、星と星間塵で構成される渦巻き腕の 1 つの近くに位置します。 目に見える銀河の向こうには、暗黒物質のハローが存在します。カメラには見えませんが、バーとスパイラルアームの回転速度を下げることですべてをまとめているため、それでも重要です。

さて、時間を遡って天の川形成のビデオを撮りたい場合は、100 億年前に戻ることはできますが、銀河の顕著な特徴の多くは認識できません。 地球の太陽系の形成を目撃するには、約50億年待たなければなりません。 46 億年前のこの時点では、銀河は今日とほぼ同じように見えます。

「銀河の壮大な構造は、過去100億年にわたる星の分布の自己組織化から現れ、最終的には写真の天の川のようになりました」とオランダのライデン天文台のサイモン・ポルテギス・ズワルト氏は述べた。

これは、ポーテギーズ・ズワート氏を含むオランダと日本の研究者チームが、スーパーコンピューターを使って天の川銀河の進化をシミュレーションしたときに現れるタイムラインである。 エネルギー省のオークリッジ国立研究所にある Cray XK7 Titan など、GPU スーパーコンピューティング アーキテクチャ用に開発されたコードを使用したチームのシミュレーションは、ゴードン ベル賞の最終候補として認められました。 この賞はハイパフォーマンス コンピューティングにおける優れた業績を表彰するもので、11 月 20 日の SC14 でコンピューティング機械協会によって授与されます。

「銀河の構造がどのようにしてできたのか、実際にはわかっていません」とポーギーズ・ズワート氏は言う。 「私たちが気づいたのは、3 次元空間内の星の位置、速度、質量を使用して、その構造を系の自己重力から出現させることができるということです。」

星ごとに銀河の構造を計算するという課題は、ご想像のとおり、天の川銀河の星の数が少なくとも 1,000 億個であることです。 したがって、チームはすべての点を結び付けるために少なくとも 1,000 億個の粒子のシミュレーションが必要でした。 Bonsai として知られるチームのコードが開発される前、最大の銀河シミュレーションでは、粒子数が 10 億ではなく、約 1 億に達していました。

チームは、コードのスケーラビリティを向上させるために、世界で 2 番目に強力なスーパーコンピューターであるオーク リッジ リーダーシップ コンピューティング施設の Titan で Bonsai の初期バージョンをテストしました。 Bonsai を Titan の GPU ノードのほぼ半分に拡張した後、チームはスイス国立スーパーコンピューティング センターの Piz Daint スーパーコンピューターで Bonsai を実行し、星と暗黒物質の力を表す 5,100 万個の粒子を使用して 60 億年にわたる銀河形成をシミュレーションしました。 Piz Daint の実行が成功した後、チームは Titan に戻り、コードの並列性を最大化しました。

Bonsai コードは、18,600 個の Titan ノード (マシンの GPU ノードの 96%) でのスケーラビリティを実証しました。これにより、800 万年、2,420 億粒子の天の川シミュレーションが可能になります。 Bonsai は、Titan 上で 25 ペタフロップス近くの持続的な単精度浮動小数点パフォーマンスを達成しました。 単精度浮動小数点演算では 32 ビットを使用して数値を表現するため、使用するメモリが少なくなりますが、倍精度演算では 64 ビットを使用する代わりに、より正確な数値を表現します。

「大学院生の Jeroen Bédorf と一緒に、私たちは GPU 用の単一のコードを書くことから始めましたが、CPU ではコード全体を意図的に書かなかったのは、GPU の並列処理を利用するためにコード全体を GPU 上で実行する必要があったからです」と Portegies Zwart 氏は述べています。 「ホスト CPU は、ノードと GPU 間の通信を合理化するためにのみ使用されます。このようにして、数値処理のために GPU の使用を完全に最適化し、通信オーバーヘッドを最小限に抑えるためにはるかに遅い CPU を最適化できます。」