モデロンとメリーランド大学の研究者が今後開催される学会で研究成果を発表

人工知能(AI)と高性能コンピューティング(HPC)は、データセンター設計のあり方を根本から変えつつあります。電力密度は上昇を続け、熱設計上の余裕は縮小し、ワークロードはより動的かつ予測困難になっています。

2022年に登場したHGX H100ラックの消費電力は約40~60kWでしたが、2024年に発表されたBlackwellラックでは約120~140kWとなり、従来のAIラックの約3倍に達しています。さらに、2026年に登場が予想される次世代ラックでは200~240kWに達する可能性があります。

こうした変化により、エンジニアリングチームには、より高い熱負荷、急激な負荷変動、そしてシステム全体の挙動を設計初期段階から考慮した新しい冷却アプローチが求められています。

この将来像をより深く理解するため、私たちはメリーランド大学カレッジパーク校機械工学科の助教授であるリンナン・リン博士と、同研究室の博士課程学生カガン・シアーズ氏に話を聞きました。

なぜ今、二相式ダイレクト・トゥ・チップ冷却が重要なのか

リン教授によれば、その理由はシンプルですが極めて重要です。

「AIアクセラレータや次世代プロセッサの進化を見ると、発熱密度はもはや従来の冷却技術が想定していた範囲を超えています。」

二相式ダイレクト・トゥ・チップ冷却は、チップ表面で直接沸騰を発生させ、顕熱だけでなく潜熱を利用して熱を除去します。

急激な電力変動、局所的なホットスポット、高負荷運転が常態化するAIおよびHPC環境において、この方式はより小さな設置面積で高い冷却能力を実現する可能性があります。

しかし、リン教授とシアーズ氏は、この技術を「万能薬」とは捉えていません。

重要なのは、優れたコールドプレート単体としてではなく、システム全体の一部として扱うことだと強調しています。

なぜ過渡システムシミュレーションは「あればよいもの」ではなく不可欠なのか

会話を通じて繰り返し強調されたのは、二相冷却システムでは定常状態(Steady State)だけを前提とした考え方が通用しないという点でした。

シアーズ氏は次のように述べています。

「私たちが関心を持っているのは、単に沸騰が発生するかどうかではありません。負荷が変化したとき、流量条件が変動したとき、そして冷却ループが時間の経過とともにどのように応答するのかといった、システムの動的な挙動を理解したいのです。」

沸騰の開始、蒸気の発生、流動不安定性、起動時の挙動、さらには制御動作などは、それぞれ異なる時間スケールで変化します。

こうした動的現象は、システムの性能、安定性、そして長期的な信頼性に直接影響を及ぼします。そのため、過渡(トランジェント)システムシミュレーションは「あれば望ましいもの」ではなく、設計に不可欠な要件となります。

モデロンのシステムレベルシミュレーション機能を活用することで、研究チームは次のような項目をモデル化できます。

  • コールドプレート、作動流体、ポンプ、放熱装置(熱排出機器)間の相互作用
  • 電力の急激な増加やワークロード変動などの過渡運転シナリオ
  • 制御戦略がシステムの安定性や熱的余裕(サーマルマージン)に与える影響

シアーズ氏は次のように締めくくっています。

「過渡解析を行わなければ、最も重要なシステム挙動を把握できないまま設計を進めることになります。」

シミュレーションと実験のフィードバックが研究を加速

両氏は、Modelonとの共同研究によって研究速度と深さが大きく向上したと述べています。

従来のように長い実験サイクルだけに頼るのではなく、シミュレーションを用いることでコンセプト段階で迅速な試行錯誤が可能になりました。

「仮定や境界条件、運転シナリオを素早く変更できることで、どのアイデアを実験で検証すべきかを効率よく判断できます。」

一方で、大学側の実験データはシミュレーションモデルの妥当性検証にも役立っています。

リン教授は次のように述べています。

「シミュレーションと実験のループを閉じることに大きな価値があります。本当の知見はそこから生まれます。」

エンジニアが注目すべき初期知見

今夏に開催されるPurdue UniversityのHerrick Conferencesで詳細結果が発表される予定ですが、インタビューではいくつかの重要な知見が共有されました。

システムダイナミクスが性能を左右する

運転条件のわずかな違いが、二相冷却ループ全体の挙動を大きく変える可能性があります。

・制御が結果を決定する

安定性や効率は、機器設計だけでなく制御戦略にも大きく依存します。

・シミュレーションが実験リスクを低減する

過渡モデルによって、不安定あるいは危険な運転領域を実機製作前に発見できます。

シアーズ氏は次のように語っています。

「予想外の問題の多くはシステムレベルで発生します。そこにこそシミュレーションの価値があります。」.

二相冷却の未来

リン教授は、今後この分野が、物理現象、コンポーネント設計、システムアーキテクチャ、そして制御を個別に順番に開発するのではなく、統合的な設計ワークフローへと移行していくと考えています。

リン教授は次のように述べています。

「目標は単により高い熱流束に対応できるようにすることではありません。実際のシステム規模でも通用する、予測可能で制御可能な挙動を実現することです。」

検証済みの過渡(トランジェント)モデルやデジタルツインを活用したアプローチは、研究開発(R&D)だけでなく、システムの立ち上げ(コミッショニング)や運用の場面でも、今後ますます重要な役割を担うと考えられます。

大規模なAIワークロードを支えるデータセンターにおいては、こうした予測可能性が、冷却能力そのものと同じくらい重要な要素になるかもしれません。

モデロンンにとって、この共同研究はより大きな戦略の一環を示しています。それは、データセンター冷却がより複雑で動的な時代へと移行する中で、エンジニアがコンポーネント単体の最適化から一歩進み、システム全体としての確かな設計判断と信頼性の確保へと移行できるよう支援することです。

対話を続けましょう

ラック当たりの電力密度が今後も上昇する中、業界には以下のような課題に関するさらなる知見が求められています。

  • ラック内での冷媒分配不均一
  • 性能と規制要件を両立する作動流体の選定
  • 二相冷却がシステムアーキテクチャや制御に与える影響
  • 放熱ループ設計の最適化

そのため、産業界と研究機関の連携はこれまで以上に重要になります。

モデロンとメリーランド大学の研究チームは、次世代冷却アーキテクチャを評価しているデータセンター技術者、冷却システム開発者、部品サプライヤー、エンジニアリングリーダーとの意見交換を歓迎しています。ation.