液浸冷却の時代の到来か?
Meta、Google、NVIDIA、Intel、Equinixは、大手IT企業であること以外に何が共通しているのでしょうか?
これらの企業は、それぞれのハードウェアを液浸冷却で冷却しているか、近い将来そうする予定です。彼らは何か特別な情報を持っているのでしょうか?あなたのデータセンターも水冷に移行すべきでしょうか?
その答えは「かもしれないし、そうでないかもしれない」です。
生成AIはデータセンターにおけるほぼ飽くなき容量需要を引き起こしています。今日のAI集約型のワークロードを処理するために構築された強力なハードウェアは、多くの熱を発生させます。この強力なハードウェアに加えて、全体的なラック密度の増加も伴い、次世代の冷却要件が求められる状況となっています。
しかし、すべての人にとってそうではありません。少なくとも、まだその時ではありません。
大規模データセンターではラック密度が大幅に増加する一方、小規模なエンタープライズおよびコロケーション データ センターでは、今後数年間は 12 KW ~ 17.5 KW レベルにとどまると予測されています1。
これは、多くの事業者が冷却に従来のチラーを引き続き使用できる移行期間があることを示唆しています。それぞれの方法には長所と短所があります。
空冷システムの利点
空冷の利点としては、コスト効率が高く、シンプルで信頼性がある点が挙げられます。空冷は冷たい空気をハードウェアの周囲に吹き付けることで、熱を拡散させ、サーバー内部の温度を下げます。
空冷システムは、基本的に3つの構成で設計されています。
- ルーム(Room):データセンターのHVACシステムが冷たい空気を部屋全体に送り込むか、サーバーの下にある床の通気口を通じて冷気を供給します。
- ロー(Row):各機器列に専用のオーバーヘッド冷却ユニットを設置することで、空気の流れをターゲットにします。部屋全体を冷却するよりも効率的で、サーバー上に空気を移動させるために必要なエネルギーが少なくて済みます。
- ラック(Rack):さらに集中したアプローチで、ラックベースの空冷システムは特定のラックに専用の冷却ユニットを設置して冷却します。
さらに良い点として、多くのデータセンターはチラーを追加するか、既存のチラーをより強力なものに交換するだけで、HVACシステムの冷却能力を向上させることができます。HVAC技術者は通常、チラー技術に精通しており、その動作原理やシステムのメンテナンス方法を理解しています。
欠点は?現在、多くのデータセンターにとって空冷は十分ですが、長期的には以下の理由でそうでなくなる可能性があります。
- データ需要の急増
- エネルギーコストの上昇
- 水に関連する問題(特に大規模な冷却塔を持つシステムにとっては課題)
- 水道料金の上昇
- 水不足の可能性
AI のコンピューティング能力に対する貪欲な欲求に加え、エネルギー コストの上昇、さらには大型の冷却塔を備えたシステムの水のコストの上昇も、空冷システムを備えたデータ センター運営者にとっては大きな課題となる可能性があります。
液浸冷却とは
部屋やラック列単位で冷却を行うのではなく、熱の発生源であるサーバーを直接冷却します。この技術は、いくつかの異なる方法で機能します。
- ダイレクト・トゥ・チップ シングルフェーズ :この方法では、液体(通常は水)をCPUやGPUに直接供給し、電子機器が液体に直接触れないようにコールドプレートを介します。その後、ファンが冷却された空気を吹き込み、温まった空気をサーバーから遠ざけます。このタイプの液冷では、データセンターのチラーが依然として重要な役割を果たします。
- リアドア・ヒートエクスチェンジャー:この方法では、冷却液が充填された熱交換器をサーバーの背面に取り付けます。内部のファンがサーバーから熱を吹き出し、熱交換器を通過させることで冷却し、その後データセンターの室内空気環境に放出します。既存のサーバーに大きな改造を加えることなく実装できるため、冷却性能を向上させたいデータセンターにとってコスト効率の良いソリューションとなります。
- 浸漬冷却(イマージョン冷却):この技術では、すべてのサーバーコンポーネントが非導電性の液体冷却剤のタンクに浸されています。この絶縁液体は熱を吸収して放散し、温まった液体をコンポーネントから冷却システムへと運びます。そこで、熱は排出されるか、他の冷却方法を使用してさらに放散されます。浸漬冷却は他の液冷技術と比較して高い冷却効率を提供します。また、静音性が高く、エネルギー効率が良く、コンパクトであるため、より高密度なハードウェア構成が可能です。
各種の液冷システムには利点がありますが、欠点も存在します。
- 初期コストが高い: 冷却液タンク、ポンプ、熱交換器などの専門機器が必要なため
- 漏れのリスク: 液漏れのリスクが常に存在します。これが機器を損傷させたり、システムの停止を引き起こしたりする可能性があります。
- 定期的なメンテナンスが必要: 水冷コンポーネントは定期的なメンテナンスが必要で、水の定期的な交換も含まれます。
- 特定のハードウェアコンポーネントが使用できない: 設計や材料の関係で、水冷システムと互換性のないハードウェアコンポーネントも存在します。
- システムの複雑さ: 水冷システムは複雑で、設計、設置、メンテナンスには慎重な注意が必要です。特にシーリング、配管、モニタリングに注意を払う必要があります。
- 新技術による学習曲線: 空冷HVACシステムのメンテナンスに慣れている従業員にとっては、新しい技術に対する学習曲線があります。
空冷システムを継続するか、水冷に移行するか、またはハイブリッドシステムを導入するかに関わらず、トレインはデータセンターを継続的に稼働するための冷却システムの開発、設計、運用を支援します。
1 JLL Research, 2024 - https://www.jll.com.co/en/trends-and-insights/research/data-center-outlook (Accessed April 2024)