海科埃伯曼, Vertiv的IT和边缘散热高级项目经理

在人工智能(AI)和高性能计算(HPC)工作负载的持续增长的推动下,数据中心基础设施正在迅速扩展。随着机架密度的不断增加,运营商评估其液体冷却策略,并规划未来每个机架高达500千瓦(kW)的容量。根据Dell'Oro Group 的数据,2023年全球数据中心液体冷却市场增长52%,达到7.45 亿美元,占数据中心热管理总收入的 12%。

Dell'Oro Group 预测,从 2023 年到 2028 年,液体冷却市场将以 45% 的复合年增长率(CAGR)增长年收入将超过48亿美元。这一增长是由数据中心液体冷却从利基HPC部署扩展到主流云、托管和企业数据中心部署所推动的。他们预计到 2028 年,液体冷却将占数据中心热管理总收入的36%。

虽然后门热交换器(RDHxs)和直接芯片冷却能够应对当前的热量水平,但不断增长的密度意味着需要额外的冷却解决方案。数据中心浸没式冷却(或称“液体浸没冷却”)是一种节能的选择,能为高密度工作负载提供卓越的冷却性能。

浸没式冷却

浸没式冷却是一种液体冷却方法,它将服务器和其他机架组件浸没在一个密封箱体内的导热介电流体中。这种液体以其优异的传热特性而著称,能从IT设备吸收热量,从而实现高效的高性能计算(HPC)冷却然后,吸收的热量被泵送到包含钎焊板式换热器的冷分配装置CDU)。连接到冷却器、干式冷却器或余热回收系统的主冷却回路与含有介电液的次级回路分开。这种设置有效地将热量传递到建筑物外,从而实现经济高效且有效的冷却。

Vertiv CoolCenter Immersion 浸入式冷却罐Vertiv官网

浸没式冷却系统的组

数据中心浸入式冷却涉及几个对成功部署至关重要的重要组件。浸式冷却系统的关键部件包括:

Tank:装有 IT 设备和介电液的密封容器,包含各种传感器、配电单元(PDU)和其他组件。

CDU:从冷冻水供应中循环和泵送水箱内闭环系统中的冷却剂,以冷却服务器。包括以下组件:

 热交换器:在来自储罐的介电流体和建筑物的冷冻水供应之间传递热量,而不将它们混合。

 :将液体循环到服务器周围的水箱中,从IT组件中去除热量并加热流体。然后将液体泵送到钎焊板式换热器冷却,然后通过过滤器并返回罐中再次开始循环。

 流量调节阀:调整CDU的冷却能力以匹配罐内的热负荷,从而实现最佳的热管理和效率。

 过滤器:去除流体中的污染物和杂质,以确保系统的最佳运行和使用寿命。

 电源:通过集成的 AB 转换开关实现无缝电源转换。

管道:将罐体连接到CDU,以促进介电液的循环。

Vertiv CoolCenter Immersion CDU

浸没式冷却在高性能计算中的效率与性能

浸没式冷却技术通过高效管理高热输出,显著提升数据中心的性能。在人工智能(AI)和高性能计算(HPC)工作负载场景中,浸没式冷却系统每个冷却罐(42U或52U规格)可提供高达100 kW的冷却能力,为高强度计算需求提供了有效解决方案。

冷却能力优势

浸没式冷却能100%吸收IT组件产生的热量,因为所有部件完全浸没在冷却液中,最大限度地减少了对空气冷却单元的需求,并简化了热传递环节。这种完全浸没的设计消除了空气中的残余热量。此外,浸没式冷却所使用的流体运行温度通常高于直接芯片冷却(Direct-to-Chip),从而允许更长的自然冷却(Free Cooling)时间。当使用冷水机组时,更小的温差有助于提高能源效率。

尽管如此,数据中心仍需保留一定的房间级冷却单元以维持空气质量。通过控制湿度和使用过滤系统,可以防止灰尘积聚,促进空气洁净循环,并通过减少过量二氧化碳来维持适宜的呼吸环境。

环境影响

许多浸没式冷却系统使用源自天然气的矿物基介电液体。天然气可通过“气转液”(Gas-to-Liquids)工艺转化为适合浸没冷却应用的合成液体。尽管化学工业需要提纯和转化这种油品以形成新的介电液体,但此过程避免了二氧化碳的排放。并且,浸没冷却液不像发电厂的天然气那样被消耗掉。

对于追求无石油和天然气来源冷却液的数据中心运营商,生物基介电液体是一种替代选择。这些液体源自生物废料,减少了对矿物油和天然气的依赖,提供了更环保的选择。

意外优势

浸没式冷却能带来更安静的数据中心环境。不同于风冷数据中心因大量空气再循环而产生的普遍噪音,浸没式冷却主要运行静谧,只有泵的轻微嗡鸣,显著降低了整体噪音水平。

改造浸没式冷却系统的关键考量

并非所有需要液体冷却解决方案的数据中心都是新建项目(Greenfield Installation)。在为现有风冷数据中心改造部署浸没式冷却时,运营商需重点关注空间布局和电力基础设施

空间与布局

浸没式冷却罐与传统机架具有不同的占地面积,因此浸没式冷却系统无法直接适配采用标准机架布局的数据中心。为有效部署浸没式冷却罐,设施团队需评估可用空间并进行相应规划,可能还需要重新配置布局以满足其空间需求。在操作开始之前,他们必须为冷却罐和冷却液分配单元(CDU)的安装清理出指定区域。

电力基础设施

浸没式冷却系统需要直接的电力供应,这要求设施团队重新配置其电力基础设施。数据中心运营商可以采用A路和B路供电馈线(A and B feed)并配备UPS备用电源,同时将CDU连接到与IT设备相似的电源上。这种配置能确保CDU与IT系统协同运行,即便在停电期间也能提供冷却。

数据中心液冷技术,来源:Vertiv官网

定制浸没式冷却系统

浸没式冷却可以根据不同数据中心的独特需求进行量身定制,例如针对网络组件和电源分配单元(PDU)的特定要求。某些配置可能需要为网络交换机提供超出标准2U规格的空间,另一些则可能需要定制PDU以实现更高的功率输出、更多输出接口或替代配置。液体的流速调节也是可行的,但主要的定制通常涉及网络和PDU的设置。

浸没式冷却的可扩展性

数据中心运营商可以高效地扩展其浸没式冷却部署,以应对未来的增长需求。每个CDU可提供200至240千瓦的冷却能力,使得数据中心能够以240千瓦为单位进行扩展。在这种设计下,运营商可以为每个CDU配置一至四个浸没罐,每个浸没罐最多支持100千瓦。因此,要达到240千瓦的总容量,需要多个浸没罐。这种模块化方法非常适合拥有高密度服务器部署的大型数据中心,允许根据需求进行精确扩展。

浸没式冷却部署的最佳实践

浸没式冷却系统的监控要求与传统风冷数据中心略有不同。大多数运营商可能已经熟悉一些参数,例如温度和泵速,因为这些也用于直接芯片冷(direct-to-chip)的CDU中。然而,浸没式系统引入了一些新的数据点,例如多个浸没罐的液位,这些需要独特的报警设置。这些报警可分为紧急或非紧急,类似于风冷系统中对服务器机房门状态的警报。现有的楼宇管理系统(BMS)可以轻松地将这些额外的数据点(如补液水平和浸没罐温度)集成到其框架中。尽管具体数据点的名称可能有所不同,但其基本功能和集成过程与传统系统密切相关。

没式冷却的新兴趋势与前景

浸没式冷却的未来发展正在朝着提高冷却能力的方向前进。我们可能会看到各种液体冷却解决方案的组合,包括集成到专用系统中的多种创新方法。

另一个显著趋势是介电液体(dielectric liquids)的改进,这提供了有助于减少碳排放的替代方案。此外,浸没式冷却允许提高冷却系统的运行温度,从而增强了废热回收过程。这一进步为区域供热(District Heating)应用和其他用途开辟了机会。

 

资料来源:

https://www.datacenterdynamics.com/en/opinions/immersion-cooling-systems-advantages-and-deployment-strategies-for-ai-and-hpc-data-centers/、Vertiv官网

文章来源:Vertiv 浸没式冷却系统:人工智能和高性能计算数据中心的优势和部署策略 (qq.com)

艾邦建有服务器液冷散热交流群,聚焦服务器液冷技术前沿,涵盖冷板/浸没/喷淋式方案设计、材料升级(耐腐蚀管路、密封件创新)、CDU运维与能效优化、政策标准解读(PUE、OCP规范)等。欢迎大家加入我们,共绘服务器液冷散热未来!
长按识别二维码,申请入群



微信扫描下方的二维码阅读本文

液冷技术通过冷却液直接/间接接触热源,核心结构包括:
  • 热交换核心  :冷板(CPU/GPU专用)、CDU(冷量分配单元);
  • 循环网络  :Manifold分液器、EPDM/PTFE管路、快接头;
  • 动力与控制  :变频循环泵(如飞龙股份电子泵)、智能温控系统。
主流方案中,冷板式兼容现网改造(占存量市场80%),浸没式为超算首选(PUE逼近1.0)。 2025年AI服务器的产值超过4000亿美元,年增45%。随着英伟达从Hopper系列向Blackwell系列转换,整个AI服务器产值提升。预计今年AI服务器的市场占有率会从去年的66%突破到今年的70%以上;另外,液冷散热方案的渗透率也有望从去年的14%提升到今年的30%。 涉及的材料有:铜、铝、复合金属材料、金属焊接材料、不锈钢、氟塑料、橡胶材料、密封材料、特种工程塑料、导热散热材料,热界面材料等 按照部件来分有:冷却塔、管道、CDU 液冷换热单元CDU 液冷板、接头、歧管、主泵和辅泵、流量控制系统、过滤系统等 系统集成方面有:空调、机柜、传感器、电源、泄漏检测、控制单元等 按照产业链来区分有:互联网企业,云服务器企业,代工企业、各个零部件企业、材料企业等; 欢迎大家加入我们,共绘服务器液冷散热未来!
长按识别二维码,申请入群
本群聚焦服务器液冷技术前沿,涵盖: ✅ 冷板/浸没/喷淋式方案设计 ✅ 材料升级(耐腐蚀管路、密封件创新) ✅ CDU运维与能效优化 ✅ 政策标准解读(PUE、OCP规范)

作者 808, ab