
液体冷却不再是“可选项”,而是必选项,AI模型训练时的“突发性”高负载,会给冷却系统带来热冲击。数据中心也从“孤岛“工具转向集成系统仿真工具,牵一发而动全身,所有子系统必须从一开始就协同设计、一体规划。在此背景下,谷歌牵头开展了一项开放计算项目(OCP)计划,旨在定义一款标准化的、散热能力为2兆瓦的下一代冷却分配单元(CDU),即“德舒特项目”。该项目发布了详细的规格说明和计算机辅助设计参考模型,以促进行业的广泛采用和互操作性。作为OCP的贡献成员,Gamma Technologies开发了该CDU的完整GT-SUITE模型,忠实地再现了规格说明中描述的几何结构和性能。其成果是一个即用型的仿真资产,帮助数据中心工程师评估系统行为,将CDU集成到更大规模的设施级模型中,并为新产品或扩展策略调整设计。
一、 GEM3D将CDU的CAD模型进行离散
发布的Deschutes模型从一个完整的三维CAD装配体开始。利用GEM3D,几何结构被自动转换为GT-SUITE仿真模型,无需手动提取参数即可实现精确的压降预测和流体-热特性分析。工程师可以直接在原始几何模型上直观查看温度分布和流动变量,使结果易于理解,并加速设计迭代。这一预处理流程既节省了时间,也减少了错误,使用户能够快速从计算机辅助设计(CAD)过渡到经过验证的仿真,同时保持对OCP参考设计的高保真度。

二、匹配OCP性能并实现系统集成
所发布的Deschutes模型复现了OCP规范中公布的性能目标,为设计研究提供了可靠的基准。由于该系统可与冷水机组、缓冲罐和IT冷却液回路进行交互,该模型能够直接被集成到更广泛的设施架构中。用户可以在受益于经过验证的参考结构的同时,调整部件尺寸、重新配置管道,或探索替代材料和流体。这使得该模型不仅对于研究OCP设计具有价值,而且对于开发未来的CDU产品代际也同样宝贵。

图 2:仿真性能结果与规格书数据的对比,用于验证模型行为。
三、用系统仿真匹配CDU
GT-SUITE能够快速比较不同的组件、材料和冷却技术。该模块化环境支持评估单相和两相冷却剂、探索不同类型的热交换器系列、测试来自多个供应商的泵和过滤器,以及研究干冷器与冷却塔的效果差异。通过调整几何结构和运行条件,团队可以研究与PUE、WUE、热量回收潜力以及制冷剂选择相关的权衡。这种灵活性使工程师能够根据具体场地的环境条件、可持续发展目标和运营约束来定制CDU,并确保设计具有面向未来的能力。

图 3:对比不同供应商的热交换器
由于数据中心冷却系统涉及众多相互关联的变量,优化工作至关重要。GT-SUITE的快速求解器使得运行大规模实验设计研究、分布式计算参数扫描以及优化程序成为可能。在Deschutes模型中,工程师可以搜索在保持机柜出口冷却液温度安全的前提下,将电力消耗降至最低的运行点。这种自动化探索有助于确定最佳流量、部件尺寸和控制策略,这些工作甚至在获得物理硬件之前即可进行,从而支持快速产品开发和稳健的决策制定。

图 4:以最小化总电力消耗和机柜的冷却液回流温度
四、用于极端场景的虚拟测试台
对一个2兆瓦的CDU进行全尺寸物理测试成本高昂,且通常不切实际,尤其是在进行故障分析时。Deschutes仿真模型可作为虚拟测试台,使工程师能够研究瞬态事件,例如IT负载的快速激增、极端环境温度或冷水机组电源故障等。这些工况难以通过实验获得,但对于设计具备鲁棒性的冷却系统至关重要。

五、数字孪生与故障检测能力
GT-SUITE模型可以支持机器学习元模型,以增强实时系统监控。通过对比预期行为与实测行为,数字孪生能够检测并分类多种异常,例如阀门故障(如卡滞或泄漏)、热交换器结垢或泵的气蚀等。下图为阀门故障的演示,该故障被异常检测机器学习模型准确识别。当阀门无法完全打开时,流量会降低,在动态运行过程中这可能并不明显。然而,异常检测模型识别出了与预期工况的偏差,而这种偏差正在暗中导致冷却液供给温度上升数度。

阀门无法完全开启时的故障诊断

B站账号

知乎账号

微信账号