算力中心散热技术(1)
一、风冷:算力中心的“传统空调”,可靠但遇瓶颈 风冷,顾名思义,就是用空气作为散热介质,靠“吹风”带走服务器的热量,原理和我们家用空调、电风扇几乎一致,是目前应用最广泛、最成熟的散热技术,遍布各类中小型算力中心。 1. 核心原理: 风冷系统主要由两部分组成:服务器内部的散热风扇,以及机房整体的精密空调或列间空调。服务器运行时,CPU、GPU等核心部件会快速发热,内部风扇会加速转动,将冷空气吸入机箱,冷空气穿过散热片(吸收芯片热量)后,变成热空气被排出机箱;机房的精密空调则负责制造冷风、控制机房温度和湿度,将热空气冷却后循环利用,形成完整的散热闭环。 简单说,风冷就像给发烧的人吹电风扇,靠空气流动带走体表热量,技术逻辑简单,不需要复杂的管路设计。 2. 主流类型 风冷分为两种常见形式,适配不同场景: 风冷能沿用多年,核心优势在于“简单实用”: 但随着AI大模型、云计算的爆发,算力密度大幅提升(部分智算中心单机柜功率突破50kW),风冷的短板也越来越明显,逐渐触及物理极限: 二、液冷 液体的导热效率是空气的20倍以上,比热容是空气的4倍。现在,液冷已成为高端智算中心、AI训练集群的“首选方案”,能实现PUE低至1.04,较风冷节能40%-50%。 1. 核心原理 液冷的核心的是用液体介质(水、矿物油、氟化液等)替代空气,直接或间接接触服务器发热部件,通过液体对流和相变吸热,将热量快速带走,再通过冷却系统将热水(或热液体)降温,循环利用。 与风冷相比,液冷的核心突破的是取消了高功耗的空调压缩机,改用低功率的闭式冷却塔和冷量分配单元(CDU),制冷系统能耗降低90%以上,从根源上实现节能。 根据液体与服务器部件的接触方式,液冷主要分为三种,各自有明确的适配场景,目前冷板式和浸没式应用最广泛: (1)冷板式液冷:给核心部件“敷冷毛巾” 这是目前最主流、最易落地的液冷技术,相当于给CPU、GPU等核心发热部件,贴了一块“可循环制冷的冷毛巾”。 原理是将铜或铝制的冷板,紧密贴合在芯片等发热部件表面,冷板内部有密闭流道,乙二醇溶液(防结冰、防腐蚀)在流道内循环,直接吸收芯片热量,再通过管路将热液体输送到冷却模块,降温后循环使用。 优势是改造无需改变服务器结构,支持“液冷+风冷”混合模式,适配10-30kW/机柜的场景,PUE可降至1.15-1.25,改造周期仅2个月。机柜密度可以提高20kW以上。 (2)浸没式液冷: 让服务器泡冷水澡,相当于把整个服务器,放进一个装满特殊冷却液的“浴缸”里,全程浸泡散热。 所用的冷却液(矿物油、氟化液)是绝缘、无毒、不导电的,不会对服务器部件造成损坏。服务器完全浸没在冷却液中,运行时产生的所有热量,都会被冷却液直接吸收,冷却液吸热后会自然对流,将热量传递到容器壁,再通过外部冷却系统降温,部分还能利用冷却液的相变(液体变气体),实现高效吸热。 这种方式的散热效率是冷板式的2-3倍,适配30-100kW/机柜的高密度智算场景,PUE可低至1.05-1.15,几乎没有风扇噪音(可低至45分贝),还能大幅节省机房空间。中兴通讯怀来项目部署48kW机柜,年节电超110万度,CO₂减排900吨;华为全液冷方案在50kW机柜上,年省50万度电,减排237.5吨。 (3)两相液冷: 这是更先进的液冷技术,基于航天级相变原理,利用液体气化时的潜热换热,散热效率是风冷的1000倍以上,能应对100kW以上的极端算力场景。 原理是让冷却液在发热部件表面沸腾,从液体变成气体,这个过程会吸收大量热量,气体上升后遇到冷却管,再凝结成液体,循环往复。塔能科技泵驱两相系统实现PUE≤1.12,某南方电信机房改造后PUE从1.8降至1.196,制冷负载系数(CLF)仅0.036。 液冷的核心优势,完美解决了风冷的痛点,适配算力爆发的需求: 但液冷也有明显的短板,限制了其快速普及: 三、风冷vs液冷: 很多人会觉得,液冷崛起后,风冷就会被淘汰,但实际上,两者并不是“非此即彼”的关系,而是根据算力需求,形成互补共生的格局。简单来说:低算力、低成本需求,风冷依然是最优选择,比如中小型企业的算力节点、传统办公用的服务器机房,风冷的可靠性和低成本足以满足需求;高密度、高节能需求,液冷是必然趋势,比如AI大模型训练中心、大型云厂商的算力集群,液冷能破解散热和能耗困局,长期来看能节省大量电费,2年左右即可回收初期额外投入。 四、未来趋势:液冷普及加速,风冷持续优化 随着“东数西算”工程推进,以及国家对数据中心PUE的严苛要求(2025年新建数据中心PUE≤1.3),液冷技术的普及速度会越来越快。行业趋势显示,液冷在算力中心的占比,将从2025年的15%升至2030年的50%,标准化也会加速,未来会出台液冷系统设计、测试的统一规范。 同时,液冷技术也在不断升级:漏液检测技术越来越精准(可实现秒级响应),冷却液成本持续下降(规模化采购可降低40%),国产化替代加速,华为、塔能等企业已实现冷板、工质、控制算法全链条自主可控,打破国外技术垄断。 而风冷也不会被淘汰,而是会持续优化——比如优化风扇转速调节、改进散热片设计、采用间接蒸发冷却技术,提升散热效率、降低能耗,适配中低端算力需求,与液冷形成“高低搭配”,共同支撑算力时代的发展。


