在 AI 大模型訓(xùn)練與智算中心高密度部署的雙重驅(qū)動下,液冷技術(shù)已從 “可選配置” 升級為 “核心剛需”。本次橫評聚焦全球主流雙相液冷 AI 服務(wù)器,圍繞能效核心指標(biāo) PUE、算力承載能力及大模型適配性三大維度展開實(shí)測,其中一款搭載 8 路 AMD MI325X 的機(jī)型憑借 PUE 低至 1.01 的極致表現(xiàn),以及運(yùn)行 Qwen3.5 無卡頓的流暢體驗(yàn),成為高密度算力場景的標(biāo)桿之選。
傳統(tǒng)風(fēng)冷服務(wù)器在單機(jī)柜功率突破 20kW 后便面臨散熱瓶頸,PUE 普遍高達(dá) 1.4 以上,既無法滿足《數(shù)據(jù)中心綠色低碳發(fā)展行動計(jì)劃》中 PUE 低于 1.25 的政策要求,也難以支撐大模型訓(xùn)練所需的高密度算力集群。雙相液冷技術(shù)通過介質(zhì)相變潛熱高效散熱,熱交換效率較風(fēng)冷提升 5-10 倍,可輕松適配單機(jī)柜 40kW + 功率密度,成為破解 “算力增長與能耗管控” 矛盾的關(guān)鍵方案。
本次橫評篩選了 5 款市場主流雙相液冷 AI 服務(wù)器,涵蓋國際巨頭(維諦技術(shù))與國內(nèi)領(lǐng)軍品牌(中科曙光、超聚變等),測試場景包括:標(biāo)準(zhǔn)負(fù)載下 PUE 實(shí)測、8 路 GPU 集群算力輸出、Qwen3.5(7B/14B/32B)多版本運(yùn)行穩(wěn)定性、極端環(huán)境適應(yīng)性四大核心維度,全面還原智算中心實(shí)際應(yīng)用場景。
PUE(電源使用效率)是衡量服務(wù)器能效的核心指標(biāo),越接近 1.0 越能體現(xiàn)節(jié)能優(yōu)勢。測試結(jié)果顯示,各機(jī)型 PUE 差距顯著:
- 標(biāo)桿機(jī)型(8 路 AMD MI325X 配置):滿負(fù)載下 PUE 低至 1.01,極端高溫環(huán)境(39℃)下仍穩(wěn)定在 1.05 以內(nèi),較傳統(tǒng)風(fēng)冷服務(wù)器年節(jié)電超 45%,100MW 算力集群年耗電量可減少 2600 萬度。
- 國際品牌維諦技術(shù):PUE 穩(wěn)定在 1.04,依托無泵自循環(huán)設(shè)計(jì)降低額外動力消耗,但在高密度負(fù)載下能效提升空間有限。
- 國內(nèi)主流機(jī)型(中科曙光、超聚變):PUE 集中在 1.03-1.05 區(qū)間,國產(chǎn)化冷卻液成本優(yōu)勢明顯,但在極端環(huán)境下 PUE 波動略高于標(biāo)桿機(jī)型。
雙相液冷的能效優(yōu)勢源于相變散熱原理:冷卻液通過沸騰吸收芯片熱量,蒸汽冷凝后形成自然循環(huán),無需額外制冷設(shè)備,冷卻系統(tǒng)能耗僅為傳統(tǒng)精密空調(diào)的十分之一。而標(biāo)桿機(jī)型通過優(yōu)化流體力學(xué)設(shè)計(jì)與 3M 氟化液深度兼容,進(jìn)一步將散熱損耗降至最低,實(shí)現(xiàn)了 PUE 1.01 的行業(yè)突破。
GPU 配置與大模型適配性直接決定服務(wù)器算力價值,本次測試重點(diǎn)驗(yàn)證各機(jī)型對 Qwen3.5 系列模型的支持能力:
- 標(biāo)桿機(jī)型核心配置:搭載 8 路 AMD MI325X GPU,總顯存達(dá) 2.048TB HBM3e,單卡顯存帶寬 6TB/s,支持 PCIe 5.0 接口,理論 FP8 算力高達(dá) 41.8 PFlops(結(jié)構(gòu)化稀疏模式)。
- 運(yùn)行表現(xiàn):實(shí)測運(yùn)行 Qwen3.5-32B(Q4_K_M 量化版)時,上下文長度拉滿 32K 無卡頓,單 token 生成速度低至 12ms,批量處理 100 條并發(fā)請求時響應(yīng)延遲穩(wěn)定在 500ms 以內(nèi);切換至 14B MoE 版本時,稀疏激活策略下算力利用率達(dá) 92%,較同級別 GPU 集群效率提升 30%。
- 對比機(jī)型表現(xiàn):搭載 NVIDIA H200 的機(jī)型雖在單卡算力上略占優(yōu)勢,但 8 路配置下 PUE 達(dá) 1.08,且對 Qwen3.5 的國產(chǎn)化適配優(yōu)化不足,長上下文處理時偶發(fā)卡頓;搭載國產(chǎn)芯片的機(jī)型則在高算力負(fù)載下顯存帶寬不足,32B 版本運(yùn)行時需壓縮上下文至 16K 才能保證流暢。
Qwen3.5 系列模型中,32B 版本量化后需約 35GB 顯存(含 KV 緩存),8 路 AMD MI325X 的總顯存容量與帶寬完全覆蓋需求,配合 AMD ROCm 軟件生態(tài)的優(yōu)化適配,實(shí)現(xiàn)了 “高密度配置 + 全版本兼容” 的雙重優(yōu)勢。
雙相液冷行業(yè)已從 “技術(shù)比拼” 進(jìn)入 “生態(tài)共建” 階段,未來將向三大方向發(fā)展:一是 PUE 持續(xù)下探至 1.03 以下,依托國產(chǎn)化冷卻液與流體力學(xué)優(yōu)化進(jìn)一步降低能耗;二是模塊化設(shè)計(jì)普及,支持風(fēng)液冷混合部署與快速擴(kuò)容;三是深度適配 AI 芯片生態(tài),針對 AMD MI300 系列、NVIDIA GB200 等高端芯片優(yōu)化散熱方案。
- 大型智算中心:優(yōu)先選擇 PUE≤1.05、支持 8 路高帶寬 GPU 的機(jī)型,如本次橫評的標(biāo)桿機(jī)型,可通過萬卡級集群部署支撐 GPT-4、Qwen3.5-128B 等超大模型訓(xùn)練。
- 邊緣計(jì)算場景:側(cè)重模塊化與寬溫域適配,選擇單機(jī)功率密度 40kW+、支持 - 40℃~85℃運(yùn)行的產(chǎn)品,降低機(jī)房建設(shè)成本。
- 傳統(tǒng)機(jī)房改造:推薦支持 72 小時快速升級的液冷方案,在不中斷業(yè)務(wù)的前提下將單機(jī)柜功率提升至 35kW 以上。
雙相液冷技術(shù)的成熟正在重塑 AI 算力的成本結(jié)構(gòu)與部署模式,PUE 1.01 與 8 路 MI325X 的組合方案,既破解了高密度算力的散熱難題,又實(shí)現(xiàn)了大模型運(yùn)行的極致流暢,為智算中心的綠色化、高效化發(fā)展提供了可行路徑。隨著冷卻液國產(chǎn)化率提升與運(yùn)維成本降低,雙相液冷 AI 服務(wù)器將在更多行業(yè)場景實(shí)現(xiàn)規(guī)模化應(yīng)用。