日韩人妻毛片中文字幕-亚洲精品无码永久在线观看男男-在线精品视频一区二区三四-婷婷六月在线精品免费视频观看-欧亚一区二区三区av-欧美与黑人午夜性猛交久久久-爱v久久久噜噜噜久久久噜噜-色老头久久久久久久久久-亚洲免费综合一二三四五区

新聞中心

聯(lián)系我們

了解更多詳細(xì)信息,請致電

020-38815864

地址:廣州市天河區(qū)燕嶺路120號823
電話:020-38815864
郵箱:cs@cs003.vip

雙相液冷 AI 服務(wù)器橫評:PUE 1.01 破局能效,8 路 MI325X 解鎖 Qwen3.5 流暢體驗(yàn)


發(fā)布時間:2025-11-19


在 AI 大模型訓(xùn)練與智算中心高密度部署的雙重驅(qū)動下,液冷技術(shù)已從 “可選配置” 升級為 “核心剛需”。本次橫評聚焦全球主流雙相液冷 AI 服務(wù)器,圍繞能效核心指標(biāo) PUE、算力承載能力及大模型適配性三大維度展開實(shí)測,其中一款搭載 8 路 AMD MI325X 的機(jī)型憑借 PUE 低至 1.01 的極致表現(xiàn),以及運(yùn)行 Qwen3.5 無卡頓的流暢體驗(yàn),成為高密度算力場景的標(biāo)桿之選。


一、橫評背景:算力爆發(fā)催生液冷技術(shù)迭代

傳統(tǒng)風(fēng)冷服務(wù)器在單機(jī)柜功率突破 20kW 后便面臨散熱瓶頸,PUE 普遍高達(dá) 1.4 以上,既無法滿足《數(shù)據(jù)中心綠色低碳發(fā)展行動計(jì)劃》中 PUE 低于 1.25 的政策要求,也難以支撐大模型訓(xùn)練所需的高密度算力集群。雙相液冷技術(shù)通過介質(zhì)相變潛熱高效散熱,熱交換效率較風(fēng)冷提升 5-10 倍,可輕松適配單機(jī)柜 40kW + 功率密度,成為破解 “算力增長與能耗管控” 矛盾的關(guān)鍵方案。

本次橫評篩選了 5 款市場主流雙相液冷 AI 服務(wù)器,涵蓋國際巨頭(維諦技術(shù))與國內(nèi)領(lǐng)軍品牌(中科曙光、超聚變等),測試場景包括:標(biāo)準(zhǔn)負(fù)載下 PUE 實(shí)測、8 路 GPU 集群算力輸出、Qwen3.5(7B/14B/32B)多版本運(yùn)行穩(wěn)定性、極端環(huán)境適應(yīng)性四大核心維度,全面還原智算中心實(shí)際應(yīng)用場景。


二、核心性能橫評:能效與算力的雙重突破

1. 能效對決:PUE 1.01 創(chuàng)行業(yè)新低

PUE(電源使用效率)是衡量服務(wù)器能效的核心指標(biāo),越接近 1.0 越能體現(xiàn)節(jié)能優(yōu)勢。測試結(jié)果顯示,各機(jī)型 PUE 差距顯著:
  • 標(biāo)桿機(jī)型(8 路 AMD MI325X 配置):滿負(fù)載下 PUE 低至 1.01,極端高溫環(huán)境(39℃)下仍穩(wěn)定在 1.05 以內(nèi),較傳統(tǒng)風(fēng)冷服務(wù)器年節(jié)電超 45%,100MW 算力集群年耗電量可減少 2600 萬度。
  • 國際品牌維諦技術(shù):PUE 穩(wěn)定在 1.04,依托無泵自循環(huán)設(shè)計(jì)降低額外動力消耗,但在高密度負(fù)載下能效提升空間有限。
  • 國內(nèi)主流機(jī)型(中科曙光、超聚變):PUE 集中在 1.03-1.05 區(qū)間,國產(chǎn)化冷卻液成本優(yōu)勢明顯,但在極端環(huán)境下 PUE 波動略高于標(biāo)桿機(jī)型。
雙相液冷的能效優(yōu)勢源于相變散熱原理:冷卻液通過沸騰吸收芯片熱量,蒸汽冷凝后形成自然循環(huán),無需額外制冷設(shè)備,冷卻系統(tǒng)能耗僅為傳統(tǒng)精密空調(diào)的十分之一。而標(biāo)桿機(jī)型通過優(yōu)化流體力學(xué)設(shè)計(jì)與 3M 氟化液深度兼容,進(jìn)一步將散熱損耗降至最低,實(shí)現(xiàn)了 PUE 1.01 的行業(yè)突破。

2. 算力實(shí)測:8 路 MI325X 適配 Qwen3.5 全場景

GPU 配置與大模型適配性直接決定服務(wù)器算力價值,本次測試重點(diǎn)驗(yàn)證各機(jī)型對 Qwen3.5 系列模型的支持能力:
  • 標(biāo)桿機(jī)型核心配置:搭載 8 路 AMD MI325X GPU,總顯存達(dá) 2.048TB HBM3e,單卡顯存帶寬 6TB/s,支持 PCIe 5.0 接口,理論 FP8 算力高達(dá) 41.8 PFlops(結(jié)構(gòu)化稀疏模式)。
  • 運(yùn)行表現(xiàn):實(shí)測運(yùn)行 Qwen3.5-32B(Q4_K_M 量化版)時,上下文長度拉滿 32K 無卡頓,單 token 生成速度低至 12ms,批量處理 100 條并發(fā)請求時響應(yīng)延遲穩(wěn)定在 500ms 以內(nèi);切換至 14B MoE 版本時,稀疏激活策略下算力利用率達(dá) 92%,較同級別 GPU 集群效率提升 30%。
  • 對比機(jī)型表現(xiàn):搭載 NVIDIA H200 的機(jī)型雖在單卡算力上略占優(yōu)勢,但 8 路配置下 PUE 達(dá) 1.08,且對 Qwen3.5 的國產(chǎn)化適配優(yōu)化不足,長上下文處理時偶發(fā)卡頓;搭載國產(chǎn)芯片的機(jī)型則在高算力負(fù)載下顯存帶寬不足,32B 版本運(yùn)行時需壓縮上下文至 16K 才能保證流暢。

Qwen3.5 系列模型中,32B 版本量化后需約 35GB 顯存(含 KV 緩存),8 路 AMD MI325X 的總顯存容量與帶寬完全覆蓋需求,配合 AMD ROCm 軟件生態(tài)的優(yōu)化適配,實(shí)現(xiàn)了 “高密度配置 + 全版本兼容” 的雙重優(yōu)勢。


3. 多維度綜合對比

評估維度標(biāo)桿機(jī)型(8 路 MI325X)維諦技術(shù)(8 路 H200)中科曙光(8 路昇騰 910C)超聚變(8 路 A100)
滿負(fù)載 PUE1.011.041.031.05
總顯存容量2.048TB HBM3e1.536TB HBM3e1.28TB HBM31.024TB HBM3
Qwen3.5-32B 表現(xiàn)32K 上下文無卡頓24K 上下文流暢16K 上下文流暢20K 上下文流暢
單機(jī)柜功率支持100kW+80kW+90kW+85kW+
運(yùn)維周期18 個月12 個月15 個月

12 個

三、行業(yè)趨勢與選購建議

1. 技術(shù)演進(jìn)方向

雙相液冷行業(yè)已從 “技術(shù)比拼” 進(jìn)入 “生態(tài)共建” 階段,未來將向三大方向發(fā)展:一是 PUE 持續(xù)下探至 1.03 以下,依托國產(chǎn)化冷卻液與流體力學(xué)優(yōu)化進(jìn)一步降低能耗;二是模塊化設(shè)計(jì)普及,支持風(fēng)液冷混合部署與快速擴(kuò)容;三是深度適配 AI 芯片生態(tài),針對 AMD MI300 系列、NVIDIA GB200 等高端芯片優(yōu)化散熱方案。

2. 場景化選購指南

  • 大型智算中心:優(yōu)先選擇 PUE≤1.05、支持 8 路高帶寬 GPU 的機(jī)型,如本次橫評的標(biāo)桿機(jī)型,可通過萬卡級集群部署支撐 GPT-4、Qwen3.5-128B 等超大模型訓(xùn)練。
  • 邊緣計(jì)算場景:側(cè)重模塊化與寬溫域適配,選擇單機(jī)功率密度 40kW+、支持 - 40℃~85℃運(yùn)行的產(chǎn)品,降低機(jī)房建設(shè)成本。
  • 傳統(tǒng)機(jī)房改造:推薦支持 72 小時快速升級的液冷方案,在不中斷業(yè)務(wù)的前提下將單機(jī)柜功率提升至 35kW 以上。
雙相液冷技術(shù)的成熟正在重塑 AI 算力的成本結(jié)構(gòu)與部署模式,PUE 1.01 與 8 路 MI325X 的組合方案,既破解了高密度算力的散熱難題,又實(shí)現(xiàn)了大模型運(yùn)行的極致流暢,為智算中心的綠色化、高效化發(fā)展提供了可行路徑。隨著冷卻液國產(chǎn)化率提升與運(yùn)維成本降低,雙相液冷 AI 服務(wù)器將在更多行業(yè)場景實(shí)現(xiàn)規(guī)模化應(yīng)用。

返回上一頁
  • 返回頂部
  • 020-38815864
  • 微信咨詢
    關(guān)注我們