隨著AI算力的爆發(fā)式增長與“東數(shù)西算”工程的深化推進,數(shù)據(jù)中心功率密度持續(xù)攀升,傳統(tǒng)風(fēng)冷技術(shù)已難以突破散熱瓶頸。液冷作為高密算力場景的核心散熱方案,在2025年迎來規(guī)模化落地臨界點。其中,浸沒式與冷板式兩大技術(shù)路線的選型之爭,成為企業(yè)布局AIDC(人工智能數(shù)據(jù)中心)的關(guān)鍵決策。尤其在東數(shù)西算政策導(dǎo)向與碳中和目標(biāo)約束下,兩者的性價比差異被賦予更復(fù)雜的場景內(nèi)涵。本文將從技術(shù)特性、成本結(jié)構(gòu)、政策適配、碳中和貢獻四大維度,拆解兩種方案的核心差異,為不同場景下的AIDC選型提供參考。
一、技術(shù)基座:從“局部降溫”到“全域散熱”的核心分野
浸沒式與冷板式的技術(shù)差異,本質(zhì)是散熱邏輯的不同——前者以“全域包裹”實現(xiàn)極致散熱,后者以“精準(zhǔn)靶向”平衡效率與兼容,這種差異直接決定了兩者在高密算力場景的適配邊界。
冷板式液冷屬于“間接接觸”散熱,通過銅/鋁冷板與CPU、GPU等核心發(fā)熱器件貼合,利用水基乙二醇溶液等冷卻液在封閉管路中循環(huán)帶走熱量。其核心優(yōu)勢在于兼容性強,無需對現(xiàn)有服務(wù)器架構(gòu)進行大幅改造,可直接適配傳統(tǒng)風(fēng)冷數(shù)據(jù)中心的升級需求,部署周期短至72小時內(nèi)。但受限于“局部冷卻”邏輯,冷板式僅能覆蓋60%-70%的總熱負(fù)荷,剩余熱量仍需依賴風(fēng)冷輔助,導(dǎo)致PUE值難以突破1.1-1.2的區(qū)間,且易出現(xiàn)內(nèi)存、電源等部件的局部熱點問題。在功率密度適配方面,冷板式單機柜功率上限約60-80kW(單相)或130kW(雙向冷板),可滿足多數(shù)中低功率AI訓(xùn)練需求。
浸沒式液冷則采用“直接接觸”散熱,將服務(wù)器完全浸沒于絕緣冷卻液(氟化液、礦物油或國產(chǎn)煤基介電液等)中,通過液體顯熱或相變潛熱實現(xiàn)全域散熱。這種設(shè)計徹底擺脫了風(fēng)冷依賴,PUE值可低至1.03-1.08,單相系統(tǒng)單機柜功率密度可達(dá)100-150kW,兩相系統(tǒng)更是突破200kW,能完美適配英偉達(dá)Rubin系列等下一代高功耗芯片的散熱需求。同時,全域散熱使設(shè)備溫度均勻性誤差小于±2℃,徹底消除局部熱點,且無需風(fēng)扇組件,噪音降低90%以上,還能減少灰塵污染以延長設(shè)備壽命。但代價是系統(tǒng)復(fù)雜度提升,需定制化密封機柜與防腐蝕服務(wù)器,冷卻液成本占比高達(dá)60%,生態(tài)兼容性仍在完善中。
二、成本博弈:短期投入與長期收益的全生命周期權(quán)衡
性價比的核心是成本與收益的匹配度。對于AIDC項目而言,成本考量需覆蓋前期建設(shè)與后期運維的全生命周期(TCO),而東數(shù)西算場景下的地域差異(西部能源成本低、東部土地成本高),進一步放大了兩者的成本差異。
(一)前期建設(shè)成本:3-4倍的投入差距,定制化是核心溢價
冷板式的前期成本優(yōu)勢顯著,單機柜總投入約8-12萬元,僅為浸沒式的1/3-1/4。具體來看,冷板式設(shè)備成本約5-10萬元/機柜,冷卻液采用低成本水基溶液,成本可忽略不計;部署階段無需大規(guī)模改造機房,僅需增加泵組和冷卻塔,附加成本約2-5萬元/機柜。這種低成本優(yōu)勢使其成為存量數(shù)據(jù)中心改造的首選,例如阿里云張北數(shù)據(jù)中心的冷板式升級項目,單機柜投入控制在10萬元以內(nèi)。
浸沒式的前期投入則面臨雙重溢價:一是定制化硬件成本,專用密封機柜、防腐蝕服務(wù)器(PCB板需防腐蝕涂層)等設(shè)備單價較高,單機柜設(shè)備成本達(dá)15-25萬元;二是冷卻液與部署成本,3M氟化液等高端介質(zhì)單價1.5-3萬元/升,單機柜需數(shù)百升,疊加地面承重改造、防泄漏設(shè)施等費用,單機柜總投入高達(dá)30-40萬元。不過2025年以來,國產(chǎn)替代趨勢正在緩解成本壓力,國產(chǎn)氟化液使冷卻液成本下降30%,潞安太行煤基介電冷卻液等本土介質(zhì)更實現(xiàn)了性價比突破。
(二)后期運維成本:高能耗節(jié)省 vs 高介質(zhì)維護的此消彼長
運維成本的差異核心在于“冷卻液維護”與“能耗節(jié)省”的對沖。冷板式的年均運維成本約0.5萬元/機柜,主要包括去離子水定期過濾(0.3萬元/年)與風(fēng)冷輔助系統(tǒng)維護(0.2萬元/年),冷卻液基本無需更換,僅需應(yīng)對5%-10%概率的冷板堵塞風(fēng)險,單次清洗成本約0.5萬元。但其節(jié)能收益相對有限,較風(fēng)冷僅節(jié)省20%-30%的電費。
浸沒式的年均運維成本較高,約2-3萬元/機柜,主要來自冷卻液純度監(jiān)測(1-2萬元/年)與定期更換費用(氟化液5-8年更換一次,單次成本10-15萬元/機柜),且服務(wù)器維修需停機排空冷卻液,人工耗時增加20%-30%。但極致的節(jié)能效果形成了顯著對沖:較風(fēng)冷節(jié)省40%以上電費,且高溫冷卻液可直接用于區(qū)域供暖,余熱回收效率達(dá)90%。在西部能源成本較低的場景下,這種對沖效應(yīng)更為明顯——模擬數(shù)據(jù)顯示,高密度AI場景下,浸沒式5年TCO可反超冷板式,電費節(jié)省足以抵消前期高投入。
三、場景適配:東數(shù)西算下的地域分工與需求分層
東數(shù)西算工程的核心邏輯是“東數(shù)西存、東算西訓(xùn)”,東部樞紐聚焦低時延算力需求,西部樞紐承擔(dān)高時延、高算力訓(xùn)練任務(wù),這種地域分工直接決定了液冷方案的選型優(yōu)先級。
東部樞紐:冷板式的“主戰(zhàn)場”。東部地區(qū)存量數(shù)據(jù)中心密集,且多承擔(dān)在線推理、政務(wù)數(shù)據(jù)處理等低時延需求,對改造周期與兼容性要求極高。冷板式無需重構(gòu)機房的優(yōu)勢的在此場景下被最大化,可快速實現(xiàn)單機柜功率從40kW到60kW的提升,同時將PUE從1.6降至1.3左右,契合東部地區(qū)“存量升級、快速投產(chǎn)”的需求。此外,東部土地成本高,冷板式無需大規(guī)模改造基礎(chǔ)設(shè)施的特點,可進一步降低場地占用成本。政策層面,北京、上海等東部省市對液冷采購給予最高30%算力券補貼或300元/kW的項目補貼,進一步放大了冷板式的短期性價比優(yōu)勢。
西部樞紐:浸沒式的“增長極”。西部樞紐(甘肅慶陽、寧夏中衛(wèi)等)能源豐富(風(fēng)電、光伏等可再生能源占比高)、土地成本低,是AI訓(xùn)練、超算等高密算力場景的核心承載地。東數(shù)西算政策明確要求西部新建數(shù)據(jù)中心PUE≤1.25,而浸沒式1.03-1.08的超低PUE可輕松達(dá)標(biāo),且能通過余熱回收實現(xiàn)能源二次利用——例如潞安太行的智慧礦山項目,采用浸沒式液冷后年減排二氧化碳35噸,同時降低能耗30%。此外,西部樞紐多為新建數(shù)據(jù)中心,無存量設(shè)備兼容約束,可直接采用定制化浸沒式方案,規(guī)避冷板式的局部熱點與功率上限問題。安徽蕪湖提爾液冷智算基地的實踐顯示,全浸沒方案可將計算密度提升10倍,同時帶動本土液冷設(shè)備產(chǎn)業(yè)鏈發(fā)展,形成“技術(shù)落地+產(chǎn)業(yè)賦能”的雙贏格局。
四、碳中和貢獻:從“節(jié)能降碳”到“全周期減碳”的差異
碳中和目標(biāo)下,液冷方案的性價比不僅要計算經(jīng)濟成本,更要考量碳減排效益。微軟團隊的生命周期評估(LCA)數(shù)據(jù)顯示,兩種方案的碳減排路徑存在顯著差異,且與能源結(jié)構(gòu)深度綁定。
冷板式的碳減排核心在于“替代風(fēng)冷節(jié)能”。相較傳統(tǒng)風(fēng)冷,冷板式可減少15-16%的溫室氣體排放,降低15%能耗及31-50%用水。其優(yōu)勢在于技術(shù)成熟、規(guī)模化應(yīng)用成本低,可快速實現(xiàn)存量數(shù)據(jù)中心的碳減排改造,適合能源結(jié)構(gòu)以火電為主的區(qū)域——通過降低能耗直接減少燃煤發(fā)電帶來的碳排放。但受限于風(fēng)冷輔助的設(shè)計,其碳減排潛力存在天花板,難以滿足極致低碳場景的需求。
浸沒式的碳減排則實現(xiàn)了“節(jié)能+余熱回收+清潔能源適配”的三重收益。數(shù)據(jù)顯示,單相浸沒可降低13-16%溫室氣體排放,雙相浸沒更是提升至20-21%,用水減少48-82%,且當(dāng)系統(tǒng)采用100%可再生能源時,節(jié)水效益可再提升13%-48%。在西部樞紐等可再生能源豐富的區(qū)域,浸沒式的超低PUE可最大化清潔能源的利用效率,配合高溫余熱回收用于區(qū)域供暖,實現(xiàn)“算力生產(chǎn)+民生供暖”的碳循環(huán)閉環(huán)。更重要的是,國產(chǎn)冷卻液技術(shù)的突破正在進一步降低其碳足跡——中石化“昆侖”系列、潞安太行煤基介電液等替代材料,不僅降低了對高GWP值氟化液的依賴,更實現(xiàn)了本土產(chǎn)業(yè)鏈的低碳化。
五、選型結(jié)論:場景導(dǎo)向下的“非此即彼”與“互補共生”
綜合來看,2025年液冷AIDC的選型并非“非此即彼”的二元對立,而是基于場景需求的精準(zhǔn)匹配,甚至在高復(fù)雜場景下呈現(xiàn)“冷板式+浸沒式”的互補趨勢。
優(yōu)先選擇冷板式的場景:1)東部存量數(shù)據(jù)中心升級改造,單機柜功率密度≤80kW,預(yù)算有限且需快速投產(chǎn);2)中小型AI實驗室、政務(wù)數(shù)據(jù)中心等中低功率場景,缺乏專業(yè)維護團隊;3)工業(yè)中低功率設(shè)備散熱,需適配粉塵、振動等復(fù)雜環(huán)境。此類場景下,冷板式的兼容性、低成本與短周期優(yōu)勢,可實現(xiàn)“性價比+碳減排”的平衡。
優(yōu)先選擇浸沒式的場景:1)西部新建AI超算中心、大規(guī)模訓(xùn)練集群,單機柜功率密度≥100kW;2)追求極致PUE(≤1.1)與長期碳減排目標(biāo),設(shè)備生命周期≥5年;3)高功率工業(yè)與軍工設(shè)備(新能源電池測試、軍工雷達(dá)等),對散熱穩(wěn)定性要求嚴(yán)苛。此類場景下,浸沒式的高密適配、超低能耗與余熱回收優(yōu)勢,可覆蓋前期高投入的成本溢價。
值得注意的是,混合散熱方案正在成為高復(fù)雜場景的新選擇——核心發(fā)熱部件(GPU集群)采用浸沒式保障極致散熱,輔助部件(內(nèi)存、硬盤)采用冷板式控制成本。某AI訓(xùn)練中心的實踐顯示,這種方案使單機柜功率密度達(dá)180kW,初期投入較純浸沒式降低30%,實現(xiàn)效率與成本的最優(yōu)平衡。