今年人工智能硬件圈最大的懸念即將揭曉 ——NVIDIA 旗下基于 Blackwell Ultra 架構(gòu)的 GB300 AI 服務(wù)器,確定 9 月正式啟動(dòng)全球發(fā)貨。這款被業(yè)內(nèi)稱為 "推理神器" 的新設(shè)備,不僅在算力和能效上實(shí)現(xiàn)了跨越式突破,更可能重塑整個(gè) AI 產(chǎn)業(yè)鏈的競(jìng)爭(zhēng)格局。
?
一、從 "夠用" 到 "過剩" 的算力革命?
GB300 最讓人驚嘆的,是它解決了 AI 推理長(zhǎng)期存在的 "內(nèi)存瓶頸" 問題。288GB HBM3e 顯存搭配 15P FLOPS FP4 算力,讓它成為全球首個(gè)能流暢運(yùn)行百萬 token 級(jí)推理任務(wù)的平臺(tái)。?
實(shí)際測(cè)試中,運(yùn)行 DeepSeek-R1 671B 這種超大型模型時(shí),GB300 生成響應(yīng)只要 10 秒,而上一代 H100 需要 1 分半鐘。如果把 72 顆 GB300 GPU 和 36 顆 Grace CPU 組合成超級(jí)集群,每秒能處理 128 萬億 token,是上一代系統(tǒng)的 11 倍。
?
背后支撐這種飛躍的技術(shù)創(chuàng)新很實(shí)在:?
- 稀疏計(jì)算技術(shù)把算力利用率從 30% 提到 89%,直接幫企業(yè)省錢?
- 全液冷設(shè)計(jì)搞定 1400W 的高功耗,能效比提升 40%?
- 新升級(jí)的網(wǎng)卡把帶寬提到 1.6T,大規(guī)模集群通信更順暢
- ?
二、從硬件到應(yīng)用的連鎖反應(yīng)?
GB300 的到來,不只是一款新硬件那么簡(jiǎn)單。TrendForce 的數(shù)據(jù)顯示,2025 年全球 AI 服務(wù)器市場(chǎng)規(guī)模可能沖到 2980 億美元,而這款新設(shè)備大概率會(huì)貢獻(xiàn)超過六成的增長(zhǎng)。?
現(xiàn)在戴爾、惠普這些大廠已經(jīng)拿出了基于 GB300 的產(chǎn)品。戴爾的 PowerEdge XE9712 服務(wù)器,靠液冷技術(shù)把推理輸出提升了 50 倍,訂單已經(jīng)排到了年底。
?
這波熱潮還帶火了上下游產(chǎn)業(yè):?
- 高端電子布和 HVLP5 高頻銅箔供不應(yīng)求,缺口超過 25%?
- 1.6T 光模塊訂單被中際旭創(chuàng)等企業(yè)搶空?
- 液冷設(shè)備廠商英維克、高瀾股份的訂單都排到 2026 年了
- ?
三、行業(yè)變局?
GB300 的超強(qiáng)算力,正在讓多個(gè)行業(yè)的效率天花板被打破:?
智能汽車領(lǐng)域,理想汽車用它搭建的新系統(tǒng),把自動(dòng)駕駛的環(huán)境建模延遲降到了 500 納秒,反應(yīng)速度提升一個(gè)量級(jí);?
工業(yè)設(shè)計(jì)方面,西門子用它做風(fēng)電葉片設(shè)計(jì),以前要 6 個(gè)月的迭代周期,現(xiàn)在 2 周就能完成;?
生物醫(yī)藥領(lǐng)域更明顯,輝瑞用它做新藥篩選,效率提了 20 倍,成本卻降了七成。?
連開發(fā)者生態(tài)都跟著升級(jí) —— 新推出的推理服務(wù)庫,能讓主流模型的處理速度提升 30 倍,現(xiàn)在微軟、谷歌這些大廠都已經(jīng)接入了。
?
四、算力競(jìng)賽進(jìn)入新階段?
黃仁勛在今年 GTC 大會(huì)上透露,2026 年還會(huì)有更強(qiáng)的 Rubin 架構(gòu),性能是 GB300 的 3.3 倍;到 2027 年,新一代產(chǎn)品性能甚至?xí)_(dá)到現(xiàn)在的 14 倍。這種迭代速度,正在讓通用人工智能的實(shí)現(xiàn)變得越來越近。?
IDC 分析師 John Dinsdale 說得很直接:"GB300 標(biāo)志著 AI 算力進(jìn)入 ' 推理優(yōu)先 ' 時(shí)代,企業(yè)該重新規(guī)劃算力投入了。"OpenAI 的 Ilya 也認(rèn)為,這款設(shè)備讓復(fù)雜推理的成本第一次出現(xiàn)大幅下降。?
今年 9 月,首批 GB300 服務(wù)器就會(huì)送到 CoreWeave 這些頭部客戶手上。不管是生成式 AI 的內(nèi)容創(chuàng)作,還是物理世界的智能改造,這場(chǎng)由 NVIDIA 掀起的算力革命,已經(jīng)讓我們看到了人工智能的下一個(gè)爆發(fā)點(diǎn)。?