算力卡,尤其是基于 GPU 的加速卡,憑借其強(qiáng)大的并行計(jì)算能力,已成為 AI 訓(xùn)練、數(shù)據(jù)中心、科學(xué)模擬等領(lǐng)域的 “剛需”。例如,訓(xùn)練 ChatGPT 級(jí)別的大模型需消耗約 3640PetaFLOPs / 天的算力,而英偉達(dá) A100 算力卡憑借 624TOPS 的 INT8 算力和 2TB/s 的顯存帶寬,成為全球數(shù)據(jù)中心的主流選擇。隨著 “東數(shù)西算” 工程全面推進(jìn),中國(guó)正加速構(gòu)建算力網(wǎng)絡(luò),消費(fèi)級(jí)算力卡如重慶聯(lián)通與青海聯(lián)通聯(lián)合推出的產(chǎn)品,已開(kāi)始滿足個(gè)人用戶對(duì)超算服務(wù)的需求。
英偉達(dá)作為傳統(tǒng) GPU 巨頭,正從 “賣(mài)鏟子” 轉(zhuǎn)向 AI 基礎(chǔ)設(shè)施服務(wù)商。其 2025 年發(fā)布的 NVLink Fusion 半定制架構(gòu),允許與高通、聯(lián)發(fā)科等廠商的定制芯片協(xié)同,以應(yīng)對(duì) ASIC 芯片的競(jìng)爭(zhēng)。同時(shí),新一代 B300 算力卡在性能上較前代提升 50%,并采用 PTFE 基多層 PCB 提升高頻傳輸穩(wěn)定性。
ASIC 芯片因針對(duì)特定算法優(yōu)化,在推理場(chǎng)景中能效比顯著優(yōu)于 GPU。Marvell 預(yù)測(cè),到 2028 年數(shù)據(jù)中心 ASIC 市場(chǎng)規(guī)模將達(dá) 429 億美元,占加速計(jì)算芯片的 25%。谷歌、Meta 等企業(yè)已大規(guī)模采用自研 ASIC,推動(dòng)算力成本下降 37%。
隨著算力卡功耗攀升(如 B300 TDP 達(dá) 1400W),液冷散熱成為剛需。英維克、申菱環(huán)境等企業(yè)推出浸沒(méi)式液冷方案,可將 PUE 降至 1.1 以下,助力實(shí)現(xiàn) “雙碳” 目標(biāo)。
英偉達(dá) A100、英特爾 Habana Gaudi2 等訓(xùn)練級(jí)顯卡支撐著大模型研發(fā)。例如,Gaudi2 憑借 2048 TFLOPS 的 INT8 算力和 96GB HBM2e 顯存,在自然語(yǔ)言處理任務(wù)中展現(xiàn)出高性價(jià)比。而開(kāi)源大模型如 DeepSeek-R1 的成熟,進(jìn)一步推動(dòng)推理算力需求,ASIC 芯片在邊緣計(jì)算場(chǎng)景中優(yōu)勢(shì)凸顯。
AMD MI250X 的雙芯設(shè)計(jì)和 3.2TB/s 顯存帶寬,使其在分子動(dòng)力學(xué)模擬、天體物理數(shù)據(jù)處理等領(lǐng)域表現(xiàn)卓越。天河區(qū)的廣州人工智能公共算力中心,已為智慧醫(yī)療、自動(dòng)駕駛等 200 余家企業(yè)提供 500P 算力支持。
北京聯(lián)通推出的 5G-A 算力卡,整合通信權(quán)益與算力服務(wù),最高下載峰值達(dá) 3Gbps,支持云游戲、超高清直播等場(chǎng)景。在金融領(lǐng)域,高頻交易系統(tǒng)依賴 A100 的低時(shí)延計(jì)算能力;醫(yī)療影像分析則通過(guò)算力卡加速 AI 輔助診斷效率。
- 訓(xùn)練場(chǎng)景:優(yōu)先選擇高 FP16/INT8 算力的顯卡,如英偉達(dá) A100(312TFLOPS FP16)或 AMD MI250X(383TFLOPS FP16)。
- 推理場(chǎng)景:ASIC 芯片如谷歌 TPU 或定制 GPU(如 Cloud-A100 Z)更具性價(jià)比。
- 多任務(wù)需求:支持 MIG 技術(shù)的 A100 可虛擬多實(shí)例,提升資源利用率。
- 消費(fèi)級(jí):RTX 3090(282 TFLOPS FP16)適合中小團(tuán)隊(duì),而專業(yè)級(jí) Tesla V100(30 TFLOPS FP64)更適用于科學(xué)計(jì)算。
- 能效比:英特爾 Habana Gaudi2 的 BF16 算力達(dá) 1024 TFLOPS,功耗僅 600W,適合數(shù)據(jù)中心規(guī)模化部署。
- CUDA 生態(tài):英偉達(dá)的 CUDA 和 TensorRT 仍是深度學(xué)習(xí)主流選擇,而 AMD 的 ROCm 生態(tài)正在快速發(fā)展。
- 硬件兼容性:需注意電源功率(如 A100 需 400W)、PCIe 接口版本及散熱方案。