日韩人妻毛片中文字幕-亚洲精品无码永久在线观看男男-在线精品视频一区二区三四-婷婷六月在线精品免费视频观看-欧亚一区二区三区av-欧美与黑人午夜性猛交久久久-爱v久久久噜噜噜久久久噜噜-色老头久久久久久久久久-亚洲免费综合一二三四五区

新聞中心

聯(lián)系我們

了解更多詳細信息,請致電

020-38815864

地址:廣州市天河區(qū)燕嶺路120號823
電話:020-38815864
郵箱:cs@cs003.vip

浪潮信息重磅發(fā)布超節(jié)點 AI 服務器,適配萬億參數(shù)大模型


發(fā)布時間:2025-08-12


近日,浪潮信息推出了一款專為萬億參數(shù)級大模型打造的超節(jié)點 AI 服務器「元腦 SD200」。這款新產品的亮相,不僅彰顯了浪潮信息在前沿計算架構領域的扎實功底,也意味著國產算力系統(tǒng)在應對超大規(guī)模 AI 模型挑戰(zhàn)時,邁入了一個全新的發(fā)展階段。下面,我們就來詳細了解一下這款服務器。

?

一、單機承載萬億級模型,架構實現(xiàn)突破?
如今,大模型參數(shù)規(guī)模不斷攀升,像 DeepSeek R1、Kimi K2、Qwen 等開源模型都已接近或突破萬億參數(shù)。面對這樣的趨勢,傳統(tǒng)服務器在顯存和帶寬方面的瓶頸愈發(fā)明顯。而浪潮信息的「元腦 SD200」采用超節(jié)點架構,對算力邏輯進行了重構,在單機內集成了 64 路本土 GPU 芯片,讓傳統(tǒng)服務器集群的性能瓶頸成為過去。?
在存儲方面,借助遠端 GPU 虛擬映射技術,服務器的顯存統(tǒng)一地址空間擴大了 8 倍,單機能提供最大 4TB 的統(tǒng)一顯存和 64TB 的統(tǒng)一內存。這就為萬億參數(shù)模型處理海量鍵值緩存和超長序列提供了充足的資源。實際測試顯示,它能同時運行 DeepSeek R1、Qwen、Kimi、GLM 這四大國產頂級開源模型,滿足多智能體實時協(xié)作和按需調用等復雜場景的需求。?

通信方面,通過自研的 Open Fabric Switch 開放總線交換技術構建起 3D Mesh 系統(tǒng)架構,實現(xiàn)了 64 卡 GPU 的高速互連。憑借百納秒級的物理鏈路和原生內存語義通信,在推理時的小數(shù)據(jù)包通信場景中,比如原子操作、load - store 指令等,性能有了明顯提升。全規(guī)約等算子的通信效率也遠超傳統(tǒng)架構,有效解決了大規(guī)模并行計算中數(shù)據(jù)傳輸?shù)碾y題。

?

二、軟硬協(xié)同發(fā)力,突破芯片性能極限?
「元腦 SD200」不只是簡單的硬件組合,更是系統(tǒng)層面上軟硬深度協(xié)同的成果。?
智能總線管理系統(tǒng)能夠根據(jù)萬億模型計算時對通信的敏感需求,動態(tài)規(guī)劃出全局最優(yōu)的路由,支持多拓撲結構的切換和資源的按需分配。對于 All Reduce、All Gather 等常見算子,通過多層級細粒度的通信策略,進一步降低延遲,讓 64 卡 GPU 的協(xié)同潛力得到最大程度的發(fā)揮。?
開放 PD 分離推理框架將推理過程拆分為預填充與解碼異步并行,提高了 KV Cache 的傳輸效率。這不僅提升了業(yè)務場景的服務等級,還能很好地兼容昇騰、沐曦等國產 GPU 及異構計算組合,大大增強了系統(tǒng)對未來模型更新迭代的適應能力。?

和傳統(tǒng)的橫向擴展方案相比,SD200 選擇了縱向擴展路徑。這種設計通過短鏈路物理集成,讓芯片間的通信效率有了質的飛躍。浪潮信息副總經理趙帥表示,在推理場景的小數(shù)據(jù)包通信優(yōu)化上,這種設計效果顯著。實際測試中,DeepSeek R1 全參推理性能實現(xiàn)了 370% 的超線性擴展效率,Kimi K2 等模型的性能也有明顯提升。

?

三、秉持開放生態(tài)理念,助力國產 AI 規(guī)模化應用?
浪潮信息一直將開源開放作為核心戰(zhàn)略,「元腦 SD200」就是這一理念的生動體現(xiàn)。?
在本土產業(yè)鏈協(xié)同與兼容方面,服務器采用 OCM(開放算力模組)+ OAM(開放加速模塊)標準架構設計,能夠快速適配 Intel、AMD、ARM 等多種 CPU 平臺,以及摩爾線程、沐曦、天數(shù)智芯等 20 余家主流國產 GPU 芯片。通過標準化,降低了產業(yè)鏈整合的成本,推動了國產算力生態(tài)的成熟。?
在部署遷移方面,它全面兼容 PyTorch、vLLM、SGLang 等主流 AI 框架,以及 Megatron - LM、DeepSpeed 等訓練工具,現(xiàn)有模型和工作流可以零改造遷移過來。這對生物醫(yī)藥、氣象科學、工業(yè)仿真等垂直領域的客戶來說非常重要,他們能快速將定制化的萬億模型部署到新平臺上,加快 AI 在科學等前沿領域的應用。?

同時,浪潮信息還通過「元腦生態(tài)」平臺不斷開放技術接口,與華勝天成、上海華胄等行業(yè) ISV 伙伴深度合作,共同開發(fā)場景化解決方案,推動 AI 從通用能力向各個行業(yè)的智能化深度發(fā)展。

?

四、破解算力難題,改變 AI 應用模式?
當前,AI 產業(yè)正受到模型參數(shù)膨脹和 Agentic 智能體交互的雙重推動。?
萬億模型的商業(yè)化迎來了關鍵轉折點。麥肯錫預測,未來五年全球 AI 數(shù)據(jù)中心的算力需求將大幅增長,電力增量相當于 10 個三峽電站的年發(fā)電量。傳統(tǒng)的單點服務器或小規(guī)模集群已經難以滿足智能體應用的需求,這類應用推理速度需要達到 50–100 token/s,多輪對話的 token 量更是傳統(tǒng)模型的百倍。「元腦 SD200」的全面商用,為企業(yè)提供了一條降本增效的規(guī)模化部署途徑,單機就能替代部分低效集群,降低數(shù)據(jù)中心的復雜度和運維成本。?

在綠色可持續(xù)方面,SD200 優(yōu)先采用風冷方案,同時也兼顧液冷擴展。這不僅降低了企業(yè)機房改造的門檻,還順應了全球數(shù)據(jù)中心能效優(yōu)化的趨勢,體現(xiàn)了浪潮信息長期堅持的「綠色計算」理念

?

五、前瞻布局,引領國產算力進入超節(jié)點時代?
「元腦 SD200」的誕生并非偶然,而是浪潮信息在融合架構與開放計算領域十余年積累的成果。?
其核心技術,如內存語義通信、資源池化、動態(tài)調度等,源于浪潮信息對「融合架構 3.0」的不斷發(fā)展。從整合供電、散熱等非 IT 資源,到實現(xiàn)計算、存儲、異構加速等核心資源的深度解耦,積累了芯片共享內存、統(tǒng)一編址等關鍵能力。此前發(fā)布的「源 1.0」中文巨量模型(2457 億參數(shù))以及多款 CPU 推理服務器(如 NF8260G7),都為大模型優(yōu)化積累了豐富經驗。?
作為開放計算社區(qū)(OCP)與中國開放計算標準組織(OCTC)的重要成員,浪潮信息正積極推動超節(jié)點架構的標準化。后續(xù)計劃開源部分設計及 PD 分離框架,聯(lián)合產學研伙伴共同構建 GW 級開放智算生態(tài),助力中國在全球 AI 算力競爭中占據(jù)有利地位。

返回上一頁
  • 返回頂部
  • 020-38815864
  • 微信咨詢
    關注我們