(2025 年 6 月 12 日,廣州)在近日舉辦的全球開發(fā)者大會(WWDC25)上,蘋果正式推出新一代 AI 模型體系,但服務(wù)器端性能表現(xiàn)引發(fā)業(yè)界關(guān)注。根據(jù)官方技術(shù)文檔披露,蘋果云端模型處理能力僅達到 GPT-4 Turbo 水平,而 OpenAI 于 2024 年 5 月發(fā)布的 GPT-4o 模型在相同基準測試中速度提升 100%、成本降低 50%。這一差距再次凸顯蘋果在云端大模型領(lǐng)域的追趕壓力。
蘋果此次更新的 AI 架構(gòu)分為三層:設(shè)備端 30 億參數(shù)輕量模型、私有云服務(wù)器端模型,以及第三方模型集成。其中,服務(wù)器端模型雖通過 AXLearn 框架實現(xiàn)與 GPT-4 Turbo 相當(dāng)?shù)奈谋旧赡芰Γ诙嗄B(tài)交互、實時響應(yīng)速度等核心指標(biāo)上仍落后于 GPT-4o。
具體來看,GPT-4o 作為 OpenAI 首個端到端多模態(tài)模型,支持語音情感識別、手寫體解析等復(fù)雜任務(wù),平均響應(yīng)時間僅 320 毫秒,且成本較前代降低一半。反觀蘋果云端模型,盡管通過私有云計算實現(xiàn)端到端加密,但處理視頻、音頻等非結(jié)構(gòu)化數(shù)據(jù)時仍依賴傳統(tǒng)分段處理流程,響應(yīng)延遲高出 GPT-4o 約 40%。
不過,蘋果在端側(cè)場景展現(xiàn)差異化優(yōu)勢。其 30 億參數(shù)模型在 iPhone 15 Pro 上實現(xiàn)每秒 30 個 token 的生成速率,在摘要生成、跨應(yīng)用操作等垂直場景表現(xiàn)優(yōu)于 Mistral-7B 等開源模型。配合內(nèi)存優(yōu)化技術(shù),該模型可在 8GB 內(nèi)存設(shè)備上穩(wěn)定運行,成為目前唯一實現(xiàn)系統(tǒng)級 API 無縫銜接的端側(cè)方案。
WWDC25 后,蘋果股價單日下跌 1.5%,市值縮水超 450 億美元,反映資本市場對 AI 進展的失望。分析師指出,谷歌同期推出的 Gemini Ultra 模型已實現(xiàn)端側(cè)多模態(tài)推理,而蘋果仍未兌現(xiàn) Siri 全面升級承諾,進一步削弱市場信心。
為應(yīng)對競爭,蘋果宣布向開發(fā)者開放 AI 模型權(quán)限,允許調(diào)用設(shè)備端輕量模型構(gòu)建應(yīng)用。這一策略旨在激活 600 萬開發(fā)者生態(tài),預(yù)計可催生數(shù)萬款 AI 原生工具。同時,蘋果正與谷歌談判引入 Gemini 模型,試圖通過多第三方集成彌補自研短板。
蘋果始終將隱私保護作為 AI 戰(zhàn)略核心。其私有云計算采用芯片級加密,用戶數(shù)據(jù)僅在處理時臨時上傳且不留存,這一設(shè)計在金融、醫(yī)療等敏感領(lǐng)域具有獨特吸引力。然而,過度依賴本地處理也限制了模型訓(xùn)練數(shù)據(jù)規(guī)模,導(dǎo)致其在復(fù)雜推理任務(wù)上落后于云端大模型。
“蘋果的端側(cè) AI 是目前最貼近用戶真實需求的落地方案,但服務(wù)器端能力缺失可能使其在企業(yè)級市場失去競爭力?!盜DC 中國研究經(jīng)理郭天翔指出,“如何平衡隱私保護與功能拓展,將是蘋果 AI 破局的關(guān)鍵。”