(2025 年 6 月 12 日,廣州)在近日舉辦的全球開發(fā)者大會(huì)(WWDC25)上,蘋果正式推出新一代 AI 模型體系,但服務(wù)器端性能表現(xiàn)引發(fā)業(yè)界關(guān)注。根據(jù)官方技術(shù)文檔披露,蘋果云端模型處理能力僅達(dá)到 GPT-4 Turbo 水平,而 OpenAI 于 2024 年 5 月發(fā)布的 GPT-4o 模型在相同基準(zhǔn)測(cè)試中速度提升 100%、成本降低 50%。這一差距再次凸顯蘋果在云端大模型領(lǐng)域的追趕壓力。
蘋果此次更新的 AI 架構(gòu)分為三層:設(shè)備端 30 億參數(shù)輕量模型、私有云服務(wù)器端模型,以及第三方模型集成。其中,服務(wù)器端模型雖通過(guò) AXLearn 框架實(shí)現(xiàn)與 GPT-4 Turbo 相當(dāng)?shù)奈谋旧赡芰Γ诙嗄B(tài)交互、實(shí)時(shí)響應(yīng)速度等核心指標(biāo)上仍落后于 GPT-4o。
具體來(lái)看,GPT-4o 作為 OpenAI 首個(gè)端到端多模態(tài)模型,支持語(yǔ)音情感識(shí)別、手寫體解析等復(fù)雜任務(wù),平均響應(yīng)時(shí)間僅 320 毫秒,且成本較前代降低一半。反觀蘋果云端模型,盡管通過(guò)私有云計(jì)算實(shí)現(xiàn)端到端加密,但處理視頻、音頻等非結(jié)構(gòu)化數(shù)據(jù)時(shí)仍依賴傳統(tǒng)分段處理流程,響應(yīng)延遲高出 GPT-4o 約 40%。
不過(guò),蘋果在端側(cè)場(chǎng)景展現(xiàn)差異化優(yōu)勢(shì)。其 30 億參數(shù)模型在 iPhone 15 Pro 上實(shí)現(xiàn)每秒 30 個(gè) token 的生成速率,在摘要生成、跨應(yīng)用操作等垂直場(chǎng)景表現(xiàn)優(yōu)于 Mistral-7B 等開源模型。配合內(nèi)存優(yōu)化技術(shù),該模型可在 8GB 內(nèi)存設(shè)備上穩(wěn)定運(yùn)行,成為目前唯一實(shí)現(xiàn)系統(tǒng)級(jí) API 無(wú)縫銜接的端側(cè)方案。
WWDC25 后,蘋果股價(jià)單日下跌 1.5%,市值縮水超 450 億美元,反映資本市場(chǎng)對(duì) AI 進(jìn)展的失望。分析師指出,谷歌同期推出的 Gemini Ultra 模型已實(shí)現(xiàn)端側(cè)多模態(tài)推理,而蘋果仍未兌現(xiàn) Siri 全面升級(jí)承諾,進(jìn)一步削弱市場(chǎng)信心。
為應(yīng)對(duì)競(jìng)爭(zhēng),蘋果宣布向開發(fā)者開放 AI 模型權(quán)限,允許調(diào)用設(shè)備端輕量模型構(gòu)建應(yīng)用。這一策略旨在激活 600 萬(wàn)開發(fā)者生態(tài),預(yù)計(jì)可催生數(shù)萬(wàn)款 AI 原生工具。同時(shí),蘋果正與谷歌談判引入 Gemini 模型,試圖通過(guò)多第三方集成彌補(bǔ)自研短板。
蘋果始終將隱私保護(hù)作為 AI 戰(zhàn)略核心。其私有云計(jì)算采用芯片級(jí)加密,用戶數(shù)據(jù)僅在處理時(shí)臨時(shí)上傳且不留存,這一設(shè)計(jì)在金融、醫(yī)療等敏感領(lǐng)域具有獨(dú)特吸引力。然而,過(guò)度依賴本地處理也限制了模型訓(xùn)練數(shù)據(jù)規(guī)模,導(dǎo)致其在復(fù)雜推理任務(wù)上落后于云端大模型。
“蘋果的端側(cè) AI 是目前最貼近用戶真實(shí)需求的落地方案,但服務(wù)器端能力缺失可能使其在企業(yè)級(jí)市場(chǎng)失去競(jìng)爭(zhēng)力。”IDC 中國(guó)研究經(jīng)理郭天翔指出,“如何平衡隱私保護(hù)與功能拓展,將是蘋果 AI 破局的關(guān)鍵。”