網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

百度AI最新進(jìn)展，李彥宏打出一張效率牌

2026-05-11 12:16:58　來(lái)源: 新眸深度

江蘇舉報(bào)

分享至

新眸原創(chuàng)·作者 | 李小東

百度選在2026年Create大會(huì)開(kāi)幕前四天，端出了文心大模型5.1。

這個(gè)時(shí)間點(diǎn)的選擇不算意外。5月13日的開(kāi)發(fā)者大會(huì)需要一張技術(shù)底牌，而距離上一個(gè)版本發(fā)布已過(guò)去近半年，市場(chǎng)上關(guān)于“百度大模型掉隊(duì)”的聲音正在變響。

這個(gè)時(shí)候推出的文心5.1，需要用數(shù)據(jù)來(lái)回?fù)暨@些質(zhì)疑，而它也的確拿出了幾張夠硬的牌：搜索榜國(guó)內(nèi)第一，預(yù)訓(xùn)練成本僅為業(yè)界同規(guī)模模型的6%，Agent能力超越DeepSeek-V4-Pro。

但回看百度過(guò)去一年的AI軌跡，一個(gè)問(wèn)題很難回避：技術(shù)上的領(lǐng)先，似乎并沒(méi)完全轉(zhuǎn)化為市場(chǎng)端的領(lǐng)先？文心5.1給出的答案，分量又有多重呢？

三組數(shù)據(jù)

和解一樁“舊案”

先看文心5.1到底亮出了什么。

根據(jù)LMArena大模型競(jìng)技場(chǎng)最新排名，文心5.1以1223分位列搜索榜國(guó)內(nèi)第一、全球第四，是該榜單中唯一上榜的國(guó)產(chǎn)大模型。它的Preview版本早在4月30日就以1476分登頂文本榜國(guó)內(nèi)第一，超越GPT-5.5和DeepSeek-V4-Pro，是前十五名中唯一入圍的國(guó)產(chǎn)模型。

對(duì)于一家從2023年起就被反復(fù)質(zhì)疑“大模型沒(méi)聲音了”的公司來(lái)說(shuō)，這兩項(xiàng)成績(jī)是某種意義上的“解案”，至少?gòu)陌駟尉S度看，百度的模型能力沒(méi)有掉隊(duì)。

不過(guò)值得討論的，的確不是分?jǐn)?shù)，而是分?jǐn)?shù)背后的技術(shù)路徑選擇。

文心5.1的核心技術(shù)叫“多維彈性預(yù)訓(xùn)練”。這個(gè)提法最早在文心5.0發(fā)布時(shí)出現(xiàn)，它的邏輯是：在一次預(yù)訓(xùn)練過(guò)程中，通過(guò)動(dòng)態(tài)采樣機(jī)制同時(shí)優(yōu)化大量不同深度、專家容量和稀疏度的子模型，最終構(gòu)建一個(gè)覆蓋不同參數(shù)規(guī)模和計(jì)算預(yù)算的子模型矩陣。

翻譯成白話就是，一次訓(xùn)練，生成多種型號(hào)，不再需要為每種規(guī)模單獨(dú)燒一次算力。按照研發(fā)人員的表述，這套框架分別沿彈性深度、彈性專家容量和彈性稀疏度三個(gè)維度做壓縮與擴(kuò)展，通過(guò)可變Top-k路由靈活調(diào)配激活專家數(shù)量，在推理開(kāi)銷和模型性能之間建立可控的調(diào)節(jié)空間。

落到具體數(shù)字上：文心5.1的總參數(shù)被壓縮到文心5.0的約三分之一，激活參數(shù)壓縮到約二分之一，預(yù)訓(xùn)練計(jì)算成本僅為同規(guī)模同類模型的6%。

6%這個(gè)數(shù)字很容易被誤讀。它不是說(shuō)“用6%的錢(qián)做出了100%的性能”，而是說(shuō)，在同等參數(shù)量級(jí)和性能水平下，訓(xùn)練階段消耗的算力只用了行業(yè)慣常的6%。這是通過(guò)“模型壓縮和彈性訓(xùn)練大幅降低冗余計(jì)算”來(lái)達(dá)成的，是一種預(yù)訓(xùn)練環(huán)節(jié)的效率提升。

在2026年全球數(shù)據(jù)中心能耗爭(zhēng)議持續(xù)升級(jí)、國(guó)產(chǎn)芯片供給尚不寬裕的背景下，這個(gè)方向的選擇，說(shuō)服力不弱。

再看評(píng)測(cè)數(shù)據(jù)。在τ3-bench和SpreadsheetBench-Verified兩項(xiàng)智能體評(píng)測(cè)任務(wù)中，文心5.1超越了DeepSeek-V4-Pro，官方給出的描述是“智能體能力已接近領(lǐng)先閉源模型的水平”。創(chuàng)意寫(xiě)作方面則與Gemini 3.1 Pro持平，在AIME26數(shù)學(xué)競(jìng)賽（使用工具）上拿到99.6分，僅次于Gemini 3.1 Pro。

這些數(shù)據(jù)大多是百度內(nèi)部評(píng)測(cè)或較小的基準(zhǔn)測(cè)試，并不是LMArena那種大規(guī)模盲測(cè)榜單，穩(wěn)健性還需更多第三方驗(yàn)證，但整體方向是清晰的：這代模型的升級(jí)空間主要在Agent和深度搜索能力上，而非純粹的語(yǔ)言表達(dá)。

目前，文心5.1已在千帆模型廣場(chǎng)和文心一言官網(wǎng)上線，開(kāi)發(fā)者可以通過(guò)千帆平臺(tái)調(diào)用API。百度還宣布將文心5.1陸續(xù)接入ISEKAI ZERO、Mulan AI、諦聽(tīng)幻流、Storymaster等超過(guò)十個(gè)創(chuàng)意生產(chǎn)智能體平臺(tái)。

這個(gè)動(dòng)作的意圖明顯，不是只談模型，而是談模型落地。

放在整個(gè)行業(yè)，文心5.1在產(chǎn)品端的節(jié)奏不算慢。但真正讓百度頭疼的，一直都不是技術(shù)。

百度選了一條不同的路

如果單純比打分，文心5.1并不弱勢(shì)。但2026年的AI市場(chǎng)，尤其在中國(guó)，產(chǎn)品競(jìng)爭(zhēng)，相比看分?jǐn)?shù)，大家更在乎的是誰(shuí)的用戶多、場(chǎng)景多。

2026年春節(jié)，四家大廠在AI領(lǐng)域的總營(yíng)銷投入接近50億元。百度搶先開(kāi)局，拿出5億現(xiàn)金紅包，把入口全部放在百度App生態(tài)內(nèi)。字節(jié)豆包投入15億到20億，騰訊元寶10億，阿里千問(wèn)出手最重，60億。

根據(jù)QuestMobile的數(shù)據(jù)，春節(jié)前后字節(jié)豆包以8400萬(wàn)日活開(kāi)局，除夕當(dāng)天沖到1.45億峰值；阿里千問(wèn)活動(dòng)次日日活達(dá)到7352萬(wàn)；騰訊元寶除夕4054萬(wàn)。而百度文心的用戶增長(zhǎng)曲線動(dòng)靜平平。

外界感知到的是，百度在C端用戶的爭(zhēng)奪中正在被甩開(kāi)，雖然模型能力不斷迭代，但公眾感知嚴(yán)重滯后。這是中國(guó)AI產(chǎn)業(yè)一個(gè)特有的悖論，技術(shù)團(tuán)隊(duì)不斷優(yōu)化訓(xùn)練效率，但用戶只關(guān)心“這玩意兒能不能幫我訂機(jī)票”。兩個(gè)坐標(biāo)系互相不認(rèn)識(shí)。

如果要說(shuō)一個(gè)更大的行業(yè)敘事，2026年上半年的關(guān)鍵詞，正在從“軍備競(jìng)賽”切換到“商業(yè)化”。

前不久，字節(jié)豆包啟動(dòng)收費(fèi)模式，最低檔68元/月，最高5088元/年，評(píng)論區(qū)被“又笨又收費(fèi)”的罵聲淹沒(méi)。但不要搞錯(cuò)，這是全行業(yè)的拐點(diǎn)。上個(gè)月，阿里云、騰訊云、百度智能云和智譜同步漲價(jià)，部分漲幅高達(dá)463%。

在C端用戶還在習(xí)慣“免費(fèi)AI”幻象的時(shí)候，大廠們已經(jīng)開(kāi)始算現(xiàn)實(shí)的成本：API調(diào)用量每漲一波，模型的推理成本就跟著翻番。

百度實(shí)際上比大多數(shù)同行更早感受到了這種壓力的峰值。2025年Q3，百度核心在線營(yíng)銷收入153億元，同比下降18%，和2023年Q2的峰值197億元相比，跌去了超過(guò)五分之一。這個(gè)縮水不是周期性的，而是結(jié)構(gòu)性的——用戶不再愿意從一頁(yè)鏈接里自己找答案，AI直接給答案才是新習(xí)慣。對(duì)用戶體驗(yàn)來(lái)說(shuō)是好事，但對(duì)搜索廣告這個(gè)百度最大的利潤(rùn)支柱來(lái)說(shuō)，基礎(chǔ)開(kāi)始松動(dòng)。

李彥宏的選擇是押注AI轉(zhuǎn)型。到2025年Q4，百度AI新業(yè)務(wù)收入達(dá)到113億元，占核心非在線營(yíng)銷收入的43%。AI云收入在Q3同比增長(zhǎng)33%，AI原生營(yíng)銷服務(wù)收入同比激增262%。一減一增之間，百度的業(yè)務(wù)結(jié)構(gòu)確實(shí)在變。

回到文心5.1，如果放在這個(gè)商業(yè)化視角下重新審視，它傳遞的信號(hào)不只是“比分高”，看點(diǎn)在于，“訓(xùn)練成本是行業(yè)6%”。在API價(jià)格集體走高的2026年，訓(xùn)練成本優(yōu)勢(shì)就是云服務(wù)的定價(jià)權(quán)和利潤(rùn)空間。

百度在AI云的競(jìng)爭(zhēng)力，取決于能否把文心大模型的效率優(yōu)勢(shì)轉(zhuǎn)化為持續(xù)性收入增長(zhǎng)。這個(gè)命題，比在Benchmark榜單上拿一個(gè)第一要難得多。

文心5.1的價(jià)值

或許在百度App里

那么，文心5.1的真正價(jià)值在哪里？

如果只是將它當(dāng)作一個(gè)API調(diào)用的標(biāo)準(zhǔn)模型，技術(shù)數(shù)據(jù)上它確實(shí)有說(shuō)服力。但對(duì)于百度來(lái)說(shuō)，需要思考的是，如何把它嵌入到百度App這個(gè)月活超2億的超級(jí)入口中。

今年初，文心助手月活突破2億，春節(jié)期間百度把紅包入口全部導(dǎo)向了百度App。這個(gè)策略說(shuō)明百度已經(jīng)放棄了做獨(dú)立AI App的打法，它要回到自己的主場(chǎng)，用AI重塑搜索。

在百度世界大會(huì)2025上，李彥宏透露，百度搜索首條結(jié)果的富媒體覆蓋率已達(dá)70%。用戶搜索一個(gè)問(wèn)題，AI直接給出結(jié)構(gòu)化的圖文答案，而不再是一排藍(lán)鏈接。這對(duì)用戶是好事，對(duì)廣告收入是壞事——因?yàn)辄c(diǎn)擊行為會(huì)大幅減少，廣告庫(kù)存跟著縮水。

這是一個(gè)商業(yè)悖論：用戶體驗(yàn)越好，變現(xiàn)越難。

文心5.1給出的答案，在它被著重強(qiáng)調(diào)的“搜索能力”里。它的“多源信息快速檢索、整合與生成能力”，理論上可以用來(lái)給出更豐富、更個(gè)性化的答案。而這些高質(zhì)量的信息整合結(jié)果，本身就可能成為新的廣告呈現(xiàn)方式——不是鏈接廣告，而是內(nèi)容嵌入式的信息推薦。

在這個(gè)邏輯下，AI搜索不是吃掉廣告收入，而是換一個(gè)方式重建廣告收入。能不能走通，取決于百度在5月13日Create大會(huì)上公布的商業(yè)化路徑，是否足夠清晰。

同時(shí)不能忽視的是百度在算力側(cè)的布局。旗下昆侖芯已向港交所提交上市申請(qǐng)，同時(shí)百度構(gòu)建的三萬(wàn)卡智算集群為大模型訓(xùn)練提供基礎(chǔ)支撐。在2026年國(guó)產(chǎn)芯片替代加速的語(yǔ)境下，“自研芯片+自研模型”這個(gè)組合的遠(yuǎn)期價(jià)值，可能比文心5.1本身更值得關(guān)注。

高盛在近期報(bào)告中指出，中國(guó)AI訓(xùn)練將越來(lái)越依賴高度優(yōu)化的計(jì)算效率架構(gòu)，而非單純堆算力規(guī)模。百度目前的路徑，通過(guò)軟硬協(xié)同優(yōu)化把訓(xùn)練成本壓縮到極致，與這個(gè)產(chǎn)業(yè)方向高度對(duì)齊。

文心5.1是一張技術(shù)底牌，在搜索能力、訓(xùn)練效率和Agent能力三個(gè)維度上都給出了可以量化的提升。它最硬的數(shù)字在于那“6%”，在算力貴過(guò)黃金的時(shí)代，效率本身就是壁壘。

但2026年的中國(guó)AI競(jìng)爭(zhēng)，早已過(guò)了“參數(shù)和跑分”定勝負(fù)的階段。商業(yè)化的壓力、用戶規(guī)模的爭(zhēng)奪、行業(yè)場(chǎng)景的滲透，構(gòu)成了一套遠(yuǎn)比Benchmark更復(fù)雜的評(píng)判體系。5億紅包打不出水花的尷尬，大模型上車的錯(cuò)失，搜索廣告失速帶來(lái)的利潤(rùn)真空——這些不是文心5.1憑技術(shù)數(shù)據(jù)能解決的。

5月13日Create大會(huì)，李彥宏將登場(chǎng)。屆時(shí)決定的可能不是“文心產(chǎn)品如何迭代”，而是百度在AI這條路上，到底準(zhǔn)備怎么把錢(qián)掙回來(lái)。在大廠集體進(jìn)入“算賬生存”模式的2026年，這個(gè)答案，也許才是市場(chǎng)最想聽(tīng)到的。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.