![]()
新眸原創(chuàng)·作者 | 李小東
百度選在2026年Create大會(huì)開(kāi)幕前四天,端出了文心大模型5.1。
這個(gè)時(shí)間點(diǎn)的選擇不算意外。5月13日的開(kāi)發(fā)者大會(huì)需要一張技術(shù)底牌,而距離上一個(gè)版本發(fā)布已過(guò)去近半年,市場(chǎng)上關(guān)于“百度大模型掉隊(duì)”的聲音正在變響。
這個(gè)時(shí)候推出的文心5.1,需要用數(shù)據(jù)來(lái)回?fù)暨@些質(zhì)疑,而它也的確拿出了幾張夠硬的牌:搜索榜國(guó)內(nèi)第一,預(yù)訓(xùn)練成本僅為業(yè)界同規(guī)模模型的6%,Agent能力超越DeepSeek-V4-Pro。
但回看百度過(guò)去一年的AI軌跡,一個(gè)問(wèn)題很難回避:技術(shù)上的領(lǐng)先,似乎并沒(méi)完全轉(zhuǎn)化為市場(chǎng)端的領(lǐng)先?文心5.1給出的答案,分量又有多重呢?
01
三組數(shù)據(jù)
和解一樁“舊案”
先看文心5.1到底亮出了什么。
根據(jù)LMArena大模型競(jìng)技場(chǎng)最新排名,文心5.1以1223分位列搜索榜國(guó)內(nèi)第一、全球第四,是該榜單中唯一上榜的國(guó)產(chǎn)大模型。它的Preview版本早在4月30日就以1476分登頂文本榜國(guó)內(nèi)第一,超越GPT-5.5和DeepSeek-V4-Pro,是前十五名中唯一入圍的國(guó)產(chǎn)模型。
![]()
對(duì)于一家從2023年起就被反復(fù)質(zhì)疑“大模型沒(méi)聲音了”的公司來(lái)說(shuō),這兩項(xiàng)成績(jī)是某種意義上的“解案”,至少?gòu)陌駟尉S度看,百度的模型能力沒(méi)有掉隊(duì)。
不過(guò)值得討論的,的確不是分?jǐn)?shù),而是分?jǐn)?shù)背后的技術(shù)路徑選擇。
文心5.1的核心技術(shù)叫“多維彈性預(yù)訓(xùn)練”。這個(gè)提法最早在文心5.0發(fā)布時(shí)出現(xiàn),它的邏輯是:在一次預(yù)訓(xùn)練過(guò)程中,通過(guò)動(dòng)態(tài)采樣機(jī)制同時(shí)優(yōu)化大量不同深度、專家容量和稀疏度的子模型,最終構(gòu)建一個(gè)覆蓋不同參數(shù)規(guī)模和計(jì)算預(yù)算的子模型矩陣。
翻譯成白話就是,一次訓(xùn)練,生成多種型號(hào),不再需要為每種規(guī)模單獨(dú)燒一次算力。按照研發(fā)人員的表述,這套框架分別沿彈性深度、彈性專家容量和彈性稀疏度三個(gè)維度做壓縮與擴(kuò)展,通過(guò)可變Top-k路由靈活調(diào)配激活專家數(shù)量,在推理開(kāi)銷和模型性能之間建立可控的調(diào)節(jié)空間。
落到具體數(shù)字上:文心5.1的總參數(shù)被壓縮到文心5.0的約三分之一,激活參數(shù)壓縮到約二分之一,預(yù)訓(xùn)練計(jì)算成本僅為同規(guī)模同類模型的6%。
6%這個(gè)數(shù)字很容易被誤讀。它不是說(shuō)“用6%的錢(qián)做出了100%的性能”,而是說(shuō),在同等參數(shù)量級(jí)和性能水平下,訓(xùn)練階段消耗的算力只用了行業(yè)慣常的6%。這是通過(guò)“模型壓縮和彈性訓(xùn)練大幅降低冗余計(jì)算”來(lái)達(dá)成的,是一種預(yù)訓(xùn)練環(huán)節(jié)的效率提升。
在2026年全球數(shù)據(jù)中心能耗爭(zhēng)議持續(xù)升級(jí)、國(guó)產(chǎn)芯片供給尚不寬裕的背景下,這個(gè)方向的選擇,說(shuō)服力不弱。
再看評(píng)測(cè)數(shù)據(jù)。在τ3-bench和SpreadsheetBench-Verified兩項(xiàng)智能體評(píng)測(cè)任務(wù)中,文心5.1超越了DeepSeek-V4-Pro,官方給出的描述是“智能體能力已接近領(lǐng)先閉源模型的水平”。創(chuàng)意寫(xiě)作方面則與Gemini 3.1 Pro持平,在AIME26數(shù)學(xué)競(jìng)賽(使用工具)上拿到99.6分,僅次于Gemini 3.1 Pro。
![]()
這些數(shù)據(jù)大多是百度內(nèi)部評(píng)測(cè)或較小的基準(zhǔn)測(cè)試,并不是LMArena那種大規(guī)模盲測(cè)榜單,穩(wěn)健性還需更多第三方驗(yàn)證,但整體方向是清晰的:這代模型的升級(jí)空間主要在Agent和深度搜索能力上,而非純粹的語(yǔ)言表達(dá)。
目前,文心5.1已在千帆模型廣場(chǎng)和文心一言官網(wǎng)上線,開(kāi)發(fā)者可以通過(guò)千帆平臺(tái)調(diào)用API。百度還宣布將文心5.1陸續(xù)接入ISEKAI ZERO、Mulan AI、諦聽(tīng)幻流、Storymaster等超過(guò)十個(gè)創(chuàng)意生產(chǎn)智能體平臺(tái)。
這個(gè)動(dòng)作的意圖明顯,不是只談模型,而是談模型落地。
放在整個(gè)行業(yè),文心5.1在產(chǎn)品端的節(jié)奏不算慢。但真正讓百度頭疼的,一直都不是技術(shù)。
02
百度選了一條不同的路
如果單純比打分,文心5.1并不弱勢(shì)。但2026年的AI市場(chǎng),尤其在中國(guó),產(chǎn)品競(jìng)爭(zhēng),相比看分?jǐn)?shù),大家更在乎的是誰(shuí)的用戶多、場(chǎng)景多。
2026年春節(jié),四家大廠在AI領(lǐng)域的總營(yíng)銷投入接近50億元。百度搶先開(kāi)局,拿出5億現(xiàn)金紅包,把入口全部放在百度App生態(tài)內(nèi)。字節(jié)豆包投入15億到20億,騰訊元寶10億,阿里千問(wèn)出手最重,60億。
根據(jù)QuestMobile的數(shù)據(jù),春節(jié)前后字節(jié)豆包以8400萬(wàn)日活開(kāi)局,除夕當(dāng)天沖到1.45億峰值;阿里千問(wèn)活動(dòng)次日日活達(dá)到7352萬(wàn);騰訊元寶除夕4054萬(wàn)。而百度文心的用戶增長(zhǎng)曲線動(dòng)靜平平。
外界感知到的是,百度在C端用戶的爭(zhēng)奪中正在被甩開(kāi),雖然模型能力不斷迭代,但公眾感知嚴(yán)重滯后。這是中國(guó)AI產(chǎn)業(yè)一個(gè)特有的悖論,技術(shù)團(tuán)隊(duì)不斷優(yōu)化訓(xùn)練效率,但用戶只關(guān)心“這玩意兒能不能幫我訂機(jī)票”。兩個(gè)坐標(biāo)系互相不認(rèn)識(shí)。
如果要說(shuō)一個(gè)更大的行業(yè)敘事,2026年上半年的關(guān)鍵詞,正在從“軍備競(jìng)賽”切換到“商業(yè)化”。
前不久,字節(jié)豆包啟動(dòng)收費(fèi)模式,最低檔68元/月,最高5088元/年,評(píng)論區(qū)被“又笨又收費(fèi)”的罵聲淹沒(méi)。但不要搞錯(cuò),這是全行業(yè)的拐點(diǎn)。上個(gè)月,阿里云、騰訊云、百度智能云和智譜同步漲價(jià),部分漲幅高達(dá)463%。
在C端用戶還在習(xí)慣“免費(fèi)AI”幻象的時(shí)候,大廠們已經(jīng)開(kāi)始算現(xiàn)實(shí)的成本:API調(diào)用量每漲一波,模型的推理成本就跟著翻番。
百度實(shí)際上比大多數(shù)同行更早感受到了這種壓力的峰值。2025年Q3,百度核心在線營(yíng)銷收入153億元,同比下降18%,和2023年Q2的峰值197億元相比,跌去了超過(guò)五分之一。這個(gè)縮水不是周期性的,而是結(jié)構(gòu)性的——用戶不再愿意從一頁(yè)鏈接里自己找答案,AI直接給答案才是新習(xí)慣。對(duì)用戶體驗(yàn)來(lái)說(shuō)是好事,但對(duì)搜索廣告這個(gè)百度最大的利潤(rùn)支柱來(lái)說(shuō),基礎(chǔ)開(kāi)始松動(dòng)。
李彥宏的選擇是押注AI轉(zhuǎn)型。到2025年Q4,百度AI新業(yè)務(wù)收入達(dá)到113億元,占核心非在線營(yíng)銷收入的43%。AI云收入在Q3同比增長(zhǎng)33%,AI原生營(yíng)銷服務(wù)收入同比激增262%。一減一增之間,百度的業(yè)務(wù)結(jié)構(gòu)確實(shí)在變。
回到文心5.1,如果放在這個(gè)商業(yè)化視角下重新審視,它傳遞的信號(hào)不只是“比分高”,看點(diǎn)在于,“訓(xùn)練成本是行業(yè)6%”。在API價(jià)格集體走高的2026年,訓(xùn)練成本優(yōu)勢(shì)就是云服務(wù)的定價(jià)權(quán)和利潤(rùn)空間。
百度在AI云的競(jìng)爭(zhēng)力,取決于能否把文心大模型的效率優(yōu)勢(shì)轉(zhuǎn)化為持續(xù)性收入增長(zhǎng)。這個(gè)命題,比在Benchmark榜單上拿一個(gè)第一要難得多。
03
文心5.1的價(jià)值
或許在百度App里
那么,文心5.1的真正價(jià)值在哪里?
如果只是將它當(dāng)作一個(gè)API調(diào)用的標(biāo)準(zhǔn)模型,技術(shù)數(shù)據(jù)上它確實(shí)有說(shuō)服力。但對(duì)于百度來(lái)說(shuō),需要思考的是,如何把它嵌入到百度App這個(gè)月活超2億的超級(jí)入口中。
今年初,文心助手月活突破2億,春節(jié)期間百度把紅包入口全部導(dǎo)向了百度App。這個(gè)策略說(shuō)明百度已經(jīng)放棄了做獨(dú)立AI App的打法,它要回到自己的主場(chǎng),用AI重塑搜索。
在百度世界大會(huì)2025上,李彥宏透露,百度搜索首條結(jié)果的富媒體覆蓋率已達(dá)70%。用戶搜索一個(gè)問(wèn)題,AI直接給出結(jié)構(gòu)化的圖文答案,而不再是一排藍(lán)鏈接。這對(duì)用戶是好事,對(duì)廣告收入是壞事——因?yàn)辄c(diǎn)擊行為會(huì)大幅減少,廣告庫(kù)存跟著縮水。
這是一個(gè)商業(yè)悖論:用戶體驗(yàn)越好,變現(xiàn)越難。
文心5.1給出的答案,在它被著重強(qiáng)調(diào)的“搜索能力”里。它的“多源信息快速檢索、整合與生成能力”,理論上可以用來(lái)給出更豐富、更個(gè)性化的答案。而這些高質(zhì)量的信息整合結(jié)果,本身就可能成為新的廣告呈現(xiàn)方式——不是鏈接廣告,而是內(nèi)容嵌入式的信息推薦。
在這個(gè)邏輯下,AI搜索不是吃掉廣告收入,而是換一個(gè)方式重建廣告收入。能不能走通,取決于百度在5月13日Create大會(huì)上公布的商業(yè)化路徑,是否足夠清晰。
同時(shí)不能忽視的是百度在算力側(cè)的布局。旗下昆侖芯已向港交所提交上市申請(qǐng),同時(shí)百度構(gòu)建的三萬(wàn)卡智算集群為大模型訓(xùn)練提供基礎(chǔ)支撐。在2026年國(guó)產(chǎn)芯片替代加速的語(yǔ)境下,“自研芯片+自研模型”這個(gè)組合的遠(yuǎn)期價(jià)值,可能比文心5.1本身更值得關(guān)注。
高盛在近期報(bào)告中指出,中國(guó)AI訓(xùn)練將越來(lái)越依賴高度優(yōu)化的計(jì)算效率架構(gòu),而非單純堆算力規(guī)模。百度目前的路徑,通過(guò)軟硬協(xié)同優(yōu)化把訓(xùn)練成本壓縮到極致,與這個(gè)產(chǎn)業(yè)方向高度對(duì)齊。
文心5.1是一張技術(shù)底牌,在搜索能力、訓(xùn)練效率和Agent能力三個(gè)維度上都給出了可以量化的提升。它最硬的數(shù)字在于那“6%”,在算力貴過(guò)黃金的時(shí)代,效率本身就是壁壘。
但2026年的中國(guó)AI競(jìng)爭(zhēng),早已過(guò)了“參數(shù)和跑分”定勝負(fù)的階段。商業(yè)化的壓力、用戶規(guī)模的爭(zhēng)奪、行業(yè)場(chǎng)景的滲透,構(gòu)成了一套遠(yuǎn)比Benchmark更復(fù)雜的評(píng)判體系。5億紅包打不出水花的尷尬,大模型上車的錯(cuò)失,搜索廣告失速帶來(lái)的利潤(rùn)真空——這些不是文心5.1憑技術(shù)數(shù)據(jù)能解決的。
5月13日Create大會(huì),李彥宏將登場(chǎng)。屆時(shí)決定的可能不是“文心產(chǎn)品如何迭代”,而是百度在AI這條路上,到底準(zhǔn)備怎么把錢(qián)掙回來(lái)。在大廠集體進(jìn)入“算賬生存”模式的2026年,這個(gè)答案,也許才是市場(chǎng)最想聽(tīng)到的。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.