![]()
文/王慧瑩
編輯/子夜
進(jìn)入2026年,AI大模型的牌桌上玩家已經(jīng)不多。
當(dāng)市場(chǎng)仍在消化DeepSeek V4和阿里Qwen3.6的技術(shù)參數(shù)時(shí),騰訊交出了一份與以往截然不同的答卷——Hy3 preview。
如果只看參數(shù)和技術(shù)指標(biāo),很容易低估這個(gè)時(shí)間節(jié)點(diǎn)對(duì)騰訊的意義。Hy3 preview的定位,并非一次普通的模型迭代。它是混元在今年2月完成預(yù)訓(xùn)練和強(qiáng)化學(xué)習(xí)等底層基礎(chǔ)設(shè)施重建后的第一個(gè)模型,也是混元重建后訓(xùn)練的首個(gè)版本。
![]()
換句話說(shuō),這是騰訊在親手拆掉舊系統(tǒng)后,用一套全新的技術(shù)底座和研發(fā)邏輯重新訓(xùn)練出來(lái)的產(chǎn)品。重建、追趕、回歸,不到三個(gè)月的時(shí)間里,騰訊混元追回到了第一梯隊(duì)的牌桌上。
騰訊也在回應(yīng)一個(gè)核心命題:手握海量場(chǎng)景與億級(jí)用戶的互聯(lián)網(wǎng)巨頭,到底該如何打贏大模型的下半場(chǎng)。
1、重回牌桌,Hy3 preview追到哪兒了?
要理解Hy3 preview的進(jìn)步,必須先看清過(guò)去的混元有多被動(dòng)。
去年12月,智譜AI、月之暗面等頭部廠商,推出新一代基座模型,重新劃定了第一梯隊(duì)的準(zhǔn)入標(biāo)準(zhǔn),模型在真實(shí)場(chǎng)景中的可用性,更是取代了公開榜單分?jǐn)?shù),成為衡量模型價(jià)值的核心標(biāo)尺。
騰訊混元雖然也在迭代,但實(shí)際落地的場(chǎng)景遠(yuǎn)不及榜單的成績(jī),甚至騰訊體系內(nèi)的產(chǎn)品能力也很難被混元承接。
2月,混元團(tuán)隊(duì)完成了預(yù)訓(xùn)練與強(qiáng)化學(xué)習(xí)兩大核心基礎(chǔ)設(shè)施的全面重做。同期,騰訊完成組織架構(gòu)調(diào)整,撤銷成立十年的AI Lab,核心研發(fā)人員全員并入混元團(tuán)隊(duì)。
三個(gè)月后交出來(lái)的Hy3 preview,正在證明這條新路徑的可行性。
作為混元重建后的第一個(gè)模型,Hy3 preview定位語(yǔ)言模型,在復(fù)雜推理、指令遵循、上下文學(xué)習(xí)、代碼、智能體能力以及推理性能上均實(shí)現(xiàn)了大幅提升。
真正讓人眼前一亮的是代碼和智能體能力。在SWE-Bench基準(zhǔn)測(cè)試中,Hy3 preview取得了74.4%的準(zhǔn)確率。放在行業(yè)坐標(biāo)系里看,這個(gè)成績(jī)已接近智譜GLM-4.7。外界普遍認(rèn)為,Hy3 preview的代碼能力大致追到了智譜2025年12月的水平,相差約4個(gè)月。
![]()
圖源騰訊混元微信公眾號(hào)
在智能體維度,Hy3 preview在Terminal-Bench 2.0、BrowseComp、WideSearch等基準(zhǔn)測(cè)試中躋身行業(yè)第一梯隊(duì)。它還支持接入OpenClaw等主流開源智能體框架,在ClawEval和WildClawBench等評(píng)測(cè)中表現(xiàn)突出。
另一項(xiàng)容易被忽視的能力是上下文學(xué)習(xí)和指令遵循。Hy3 preview是一個(gè)快慢思考融合的混合專家模型,在雜亂冗長(zhǎng)上下文中理解和遵循復(fù)雜規(guī)則的測(cè)試中,Hy3 preview也表現(xiàn)出了不俗的能力。
連線Insight讓Hy3 preview幫忙查一下最近三個(gè)月AI公司模型推出的情況,對(duì)比5個(gè)不同背景的信源,列出已知事實(shí)和矛盾點(diǎn),給出信度評(píng)分。
五分鐘內(nèi),Hy3 preview不僅列出了表格,還總結(jié)出最近三個(gè)月AI模型發(fā)布呈現(xiàn) “智能體化、效率化、長(zhǎng)上下文”三大趨勢(shì),其中涵蓋信息交叉驗(yàn)證、多輪搜索等步驟。
整體來(lái)看,這些數(shù)據(jù)說(shuō)明了兩件事。第一,混元重建后的第一個(gè)模型,在核心指標(biāo)上已經(jīng)達(dá)到了可觀的基線。第二,也是最關(guān)鍵的,混元重建后已經(jīng)追趕上了第一梯隊(duì)。
![]()
坦率來(lái)講,如果把Hy3 preview放到行業(yè)語(yǔ)境里,它并不足以引發(fā)技術(shù)震撼。幾乎同時(shí),DeepSeek V4、阿里Qwen3.6-Max-Preview等競(jìng)品也在陸續(xù)登場(chǎng)或釋出消息。
但如果拉長(zhǎng)時(shí)間看,一個(gè)在2026年2月才完成底層基礎(chǔ)設(shè)施重建的團(tuán)隊(duì),1月底開訓(xùn),不到三個(gè)月發(fā)布,能追到2025年底第一梯隊(duì)的水平,這個(gè)速度本身就是對(duì)重建路徑的證明。
當(dāng)然,要清醒地看到,Hy3 preview追上的只是第一梯隊(duì)四個(gè)月前的水平。動(dòng)態(tài)競(jìng)爭(zhēng)之下,混元的真正考驗(yàn)不在于preview這一關(guān),而在于接下來(lái)的迭代速度能否持續(xù)壓縮這條差距曲線。
從這個(gè)意義上說(shuō),Hy3 preview的發(fā)布,是騰訊AI真正意義上的一次歸隊(duì)。它不是終點(diǎn),而是拿到了留在牌桌上的資格。
2、生態(tài)為王,騰訊“全家桶”接入
如果說(shuō)模型能力是重回牌桌的準(zhǔn)入門檻,那騰訊生態(tài)是Hy3 preview區(qū)別于行業(yè)所有競(jìng)品的核心差異化優(yōu)勢(shì),也是其能夠?qū)崿F(xiàn)快速落地、持續(xù)進(jìn)化的核心支撐。
目前,Hy3 preview已在元寶、ima、CodeBuddy、WorkBuddy、QQ、QQ瀏覽器、騰訊文檔、騰訊樂(lè)享、騰訊地圖、騰訊電子簽等產(chǎn)品首發(fā)上線,微信公眾號(hào)、和平精英、騰訊新聞、騰訊自選股、騰訊客服、微信讀書等多個(gè)主線產(chǎn)品也在陸續(xù)接入。
這意味著,混元的底座能力正在滲透到騰訊C端的核心場(chǎng)景中。
全生態(tài)接入絕非簡(jiǎn)單的模型能力堆砌,而是針對(duì)不同產(chǎn)品的核心場(chǎng)景完成深度Co-Design協(xié)同設(shè)計(jì),讓Hy3 preview的能力與產(chǎn)品場(chǎng)景實(shí)現(xiàn)了深度融合,真正實(shí)現(xiàn)了體驗(yàn)重構(gòu)。
事實(shí)上,重構(gòu)最大的變化,不在于產(chǎn)品接入Hy3 preview的速度,而在于思路的改變。過(guò)去兩年,混元做模型的邏輯是線性的,即先訓(xùn)練一個(gè)通用模型,再拿給各產(chǎn)品線做適配。這次重構(gòu)之后,模型與產(chǎn)品不是先后關(guān)系,而是協(xié)同關(guān)系,混元從模型訓(xùn)練開始就將“有用”貫穿始終。
要理解這個(gè)變化有多根本,元寶莫過(guò)于最具C端感知的。接入Hy3 preview后,元寶在寫作、閑聊、搜索三大場(chǎng)景的體驗(yàn)提升,連線Insight最直觀的感受是元寶更像一個(gè)能聽懂話的員工,活人感很足。
連線Insight模擬了一個(gè)工作場(chǎng)景,“下周要出差見一個(gè)消費(fèi)零售的客戶,客戶讓我在周一中午前準(zhǔn)備好問(wèn)題,同時(shí)我們要現(xiàn)場(chǎng)走訪做交流,我現(xiàn)在需要根據(jù)客戶資料寫一份訪談問(wèn)題,同時(shí)還要想好現(xiàn)場(chǎng)交流的側(cè)重點(diǎn),我該怎么安排。”
表面上是訪談問(wèn)題構(gòu)思,實(shí)際上考驗(yàn)的是元寶對(duì)拆分任務(wù)、理解需求、上下文部署的能力。接入Hy3 preview的元寶,并非給出一大長(zhǎng)串的內(nèi)容,而是將需求落到訪談問(wèn)題、基地交流、時(shí)間安排等具體的環(huán)節(jié)中,還給出了需要避坑的建議。
這并非元寶突然變聰明了,而是混元模型團(tuán)隊(duì)與元寶產(chǎn)品團(tuán)隊(duì)聯(lián)合優(yōu)化的結(jié)果。Hy3 preview從測(cè)試到落地,模型團(tuán)隊(duì)和產(chǎn)品團(tuán)隊(duì)是聯(lián)動(dòng)的,雙方合作,根據(jù)用戶的需求,在各自擅長(zhǎng)的方向上調(diào)整、優(yōu)化,反復(fù)將混元打磨到能用變成好用,這在混元內(nèi)部被叫作Co-design(深度協(xié)同)。
將這個(gè)邏輯從元寶延伸到整個(gè)騰訊產(chǎn)品矩陣,尤其是今年爆火的代碼與智能體,Hy3 preview也展現(xiàn)出不俗的協(xié)同和主動(dòng)思考能力。
在WorkBuddy中,模型學(xué)會(huì)了“調(diào)查記者式”的主動(dòng)規(guī)劃。面對(duì)“庫(kù)克加入小米”這樣的模糊指令,它能自主發(fā)起六輪工具調(diào)用,對(duì)信源的權(quán)威層級(jí)做出內(nèi)在判斷,用多方信源對(duì)比表逐層解構(gòu)傳聞。
此外,CodeBuddy首Token延遲降低54%,任務(wù)執(zhí)行成功率穩(wěn)定在99.99%以上;ima的長(zhǎng)文理解能力更強(qiáng),實(shí)現(xiàn)從深度理解到邏輯歸納再到結(jié)構(gòu)化PPT生成的完整自動(dòng)化鏈路,用戶只需一句自然語(yǔ)言提問(wèn),就能完成跨章節(jié)信息提取、數(shù)據(jù)交叉驗(yàn)證、項(xiàng)目可行性分析。
這也意味著,騰訊的整個(gè)AI生態(tài)呈現(xiàn)出同一個(gè)底座支持,不同產(chǎn)品不同長(zhǎng)板的優(yōu)勢(shì)。
值得注意的是,得益于模型和推理框架上的深度協(xié)同,以及在推理框架、算子性能、量化算法等優(yōu)化,Hy3 preview整體推理效率提升40%,推理成本相比上一代模型大幅下降。
在騰訊云大模型服務(wù)平臺(tái)TokenHub上,Hy3 preview輸入價(jià)格最低1.2元/百萬(wàn)tokens,輸入命中緩存價(jià)格0.4元/百萬(wàn)tokens,輸出價(jià)格最低4元/百萬(wàn)tokens。
![]()
圖源騰訊混元微信公眾號(hào)
本質(zhì)上,Hy3 preview邁出了騰訊混元追趕的第一步。騰訊全場(chǎng)景的真實(shí)用戶需求,為Hy3 preview的研發(fā)提供了優(yōu)化方向;而海量場(chǎng)景產(chǎn)生的真實(shí)交互數(shù)據(jù),又能持續(xù)反哺模型的能力迭代,讓模型在真實(shí)使用中不斷進(jìn)化。
3、騰訊AI,要統(tǒng)一作戰(zhàn)
把這些變化串起來(lái)看,一個(gè)更深層的戰(zhàn)略圖景浮現(xiàn)出來(lái):騰訊AI的競(jìng)爭(zhēng)邏輯變了。
過(guò)去兩年,中國(guó)AI行業(yè)的競(jìng)爭(zhēng)規(guī)則是明確的,誰(shuí)在通用跑分榜上分?jǐn)?shù)高,誰(shuí)就能獲得更多的資本關(guān)注和市場(chǎng)聲量。混元也跟著這條規(guī)則跑了很久,結(jié)果被馬化騰批評(píng)“太慢了”,上一輪游戲規(guī)則里,騰訊優(yōu)勢(shì)不明顯。
Hy3 preview的真正價(jià)值,在于把競(jìng)爭(zhēng)從別人制定的規(guī)則拉回到了自己的主場(chǎng)。
當(dāng)一個(gè)模型的能力是由真實(shí)用戶的需求和真實(shí)場(chǎng)景反向打磨出來(lái)的,那這個(gè)模型的競(jìng)爭(zhēng)力就不再取決于它在第三方評(píng)測(cè)中的排名,而是取決于它在騰訊生態(tài)內(nèi)部的正向循環(huán)深度。
這是一個(gè)更高級(jí)的壁壘。純模型公司可以在跑分上無(wú)限逼近甚至超越GPT,但它們永遠(yuǎn)無(wú)法獲得13億微信用戶、8億QQ用戶的真實(shí)使用反饋。這些數(shù)據(jù)就像磨刀石,磨得越久,刀越鋒利。
這背后,是騰訊AI組織長(zhǎng)達(dá)一年的重構(gòu)。
![]()
2025年4月,騰訊對(duì)混元大模型研發(fā)體系進(jìn)行重構(gòu),將技術(shù)部門拆分為大語(yǔ)言模型部和多模態(tài)模型部,確立了算法研發(fā)的雙軌制;同年12月,騰訊新成立AI Infra部、AI Data部、數(shù)據(jù)計(jì)算平臺(tái)部。前者負(fù)責(zé)大模型分布式訓(xùn)練與高性能推理服務(wù),后者負(fù)責(zé)數(shù)據(jù)與評(píng)測(cè)體系建設(shè),數(shù)據(jù)計(jì)算平臺(tái)部負(fù)責(zé)數(shù)據(jù)智能融合平臺(tái)建設(shè)。
這是一個(gè)清晰的信號(hào),騰訊不再只拼算法,而是開始從算力、數(shù)據(jù)、工程三條基線上同時(shí)發(fā)力。
這期間,混元關(guān)鍵人物姚順雨擔(dān)任CEO/總裁辦公室首席 AI 科學(xué)家,同時(shí)兼任全新設(shè)立的AI Infra 部、大語(yǔ)言模型部雙部門負(fù)責(zé)人,實(shí)行雙線匯報(bào),直接向騰訊總裁劉熾平、TEG 技術(shù)工程事業(yè)群負(fù)責(zé)人盧山匯報(bào)。
將模型研發(fā)與基礎(chǔ)設(shè)施統(tǒng)一到一個(gè)負(fù)責(zé)人手中、AI Lab的撤銷,騰訊逐步將散落在各處的AI力量集中收攏,圍繞混元大模型構(gòu)建單一主線的研發(fā)體系。
3月份的財(cái)報(bào)會(huì)上,劉熾平直言,“過(guò)去幾個(gè)月,騰訊密集進(jìn)行了整個(gè)團(tuán)隊(duì)的升級(jí)和工作流程的重構(gòu)”,目的就是讓“團(tuán)隊(duì)更健壯、組織方式更合理”。
如今,88天的極限沖刺完成后,混元團(tuán)隊(duì)面臨的考驗(yàn)才剛剛開始,更大的考驗(yàn)來(lái)Hy3正式版和后續(xù)的迭代中。
姚順雨對(duì)此的表述很克制,“Hy3 preview是混元大模型重建的第一步。我們希望通過(guò)這次開源和發(fā)布,獲得來(lái)自開源社區(qū)和用戶的真實(shí)反饋,幫助我們提升Hy3正式版的實(shí)用性。”
大模型行業(yè)的追趕本身不是線性競(jìng)賽,第一梯隊(duì)也在加速。DeepSeek、字節(jié)、阿里等對(duì)手不會(huì)停下來(lái)等騰訊,重建后的研發(fā)體系能否保持甚至加速這個(gè)迭代節(jié)奏,將在接下來(lái)2-3個(gè)版本中得到更真實(shí)的檢驗(yàn)。市場(chǎng)對(duì)混元3.0正式版的期待已被拉高,騰訊此前也透露混元3.0計(jì)劃于4月陸續(xù)向外開放,preview之后的正式版不能讓市場(chǎng)等太久。
![]()
圖源騰訊官網(wǎng)
更關(guān)鍵的挑戰(zhàn)來(lái)自生態(tài)價(jià)值的商業(yè)兌現(xiàn)。目前,接入混元全家桶是能力滲透,而不是商業(yè)模式,To C的付費(fèi)、To B的API輸出、云服務(wù)打包銷售等商業(yè)化仍在探索中。
2025年全年,騰訊云已實(shí)現(xiàn)全年規(guī)模化盈利,AI相關(guān)服務(wù)需求驅(qū)動(dòng)企業(yè)服務(wù)收入同比增長(zhǎng)接近20%。但混元想要拉動(dòng)利潤(rùn),還需要更清晰的商業(yè)設(shè)計(jì)。
此外,Co-Design模式大范圍的推廣也是挑戰(zhàn)。騰訊生態(tài)擁有數(shù)十款核心產(chǎn)品,如何將這種場(chǎng)景反向訓(xùn)練模型的機(jī)制從元寶和WorkBuddy擴(kuò)展到更廣泛的產(chǎn)品矩陣,并在組織層面確保每個(gè)產(chǎn)品團(tuán)隊(duì)都具備與模型團(tuán)隊(duì)深度Co-Design的能力和意愿,是一個(gè)遠(yuǎn)比發(fā)一個(gè)模型版本更復(fù)雜的系統(tǒng)工程。
正如馬化騰所說(shuō),騰訊的風(fēng)格就是穩(wěn)扎穩(wěn)打,Hy3 preview是跑起來(lái)的第一步,而騰訊AI下半場(chǎng)的真正考驗(yàn),在于接下來(lái)跑得遠(yuǎn)不遠(yuǎn)、穩(wěn)不穩(wěn)。
(本文頭圖來(lái)源于騰訊混元微信公眾號(hào)。)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.