網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

騰訊混元重生，推倒重建、奮力追趕的一場(chǎng)賽跑

2026-05-08 20:01:57　來(lái)源: 連線Insight

上海舉報(bào)

分享至

文/王慧瑩

編輯/子夜

進(jìn)入2026年，AI大模型的牌桌上玩家已經(jīng)不多。

當(dāng)市場(chǎng)仍在消化DeepSeek V4和阿里Qwen3.6的技術(shù)參數(shù)時(shí)，騰訊交出了一份與以往截然不同的答卷——Hy3 preview。

如果只看參數(shù)和技術(shù)指標(biāo)，很容易低估這個(gè)時(shí)間節(jié)點(diǎn)對(duì)騰訊的意義。Hy3 preview的定位，并非一次普通的模型迭代。它是混元在今年2月完成預(yù)訓(xùn)練和強(qiáng)化學(xué)習(xí)等底層基礎(chǔ)設(shè)施重建后的第一個(gè)模型，也是混元重建后訓(xùn)練的首個(gè)版本。

換句話說(shuō)，這是騰訊在親手拆掉舊系統(tǒng)后，用一套全新的技術(shù)底座和研發(fā)邏輯重新訓(xùn)練出來(lái)的產(chǎn)品。重建、追趕、回歸，不到三個(gè)月的時(shí)間里，騰訊混元追回到了第一梯隊(duì)的牌桌上。

騰訊也在回應(yīng)一個(gè)核心命題：手握海量場(chǎng)景與億級(jí)用戶的互聯(lián)網(wǎng)巨頭，到底該如何打贏大模型的下半場(chǎng)。

1、重回牌桌，Hy3 preview追到哪兒了？

要理解Hy3 preview的進(jìn)步，必須先看清過(guò)去的混元有多被動(dòng)。

去年12月，智譜AI、月之暗面等頭部廠商，推出新一代基座模型，重新劃定了第一梯隊(duì)的準(zhǔn)入標(biāo)準(zhǔn)，模型在真實(shí)場(chǎng)景中的可用性，更是取代了公開榜單分?jǐn)?shù)，成為衡量模型價(jià)值的核心標(biāo)尺。

騰訊混元雖然也在迭代，但實(shí)際落地的場(chǎng)景遠(yuǎn)不及榜單的成績(jī)，甚至騰訊體系內(nèi)的產(chǎn)品能力也很難被混元承接。

2月，混元團(tuán)隊(duì)完成了預(yù)訓(xùn)練與強(qiáng)化學(xué)習(xí)兩大核心基礎(chǔ)設(shè)施的全面重做。同期，騰訊完成組織架構(gòu)調(diào)整，撤銷成立十年的AI Lab，核心研發(fā)人員全員并入混元團(tuán)隊(duì)。

三個(gè)月后交出來(lái)的Hy3 preview，正在證明這條新路徑的可行性。

作為混元重建后的第一個(gè)模型，Hy3 preview定位語(yǔ)言模型，在復(fù)雜推理、指令遵循、上下文學(xué)習(xí)、代碼、智能體能力以及推理性能上均實(shí)現(xiàn)了大幅提升。

真正讓人眼前一亮的是代碼和智能體能力。在SWE-Bench基準(zhǔn)測(cè)試中，Hy3 preview取得了74.4%的準(zhǔn)確率。放在行業(yè)坐標(biāo)系里看，這個(gè)成績(jī)已接近智譜GLM-4.7。外界普遍認(rèn)為，Hy3 preview的代碼能力大致追到了智譜2025年12月的水平，相差約4個(gè)月。

圖源騰訊混元微信公眾號(hào)

在智能體維度，Hy3 preview在Terminal-Bench 2.0、BrowseComp、WideSearch等基準(zhǔn)測(cè)試中躋身行業(yè)第一梯隊(duì)。它還支持接入OpenClaw等主流開源智能體框架，在ClawEval和WildClawBench等評(píng)測(cè)中表現(xiàn)突出。

另一項(xiàng)容易被忽視的能力是上下文學(xué)習(xí)和指令遵循。Hy3 preview是一個(gè)快慢思考融合的混合專家模型，在雜亂冗長(zhǎng)上下文中理解和遵循復(fù)雜規(guī)則的測(cè)試中，Hy3 preview也表現(xiàn)出了不俗的能力。

連線Insight讓Hy3 preview幫忙查一下最近三個(gè)月AI公司模型推出的情況，對(duì)比5個(gè)不同背景的信源，列出已知事實(shí)和矛盾點(diǎn)，給出信度評(píng)分。

五分鐘內(nèi)，Hy3 preview不僅列出了表格，還總結(jié)出最近三個(gè)月AI模型發(fā)布呈現(xiàn) “智能體化、效率化、長(zhǎng)上下文”三大趨勢(shì)，其中涵蓋信息交叉驗(yàn)證、多輪搜索等步驟。

整體來(lái)看，這些數(shù)據(jù)說(shuō)明了兩件事。第一，混元重建后的第一個(gè)模型，在核心指標(biāo)上已經(jīng)達(dá)到了可觀的基線。第二，也是最關(guān)鍵的，混元重建后已經(jīng)追趕上了第一梯隊(duì)。

坦率來(lái)講，如果把Hy3 preview放到行業(yè)語(yǔ)境里，它并不足以引發(fā)技術(shù)震撼。幾乎同時(shí)，DeepSeek V4、阿里Qwen3.6-Max-Preview等競(jìng)品也在陸續(xù)登場(chǎng)或釋出消息。

但如果拉長(zhǎng)時(shí)間看，一個(gè)在2026年2月才完成底層基礎(chǔ)設(shè)施重建的團(tuán)隊(duì)，1月底開訓(xùn)，不到三個(gè)月發(fā)布，能追到2025年底第一梯隊(duì)的水平，這個(gè)速度本身就是對(duì)重建路徑的證明。

當(dāng)然，要清醒地看到，Hy3 preview追上的只是第一梯隊(duì)四個(gè)月前的水平。動(dòng)態(tài)競(jìng)爭(zhēng)之下，混元的真正考驗(yàn)不在于preview這一關(guān)，而在于接下來(lái)的迭代速度能否持續(xù)壓縮這條差距曲線。

從這個(gè)意義上說(shuō)，Hy3 preview的發(fā)布，是騰訊AI真正意義上的一次歸隊(duì)。它不是終點(diǎn)，而是拿到了留在牌桌上的資格。

2、生態(tài)為王，騰訊“全家桶”接入

如果說(shuō)模型能力是重回牌桌的準(zhǔn)入門檻，那騰訊生態(tài)是Hy3 preview區(qū)別于行業(yè)所有競(jìng)品的核心差異化優(yōu)勢(shì)，也是其能夠?qū)崿F(xiàn)快速落地、持續(xù)進(jìn)化的核心支撐。

目前，Hy3 preview已在元寶、ima、CodeBuddy、WorkBuddy、QQ、QQ瀏覽器、騰訊文檔、騰訊樂(lè)享、騰訊地圖、騰訊電子簽等產(chǎn)品首發(fā)上線，微信公眾號(hào)、和平精英、騰訊新聞、騰訊自選股、騰訊客服、微信讀書等多個(gè)主線產(chǎn)品也在陸續(xù)接入。

這意味著，混元的底座能力正在滲透到騰訊C端的核心場(chǎng)景中。

全生態(tài)接入絕非簡(jiǎn)單的模型能力堆砌，而是針對(duì)不同產(chǎn)品的核心場(chǎng)景完成深度Co-Design協(xié)同設(shè)計(jì)，讓Hy3 preview的能力與產(chǎn)品場(chǎng)景實(shí)現(xiàn)了深度融合，真正實(shí)現(xiàn)了體驗(yàn)重構(gòu)。

事實(shí)上，重構(gòu)最大的變化，不在于產(chǎn)品接入Hy3 preview的速度，而在于思路的改變。過(guò)去兩年，混元做模型的邏輯是線性的，即先訓(xùn)練一個(gè)通用模型，再拿給各產(chǎn)品線做適配。這次重構(gòu)之后，模型與產(chǎn)品不是先后關(guān)系，而是協(xié)同關(guān)系，混元從模型訓(xùn)練開始就將“有用”貫穿始終。

要理解這個(gè)變化有多根本，元寶莫過(guò)于最具C端感知的。接入Hy3 preview后，元寶在寫作、閑聊、搜索三大場(chǎng)景的體驗(yàn)提升，連線Insight最直觀的感受是元寶更像一個(gè)能聽懂話的員工，活人感很足。

連線Insight模擬了一個(gè)工作場(chǎng)景，“下周要出差見一個(gè)消費(fèi)零售的客戶，客戶讓我在周一中午前準(zhǔn)備好問(wèn)題，同時(shí)我們要現(xiàn)場(chǎng)走訪做交流，我現(xiàn)在需要根據(jù)客戶資料寫一份訪談問(wèn)題，同時(shí)還要想好現(xiàn)場(chǎng)交流的側(cè)重點(diǎn)，我該怎么安排。”

表面上是訪談問(wèn)題構(gòu)思，實(shí)際上考驗(yàn)的是元寶對(duì)拆分任務(wù)、理解需求、上下文部署的能力。接入Hy3 preview的元寶，并非給出一大長(zhǎng)串的內(nèi)容，而是將需求落到訪談問(wèn)題、基地交流、時(shí)間安排等具體的環(huán)節(jié)中，還給出了需要避坑的建議。

這并非元寶突然變聰明了，而是混元模型團(tuán)隊(duì)與元寶產(chǎn)品團(tuán)隊(duì)聯(lián)合優(yōu)化的結(jié)果。Hy3 preview從測(cè)試到落地，模型團(tuán)隊(duì)和產(chǎn)品團(tuán)隊(duì)是聯(lián)動(dòng)的，雙方合作，根據(jù)用戶的需求，在各自擅長(zhǎng)的方向上調(diào)整、優(yōu)化，反復(fù)將混元打磨到能用變成好用，這在混元內(nèi)部被叫作Co-design（深度協(xié)同）。

將這個(gè)邏輯從元寶延伸到整個(gè)騰訊產(chǎn)品矩陣，尤其是今年爆火的代碼與智能體，Hy3 preview也展現(xiàn)出不俗的協(xié)同和主動(dòng)思考能力。

在WorkBuddy中，模型學(xué)會(huì)了“調(diào)查記者式”的主動(dòng)規(guī)劃。面對(duì)“庫(kù)克加入小米”這樣的模糊指令，它能自主發(fā)起六輪工具調(diào)用，對(duì)信源的權(quán)威層級(jí)做出內(nèi)在判斷，用多方信源對(duì)比表逐層解構(gòu)傳聞。

此外，CodeBuddy首Token延遲降低54%，任務(wù)執(zhí)行成功率穩(wěn)定在99.99%以上；ima的長(zhǎng)文理解能力更強(qiáng)，實(shí)現(xiàn)從深度理解到邏輯歸納再到結(jié)構(gòu)化PPT生成的完整自動(dòng)化鏈路，用戶只需一句自然語(yǔ)言提問(wèn)，就能完成跨章節(jié)信息提取、數(shù)據(jù)交叉驗(yàn)證、項(xiàng)目可行性分析。

這也意味著，騰訊的整個(gè)AI生態(tài)呈現(xiàn)出同一個(gè)底座支持，不同產(chǎn)品不同長(zhǎng)板的優(yōu)勢(shì)。

值得注意的是，得益于模型和推理框架上的深度協(xié)同，以及在推理框架、算子性能、量化算法等優(yōu)化，Hy3 preview整體推理效率提升40%，推理成本相比上一代模型大幅下降。

在騰訊云大模型服務(wù)平臺(tái)TokenHub上，Hy3 preview輸入價(jià)格最低1.2元/百萬(wàn)tokens，輸入命中緩存價(jià)格0.4元/百萬(wàn)tokens，輸出價(jià)格最低4元/百萬(wàn)tokens。

圖源騰訊混元微信公眾號(hào)

本質(zhì)上，Hy3 preview邁出了騰訊混元追趕的第一步。騰訊全場(chǎng)景的真實(shí)用戶需求，為Hy3 preview的研發(fā)提供了優(yōu)化方向；而海量場(chǎng)景產(chǎn)生的真實(shí)交互數(shù)據(jù)，又能持續(xù)反哺模型的能力迭代，讓模型在真實(shí)使用中不斷進(jìn)化。

3、騰訊AI，要統(tǒng)一作戰(zhàn)

把這些變化串起來(lái)看，一個(gè)更深層的戰(zhàn)略圖景浮現(xiàn)出來(lái)：騰訊AI的競(jìng)爭(zhēng)邏輯變了。

過(guò)去兩年，中國(guó)AI行業(yè)的競(jìng)爭(zhēng)規(guī)則是明確的，誰(shuí)在通用跑分榜上分?jǐn)?shù)高，誰(shuí)就能獲得更多的資本關(guān)注和市場(chǎng)聲量。混元也跟著這條規(guī)則跑了很久，結(jié)果被馬化騰批評(píng)“太慢了”，上一輪游戲規(guī)則里，騰訊優(yōu)勢(shì)不明顯。

Hy3 preview的真正價(jià)值，在于把競(jìng)爭(zhēng)從別人制定的規(guī)則拉回到了自己的主場(chǎng)。

當(dāng)一個(gè)模型的能力是由真實(shí)用戶的需求和真實(shí)場(chǎng)景反向打磨出來(lái)的，那這個(gè)模型的競(jìng)爭(zhēng)力就不再取決于它在第三方評(píng)測(cè)中的排名，而是取決于它在騰訊生態(tài)內(nèi)部的正向循環(huán)深度。

這是一個(gè)更高級(jí)的壁壘。純模型公司可以在跑分上無(wú)限逼近甚至超越GPT，但它們永遠(yuǎn)無(wú)法獲得13億微信用戶、8億QQ用戶的真實(shí)使用反饋。這些數(shù)據(jù)就像磨刀石，磨得越久，刀越鋒利。

這背后，是騰訊AI組織長(zhǎng)達(dá)一年的重構(gòu)。

2025年4月，騰訊對(duì)混元大模型研發(fā)體系進(jìn)行重構(gòu)，將技術(shù)部門拆分為大語(yǔ)言模型部和多模態(tài)模型部，確立了算法研發(fā)的雙軌制；同年12月，騰訊新成立AI Infra部、AI Data部、數(shù)據(jù)計(jì)算平臺(tái)部。前者負(fù)責(zé)大模型分布式訓(xùn)練與高性能推理服務(wù)，后者負(fù)責(zé)數(shù)據(jù)與評(píng)測(cè)體系建設(shè)，數(shù)據(jù)計(jì)算平臺(tái)部負(fù)責(zé)數(shù)據(jù)智能融合平臺(tái)建設(shè)。

這是一個(gè)清晰的信號(hào)，騰訊不再只拼算法，而是開始從算力、數(shù)據(jù)、工程三條基線上同時(shí)發(fā)力。

這期間，混元關(guān)鍵人物姚順雨擔(dān)任CEO/總裁辦公室首席 AI 科學(xué)家，同時(shí)兼任全新設(shè)立的AI Infra 部、大語(yǔ)言模型部雙部門負(fù)責(zé)人，實(shí)行雙線匯報(bào)，直接向騰訊總裁劉熾平、TEG 技術(shù)工程事業(yè)群負(fù)責(zé)人盧山匯報(bào)。

將模型研發(fā)與基礎(chǔ)設(shè)施統(tǒng)一到一個(gè)負(fù)責(zé)人手中、AI Lab的撤銷，騰訊逐步將散落在各處的AI力量集中收攏，圍繞混元大模型構(gòu)建單一主線的研發(fā)體系。

3月份的財(cái)報(bào)會(huì)上，劉熾平直言，“過(guò)去幾個(gè)月，騰訊密集進(jìn)行了整個(gè)團(tuán)隊(duì)的升級(jí)和工作流程的重構(gòu)”，目的就是讓“團(tuán)隊(duì)更健壯、組織方式更合理”。

如今，88天的極限沖刺完成后，混元團(tuán)隊(duì)面臨的考驗(yàn)才剛剛開始，更大的考驗(yàn)來(lái)Hy3正式版和后續(xù)的迭代中。

姚順雨對(duì)此的表述很克制，“Hy3 preview是混元大模型重建的第一步。我們希望通過(guò)這次開源和發(fā)布，獲得來(lái)自開源社區(qū)和用戶的真實(shí)反饋，幫助我們提升Hy3正式版的實(shí)用性。”

大模型行業(yè)的追趕本身不是線性競(jìng)賽，第一梯隊(duì)也在加速。DeepSeek、字節(jié)、阿里等對(duì)手不會(huì)停下來(lái)等騰訊，重建后的研發(fā)體系能否保持甚至加速這個(gè)迭代節(jié)奏，將在接下來(lái)2-3個(gè)版本中得到更真實(shí)的檢驗(yàn)。市場(chǎng)對(duì)混元3.0正式版的期待已被拉高，騰訊此前也透露混元3.0計(jì)劃于4月陸續(xù)向外開放，preview之后的正式版不能讓市場(chǎng)等太久。

圖源騰訊官網(wǎng)

更關(guān)鍵的挑戰(zhàn)來(lái)自生態(tài)價(jià)值的商業(yè)兌現(xiàn)。目前，接入混元全家桶是能力滲透，而不是商業(yè)模式，To C的付費(fèi)、To B的API輸出、云服務(wù)打包銷售等商業(yè)化仍在探索中。

2025年全年，騰訊云已實(shí)現(xiàn)全年規(guī)模化盈利，AI相關(guān)服務(wù)需求驅(qū)動(dòng)企業(yè)服務(wù)收入同比增長(zhǎng)接近20%。但混元想要拉動(dòng)利潤(rùn)，還需要更清晰的商業(yè)設(shè)計(jì)。

此外，Co-Design模式大范圍的推廣也是挑戰(zhàn)。騰訊生態(tài)擁有數(shù)十款核心產(chǎn)品，如何將這種場(chǎng)景反向訓(xùn)練模型的機(jī)制從元寶和WorkBuddy擴(kuò)展到更廣泛的產(chǎn)品矩陣，并在組織層面確保每個(gè)產(chǎn)品團(tuán)隊(duì)都具備與模型團(tuán)隊(duì)深度Co-Design的能力和意愿，是一個(gè)遠(yuǎn)比發(fā)一個(gè)模型版本更復(fù)雜的系統(tǒng)工程。

正如馬化騰所說(shuō)，騰訊的風(fēng)格就是穩(wěn)扎穩(wěn)打，Hy3 preview是跑起來(lái)的第一步，而騰訊AI下半場(chǎng)的真正考驗(yàn)，在于接下來(lái)跑得遠(yuǎn)不遠(yuǎn)、穩(wěn)不穩(wěn)。

（本文頭圖來(lái)源于騰訊混元微信公眾號(hào)。）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.