![]()
公司情報專家《財經涂鴉》獲悉,4月23日,騰訊混元Hy3 preview語言模型發布并開源,成為混元重建后訓練的第一個模型,也是混元迄今最智能的模型。
作為一個快慢思考融合的混合專家模型,Hy3 preview總參數295B,激活參數21B,在復雜推理、指令遵循、上下文學習、代碼、智能體等能力及推理性能上實現了大幅的提升,最大支持256K上下文長度。
今年2月,騰訊混元重建了預訓練和強化學習的基礎設施,以及模型追求實用性的三個原則,包括能力體系化、不推崇“偏科”,評測真實性以及性價比。
“Hy3 preview是混元大模型重建的第一步。”騰訊首席AI科學家姚順雨表示,“我們希望通過這次開源和發布,獲得來自開源社區和用戶的真實反饋,幫助我們提升Hy3正式版的實用性。”
“與此同時,我們也在繼續擴大預訓練和強化學習的規模,提升模型的智能上限,并通過與騰訊眾多產品的深度Co-Design,持續提升模型在真實場景中的綜合表現,并開始探索特色模型能力。”
多個測評結果顯示,Hy3 preview 模型能力全面提升。
首先,出色的上下文學習和指令遵循能力。基于騰訊業務場景的靈感,騰訊混元提出了 CL-bench和 CL-bench-Life 來創新性地評估模型的上下文學習能力,并在 Hy3 preview 顯著地提升了模型上下文學習和指令遵循能力。
其次,復雜推理能力突出。Hy3 preview 在 FrontierScience-Olympiad、IMOAnswerBench 等高難度理工科推理任務中表現突出,并在最新的清華大學求真書院數學博資考(26春) 和 全國中學生生物學聯賽(CHSBO 2025) 中取得優異成績,展現了可泛化的強推理能力。
第三,代碼與智能體提升最為顯著,展現出高性價比。得益于預訓練及強化學習框架的重建和強化學習任務規模的提升,騰訊混元以較快的速度在 SWE-Bench Verified、Terminal-Bench 2.0 等主流代碼智能體基準以及 BrowseComp、WideSearch 等主流搜索智能體基準中取得了有競爭力的結果。
目前,Hy3 preview 已在騰訊云、元寶、ima、CodeBuddy、WorkBuddy、QQ、QQ瀏覽器、騰訊文檔、騰訊樂享等首發上線,微信公眾號、和平精英、騰訊新聞、騰訊自選股、騰訊客服、微信讀書等多個主線產品也在陸續上線。另外,Hy3 preview 支持接入流行的開源智能體產品,如 OpenClaw、OpenCode、KiloCode 等,并已上架騰訊云大模型服務平臺 TokenHub。
得益于模型和推理框架上的深度協同,以及在推理框架、算子性能、量化算法等全方面優化,Hy3 preview整體推理效率提升40%,成本相比上一代模型大幅下降。
在騰訊云大模型服務平臺TokenHub上,Hy3 preview輸入價格最低1.2元/百萬tokens,輸入命中緩存價格0.4元/百萬tokens,輸出價格最低4元/百萬tokens。同時,騰訊云聯合混元推出定制的Hy3 preview Token Plan套餐,個人版定價最低28元/月,為Agent開發和打造“龍蝦”應用的提供更具性價比選擇。
值得一提的是,今年3月份財報發布之際,騰訊曾透露,HY 3.0正在內部業務測試中,將于4月對外推出,相比HY2.0版本效果進步明顯,推理和 agent能力有顯著提升。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.