Qwen這是沒抓住Agent浪潮?
3月27日消息,前阿里千問大模型技術負責人林俊旸在離職三周后首次公開發(fā)聲,發(fā)布長文反思Qwen3技術路線,判斷AI下一階段方向是“智能體式思考”。
林俊旸是阿里最年輕的P10級技術專家,32歲即擔任千問技術負責人。他主導了Qwen全系列后訓練,將千問做到全球下載量超10億次、衍生模型超20萬款,成為全球開源模型領軍者之一。3月4日凌晨,林俊旸宣布離職,據(jù)媒體報道其離職源于組織架構調(diào)整分歧——阿里希望將Qwen團隊水平拆分,而林俊旸堅持預訓練與后訓練應更緊密垂直整合。
林俊旸在文中坦承,2025年初千問團隊嘗試將“思考模式”與“指令模式”融合到同一模型,但“我們沒有全做對”。兩種模式的數(shù)據(jù)分布和行為目標存在根本沖突:強指令模型追求直接、簡潔、低延遲;強思考模型需要在難題上多花token、探索多條路徑。強行融合的結果往往是“兩邊都平庸”。據(jù)林俊旸披露,千問在2507版本最終切回分離路線,分別發(fā)布獨立的Instruct和Thinking版本。
林俊旸明確提出,行業(yè)正從“推理式思考”轉(zhuǎn)向“智能體式思考”——從“想得更久”到“為了行動而想”。未來AI的核心競爭力將來自環(huán)境設計、訓練與推理的緊耦合、多智能體協(xié)作編排,而非僅僅是更好的算法。他特別提到Anthropic的路線是“有益的糾偏”:Claude系列讓模型在思考過程中就能調(diào)用工具,思考服務于具體任務目標。過于冗長的內(nèi)部推理鏈反而說明模型“不會分輕重、不會壓縮、不會行動”。
林俊旸預測,智能體式思考將成為主導形態(tài),未來競爭將從“訓練模型”轉(zhuǎn)向“訓練智能體”,再到“訓練系統(tǒng)”。他警告,一旦模型獲得工具調(diào)用權限,“獎勵黑客”風險將成倍增加,模型可能在訓練中學會直接搜索答案或利用系統(tǒng)漏洞作弊。
文章發(fā)布后迅速引發(fā)熱議。有業(yè)內(nèi)人士評論:“千問的模型往往架構做得好,但訓練數(shù)據(jù)不行。”還有開發(fā)者指出:“核心還是要讓智能體縮短思考并準確調(diào)用工具執(zhí)行。”不少網(wǎng)友認同林俊旸的判斷,認為“AI正從‘只會在腦子里想’升級為‘邊想邊行動’”。也有評論稱,這篇長文“相當于發(fā)了一個故事,等人來投資他的算力需求”。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.