![]()
文:王智遠 | ID:Z201440
今天阿里發(fā)了Qwen3.6-Plus。
千問3.6系列的第一款模型,編程能力接近Claude系列,100萬Token上下文窗口。
往前倒兩天,4月1日,Wan2.7-Image,圖像生成和編輯統(tǒng)一模型;3月30日,Qwen3.5-Omni,全模態(tài)大模型,215項全球最佳性能。
四天,三個模型。全模態(tài)感知、圖像生成、Agent編程,完全不同的方向,這是ATH事業(yè)群成立兩周以來的第一次集中亮相。
不知道你有沒有想過:三個方向完全不同的模型,為什么偏偏選在同一個窗口期發(fā)?
01
先說結(jié)論,我認為,這三個模型單獨看,每一個都是各自賽道上的常規(guī)迭代;拼在一起看就不一樣了。
Omni管感知,Wan2.7管生成,Qwen3.6-Plus管執(zhí)行。加在一起,剛好覆蓋了一個完整Agent工作流的三個階段。
不信,我們拆開來看。
先說Omni,全模態(tài),能聽能看;支持113種語言和方言,在音視頻理解這類任務(wù)上拿了215項全球最佳,超過了谷歌的Gemini-3.1 Pro。
這個模型有一個細節(jié)值得多說兩句。它長出了一種能力:
打開攝像頭,對著一張手畫的草圖說你想要什么,哪怕描述的是一個帶復(fù)雜產(chǎn)品邏輯的界面,它也能直接給你生成一個可以跑的原型。動動嘴就能編程。
關(guān)鍵在于,這個能力不是團隊刻意訓(xùn)練出來的。
它是模型在多模態(tài)能力持續(xù)擴展的過程中,自己長出來的,感知能力積累到某個臨界點之后,它開始能做一些設(shè)計者自己都沒預(yù)料到的事情。
再看Wan2.7-Image,做圖像生成的。
AI生圖這個領(lǐng)域有兩個老問題。一個叫「標準臉」,生出來的人長得都一樣,審美疲勞。一個叫「色彩盲盒」,你沒法精確控制畫面的配色。
Wan2.7針對這兩個痛點做了專門優(yōu)化,捏臉可以從骨相、眼眸到五官全方位定制;配色上做了一個調(diào)色盤功能,用戶可以用色值精確控制顏色的數(shù)量和占比。
在人類偏好盲測中,Wan2.7的文生圖能力超過了GPT-Image1.5和國內(nèi)主流模型;它還有一個跟今天這個話題直接相關(guān)的特性:支持被龍蝦調(diào)用,讓Agent畫畫。
也就是說,Agent的能力邊界又往外推了一步,之前能寫代碼、能查資料、能總結(jié)文檔,現(xiàn)在還能做設(shè)計了。
然后是今天發(fā)的Qwen3.6-Plus。
阿里給它的定位「國內(nèi)最強編程模型」。數(shù)據(jù)上看,確實站得住。好幾個主流的編程和Agent能力評測里,3.6-Plus可以匹敵Claude Opus 4.5,顯著超過了參數(shù)量兩倍甚至三倍于它的GLM-5和Kimi-K2.5。
這些評測的名字你不用記,記住它們測什么的就行:
一個測能不能修真實項目的Bug,一個測能不能操作終端,還有幾個測在龍蝦里能不能完成一個完整任務(wù)。所以,三者指向同一件事:模型的價值正在從「生成文本」遷移到「完成任務(wù)」。
3.6-Plus還做了一件很有針對性的事。
它在訓(xùn)練過程中,集中對市面上主流的Agent框架做了優(yōu)化適配,包括OpenClaw、Claude Code等等;100萬Token的上下文窗口,意味著它可以一次性裝下一個中等規(guī)模項目的完整代碼庫。
你看,一個團隊做出一個好模型不稀奇,三個放在一起,這說明背后有統(tǒng)一的節(jié)奏。
02
這個節(jié)奏從哪來?兩周前阿里成立了ATH事業(yè)群,這件事大家都知道了,我不重復(fù)。
我想聊它的名字:Alibaba Token Hub。嗯,不叫AI實驗室,不叫大模型中心,叫,Hub。
Token是什么?我們跟AI對話、讓它寫代碼、讓它畫圖,消耗的都是Token。它是AI世界的燃料。Hub是樞紐,是集散中心。
我們可以把ATH理解成一個Token煉油廠和加油站網(wǎng)絡(luò)。
通義實驗室是上游油田,負責把原油煉出來;MaaS平臺是管道,負責把油輸送出去;千問APP、悟空、AI創(chuàng)新這些應(yīng)用,是下游的加油站,直接面向開車的人。
吳泳銘給這個事業(yè)群定的使命也是這個邏輯:創(chuàng)造Token、輸送Token、應(yīng)用Token。你看,你又聽說過。
不過,這個命名有意思的地方在于,它暗含了一個判斷:AI這門生意的核心資產(chǎn)是Token的流轉(zhuǎn)效率。
什么是流轉(zhuǎn)效率?
現(xiàn)在有兩家自來水公司,水的質(zhì)量差不多,都是達標的。
一家只有水廠,水造出來了,但管網(wǎng)不行,送到用戶家里要繞三道彎,水壓不穩(wěn),有時候擰開龍頭半天沒水;另一家從水廠到管網(wǎng)到龍頭全是自己的,擰開就來,水壓穩(wěn)定,24小時不斷。
你說用戶會選誰?顯然,用戶會選后者。
對應(yīng)到AI里,模型就是水廠,平臺是管網(wǎng),應(yīng)用就是用戶家里的水龍頭。水質(zhì)(模型能力)固然重要,達到一定水準后,用戶感受到的差距是水壓,打開龍頭的那一瞬間,水能不能立刻出來。
Token流轉(zhuǎn)效率,講的就是這件事:從模型生成Token,到用戶在應(yīng)用中實際使用,鏈路有多短、響應(yīng)有多快、損耗有多小。
這個判斷不只阿里一家在做。
有消息說OpenAI內(nèi)部已經(jīng)把核心考核從日活用戶切到了每日Token消耗量;兩家公司,一個在舊金山,一個在杭州,得出了同一個結(jié)論。
所以,ATH名字透露了阿里對AI商業(yè)化的底層思考。Agent時代,衡量一家AI公司值不值錢的指標,正在從多少人在用,變成消耗多少Token,誰的Token管線跑得最順,誰就離錢最近。
03
上面說了,三個團隊同時交卷,背后肯定有統(tǒng)一的節(jié)奏。ATH搭了一條Token管線,從生產(chǎn)到運輸?shù)较M,聽起來很完整。
問題是,這個管道通不通?
畢竟市面上每家模型公司都在說「模型應(yīng)用協(xié)同」,這個詞我聽了一年多了,已經(jīng)沒什么信息量了。關(guān)鍵在于,大家說的「協(xié)同」,根本不是同一件事。
我試著把它拆成三層來看。
第一層:接入層。
模型更新了,應(yīng)用端改個版本號、發(fā)篇公告,模型團隊和應(yīng)用團隊各干各的,發(fā)布完才臨時對接。就像兩支球隊,比賽打完了才第一次見面握手。絕大多數(shù)公司,停留在這一層。
第二層,同步層。
模型還沒正式發(fā)布,應(yīng)用端就已經(jīng)在聯(lián)合調(diào)試了。兩個團隊從立項開始,就清楚對方在做什么。模型訓(xùn)練方向會考慮應(yīng)用需求,應(yīng)用產(chǎn)品設(shè)計也會提前適配模型能力邊界。
等模型一上線,應(yīng)用直接同步交付。ATH這一輪,做到的就是這一層。我為什么這么判斷?
因為有幾個細節(jié)對得上。
Qwen3.6-Plus專門對OpenClaw、Qwen Code、Claude Code這些主流Agent框架做了優(yōu)化適配。
你想,如果模型和應(yīng)用各干各的,模型不可能在訓(xùn)練階段就去適配特定框架。它這么做,說明模型還沒成型,就已經(jīng)知道將來給誰用、怎么用。
同理,Omni能通過API直接被龍蝦、Claude Code調(diào)用,處理長音視頻和文檔;Wan2.7支持Skill調(diào)用,Agent可以直接用它生成圖像。三個模型都是出廠就自帶適配接口。
再看應(yīng)用端:悟空、千問APP、QoderWork,全都在Qwen3.6發(fā)布的同一時間點官宣接入,是一起沖線的。
這種節(jié)奏,必須在立項、定方向的早期,就把模型和應(yīng)用放在一起統(tǒng)籌。ATH把五個業(yè)務(wù)整合進同一個事業(yè)群、統(tǒng)一負責人,本質(zhì)上就是從組織上保證這件事能落地。
第三層:飛輪層。
應(yīng)用跑起來后,真實用戶數(shù)據(jù)回流,指導(dǎo)下一代模型訓(xùn)練;模型更好用,帶來更多用戶與調(diào)用量;更多調(diào)用又產(chǎn)生更多數(shù)據(jù),形成正向循環(huán)。
這一層,說實話,我目前沒有完整證據(jù)證明已經(jīng)完全跑起來,但有幾個前置信號很關(guān)鍵:
沙利文今年2月的報告顯示,2025年下半年中國企業(yè)級大模型日均調(diào)用量,千問占比沖到32.1%,比上半年17.7%幾乎翻倍,增幅第一。
調(diào)用量暴漲,意味著真實場景的反饋數(shù)據(jù)在快速積累,飛輪的燃料正在備齊。
而且,你看千問現(xiàn)在的客戶構(gòu)成。
一汽紅旗把千問智能體接進了智能座艙,汽車行業(yè)。達能亞太跟阿里云合作,基于千問搭供應(yīng)鏈和營銷的Agent,消費品行業(yè)
西門子用千問做工業(yè)機器人,工程師口述就能搭建生產(chǎn)線,制造業(yè);海外更不用說,亞馬遜、英偉達、Meta都在基于千問做產(chǎn)品,斯坦福李飛飛團隊也在用千問做前沿研究。
場景越多元,數(shù)據(jù)越豐富,飛輪一旦轉(zhuǎn)起來,慣性就會非常大。我的觀點是:判斷一條Token管線有沒有真正跑通,就看兩點:
一,模型發(fā)布后,應(yīng)用跟上的速度夠不夠快;二,外部開發(fā)者是不是真的在用模型做自己的產(chǎn)品。
從這兩個標準看,ATH第一輪已經(jīng)及格。而大部分模型公司,還卡在第一層。
04
及格只是起點,現(xiàn)在還有一個更關(guān)鍵的問題擺在所有人面前:這輪大模型競爭,最后到底比的是什么?
現(xiàn)在牌桌上玩家一點不少,智譜、字節(jié)、騰訊、百度,全都往Agent方向沖。當所有人都在做同一件事時,必須想明白:真正的壁壘到底在哪?
模型能力算壁壘嗎?不算。
現(xiàn)在跑分領(lǐng)先的窗口期越來越短,很快就被追上;龍蝦生態(tài)適配算壁壘嗎?OpenClaw本身就是開源的,誰都能做適配。你能優(yōu)化,別人也能。
那真正的勝負手在哪?
我認為,最容易被忽視、卻最可能決定終局的,是這條Token管線在企業(yè)側(cè)的縱深。
我們先算一筆很簡單的賬。
一個普通C端用戶,用龍蝦玩一下午,寫寫代碼、總結(jié)幾篇文檔,也就消耗幾十萬Token。玩完覺得新鮮,關(guān)掉就沒了,可能一周都不打開,下次再用,說不定就換別家模型了。
企業(yè)不一樣。
把AI Agent嵌進客服系統(tǒng),一天處理幾千工單;嵌進供應(yīng)鏈,每天自動跑數(shù)據(jù)分析;嵌進產(chǎn)品設(shè)計,設(shè)計師天天用它出方案。這種Token消耗是日復(fù)一日、穩(wěn)定持續(xù)的,跟水電費一樣。
更關(guān)鍵的是:企業(yè)一旦把AI嵌入核心業(yè)務(wù),基本不會輕易換。
換一個聊天工具的成本是零,換一套跑在業(yè)務(wù)里的AI系統(tǒng),要重新對接數(shù)據(jù)、重新訓(xùn)流程、重新讓員工適應(yīng)。切換成本非常高。
哪個生意更值錢,一目了然。
C端Token消費像賣礦泉水,一瓶一瓶的,今天買你明天買他;B端Token消費像鋪自來水管,一旦接通了,水費按月交,誰也不會吃飽了沒事去換一套管道。
這就是悟空事業(yè)部存在的意義。
它是ATH成立時,第一次公開亮相的全新部門,定位非常清晰:B端AI原生工作平臺,把模型能力深度扎進企業(yè)工作流。而且有消息透露,阿里還計劃逐步把淘寶、支付寶、阿里云的B端商業(yè)服務(wù)全部整合進來。
阿里做這件事,有一個別人幾乎沒法復(fù)制的先天優(yōu)勢。
釘釘沉淀了多少企業(yè)?阿里云覆蓋了多少行業(yè)?淘寶商家生態(tài)有多大體量?這些客戶,不是ATH要從零去找的,因為他們本來就在阿里生態(tài)里。
ATH要做的,只是把Token管線接到這些客戶已有的工作流里;對純模型公司來說,獲客是最難的一關(guān);但對阿里來說,客戶就坐在隔壁桌。
當越來越多企業(yè)的核心工作流,跑在千問的Token之上,以后比拼的,就是基礎(chǔ)設(shè)施綁定。
順便說一句,ATH這個名字還有另一層意思:All Time High,表面看,是個討巧的雙關(guān),但里面野心是真的,阿里想做的,絕不止一個普通大模型。
Qwen3.6-Plus是千問3.6系列的第一款,后面還有Max版本;Token管線剛跑完第一輪,第二輪其實已經(jīng)在路上了。
能不能交得更快,我們走著看。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.