![]()
沒有官網、沒有團隊介紹、沒有API、連模型權重都無處可尋,一款名為HappyHorse-1.0(歡樂馬)的神秘AI視頻模型,卻在全球最嚴苛的AI視頻評測平臺——ArtificialAnalysis上悄然登頂,將字節Seedance2.0、快手Kling3.0等一眾明星模型甩在身后。直到4月10日,阿里巴巴才正式“認領”這匹黑馬,謎底終于揭曉:它出自阿里新成立的ATH-AI創新事業部,由副總裁鄭波帶隊研發。
![]()
一場匿名參賽、實力屠榜、官方認領的大戲,不僅引爆了阿里股價,更讓整個AI視頻行業為之震動。當Sora遲遲未上線、主流模型受限于版權與成本時,HappyHorse的出現,究竟是技術革命的信號,還是大廠營銷的套路?它能否真正打破現有格局,成為AI視頻生成的新王者?
![]()
一、匿名“黑馬”屠榜:盲測碾壓,分數差距懸殊
在AI視頻領域,ArtificialAnalysis的排行榜被公認為最具公信力的榜單。它不看實驗室精調的演示樣本,也不采信模型方自報的技術指標,而是采用“盲測投票+Elo積分”機制——用戶在不知道模型名稱的情況下,對兩段同提示詞生成的視頻投票擇優,最終用國際象棋的積分系統算出排名,完全反映人類真實偏好。
![]()
![]()
正是在這樣嚴苛的標準下,HappyHorse-1.0以“無名之輩”的身份,在文本生成視頻、圖像生成視頻兩大核心賽道(含音頻/不含音頻)全部登頂,且優勢極為明顯。尤其是在無音頻的純視覺賽道,它的Elo評分高達1413分,比第二名Seedance2.0高出整整110分。要知道,在Elo體系中,5分差距都屬于統計誤差,100分的鴻溝意味著壓倒性的實力碾壓。
榜單數據顯示:
文本轉視頻(無音頻):HappyHorse1333分,Seedance2.01273分,領先60分
圖像轉視頻(無音頻):HappyHorse1413分,Seedance2.01298分,領先115分
![]()
![]()
含音頻賽道:HappyHorse同樣小幅領先,但差距縮小至10-20分,說明音頻能力是其優勢項,但非最強項
![]()
![]()
沒人知道它是誰、來自哪里,只知道它生成的視頻畫質更清晰、細節更真實、動作更連貫。這種“匿名封神”的操作,像極了年初智譜GLM-5匿名登頂OpenRouter的劇本,但不同的是,HappyHorse不是“持平競品”,而是全面超越。
二、技術硬核在哪?單流架構+極速生成,解決行業頑疾
HappyHorse的屠榜,絕非偶然。它的核心競爭力,來自一套徹底顛覆行業主流思路的技術架構——單流統一Transformer,把文本、圖像、視頻、音頻全部塞進同一個模型里處理。
目前市面上幾乎所有AI視頻模型,都采用“分步生成”模式:先生成無聲視頻,再用獨立模型配音頻,最后靠算法對齊音畫。這種方式不僅耗時,還容易出現口型對不上、腳步聲與動作不同步、環境音滯后等問題,是行業公認的“老大難”。就連Seedance、Kling、Veo等頭部模型,要么干脆放棄音頻,要么只能后期合成。
而HappyHorse直接換了條賽道:它用40層統一Transformer架構、150億參數,把文本、圖像、視頻幀、音頻token放在同一序列中,一次推理同步生成視頻+音頻。也就是說,你輸入一句提示詞,它直接輸出帶口型、帶環境音、帶音效的完整成片,不需要任何后期處理。
除此之外,它還有三大技術殺手锏:
DMD-2極速蒸餾:把傳統擴散模型25-50步的去噪過程,壓縮到僅8步。單張H100顯卡生成5秒1080P視頻只需38秒,256P預覽版更是2秒出片,速度比Seedance快30%、比Kling快40%。
7種語言口型同步:原生支持英語、普通話、粵語、日語、韓語、德語、法語,口型精準匹配,詞錯誤率低至14.6%,遠超行業水平。
原生1080P+超分:內置超分模塊,直接輸出高清視頻,畫面細節飽滿、物理邏輯穩定,復雜場景還原度極高。
簡單說,HappyHorse解決了當前AI視頻的三大痛點:生成慢、音畫不同步、畫質低,用一套極簡架構實現了“多快好省”。
三、阿里幕后實錘:新部門首秀,吳泳銘親自掛帥
4月10日,阿里官方微博與HappyHorse賬號同步發聲,正式確認:HappyHorse是阿里ATH-AI創新事業部自研產品,正內測中,4月30日開放API,網傳“官網”均為假冒。
這匹“歡樂馬”的身世,終于水落石出。它的背后,是阿里近期最重磅的AI組織調整:
3月16日:阿里成立**AlibabaTokenHub(ATH)**事業群,由CEO吳泳銘直接掛帥,整合通義實驗室、MaaS、千問、悟空、AI創新五大板塊,目標是“創造Token、輸送Token、應用Token”。
4月8日:吳泳銘發全員信,成立集團技術委員會,通義實驗室升級為通義大模型事業部,進一步集中AI資源。
HappyHorse正是ATH創新事業部的首款重磅產品,負責人是阿里副總裁、清華博士鄭波。他2006-2017年在谷歌領導廣告算法與中國地圖團隊,2017年加入阿里后,歷任淘寶搜推負責人、阿里媽媽CTO、淘天算法負責人,是阿里最懂“商業+技術”的高管之一。
團隊核心成員還包括前快手可靈AI負責人張迪——這位“可靈之父”2025年底加入阿里,僅用數月就帶隊打造出HappyHorse。這支團隊既有谷歌、阿里的工程化經驗,又有可靈、夸克的產品化能力,48小時就能完成技術想法到驗證的閉環,完全不像傳統大廠那樣流程冗長。
消息公布當天,阿里港股開盤即漲、午后大幅拉升,資本市場用真金白銀投票,認可這匹“歡樂馬”的戰略價值。
四、真?全面超越?與Seedance正面硬剛,各有長短
盡管榜單數據碾壓,但行業對“HappyHorse是否真的超越Seedance2.0”仍有爭議。第三方團隊CTOL的實測對比,給出了更客觀的結論:
HappyHorse優勢:
畫質與細節:復雜現實場景、物體交互、紋理還原度更強,提示詞遵循度更高
生成速度:38秒1080P,比Seedance快15秒,效率優勢明顯
音畫同步:原生聯合生成,口型、因果音效(腳步聲、碰撞聲)天然對齊,無延遲
可用性:無嚴苛版權限制,能生成更多實用內容
Seedance2.0優勢:
自然度與敘事:人物動作更生動、物理邏輯更合理、鏡頭運動更流暢,有“人文溫度”
全模態能力:支持文本、圖片、音頻、視頻混合輸入,可參考多素材創作,像“導演臺”
長視頻與連貫性:60秒長視頻、多鏡頭切換、角色一致性更好
生態成熟:產品化完善、API穩定、用戶基數大、定價清晰
一句話總結:HappyHorse是“畫質與速度之王”,Seedance是“敘事與生態之王”。HappyHorse像頂尖攝影師,擅長拍絕美單鏡;Seedance像成熟導演,更會講完整故事。
五、行業拐點將至:開源與否,決定AI視頻新格局
HappyHorse真正讓行業沸騰的,不是它的技術,而是即將開源的傳聞。
多方消息顯示,阿里計劃完整開源HappyHorse:基礎權重、蒸餾模型、超分模塊、推理代碼全部放出,允許商用與微調。如果成真,這將是AI視頻領域的“核彈級”事件:
對創作者:一次下載,本地永久運行,免費生成高清視頻,可微調風格、角色
對開發者:集成到自有產品,不依賴第三方API,安全可控、成本歸零
對行業:打破Seedance、Kling、Runway的付費壁壘,徹底重構定價與生態
當前AI視頻行業的最大痛點,正是可用性差、價格高、限制多:
Sora推遲上線,遙遙無期
Seedance、Veo審核極嚴,稍有版權風險就無法生成
商用API價格昂貴,普通用戶難以承受
如果HappyHorse開源且限制少,它將毫無懸念成為行業新標桿。哪怕不開源,僅靠4月30日上線的API,憑借更快速度、更好畫質、更低門檻,也能快速搶占市場。
對阿里而言,HappyHorse不僅是一款模型,更是ATH戰略的首戰告捷。在吳泳銘“AllinAI”的推動下,阿里正從電商巨頭轉向AI科技公司,HappyHorse就是最好的名片。
六、黑馬已現,大戰將啟
從匿名屠榜到官方實錘,HappyHorse用實力證明:中國AI視頻技術,已走到全球最前沿。它不是“彎道超車”,而是換道領跑——用單流架構、原生音畫、極速生成,開辟了一條全新路徑。
當然,它仍有短板:敘事能力、動作自然度、生態成熟度不及Seedance。但技術可以迭代,生態可以構建,只要阿里保持開放姿態,HappyHorse完全有潛力成為AI視頻領域的“新王”。
Sora缺席、群雄逐鹿的AI視頻戰場,終于迎來了最有分量的挑戰者。4月30日API上線、是否開源落地,將是決定行業格局的關鍵節點。
這一次,阿里用一匹“歡樂馬”,攪亂了整個AI視頻池。接下來,就看字節、快手、谷歌如何接招了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.