文|王毓嬋 周鑫雨
編輯|楊軒
“看流水(即營收),AI視頻類這些項目的表現確實很不錯,可以說是AI最賺錢的細分賽道之一。”投資行業人士對36氪說。
中國 AI 視頻生成賽道,正在經歷大廠模型能力瘋狂增長的巨大紅利。來自字節跳動的Seedance和來自快手的可靈這兩款“超級底座”正在進行一周一小版、兩月一大版的高頻迭代。阿里巴巴也在4月底,對視頻生成模型HappyHorse 1.0開啟灰測,720P視頻生成刊例價為0.9元/秒。
愿意為此花錢的內容創作者太多了,太急迫了。眾多短劇、內容公司排隊等待使用Seedance2.0已經成為2026年AI世界的一個奇觀。由此,在AI視頻模型外“套一層殼”,使其更簡單易上手的AI視頻Agent產品,也迎來了增長奇跡。
一位業內人士對智能涌現透露,頭部公司一個月的算力消耗成本應該在百萬元以上。 “一部短劇的算力消耗成本約為3萬元,工具平臺如果一個月能接100部這樣的工程,那么消耗量就能達到300萬。這沒什么難度,只是時間問題。”
在必應上搜索“AI視頻生成工具”這樣的關鍵詞,能看到不少此類產品的廣告。“據我了解,某頭部工具平臺一天在這個廣告上的消耗就有兩三萬元,那么一年光這一個渠道的廣告投放就至少需要七八百萬元。由此可以反推它的收入水平是多么高。”業內人士稱。
AI視頻創作平臺Creati對智能涌現透露,上線一年,該平臺的全球用戶量就突破了千萬級別。產品ARR(年度經常性收入),一度達到了2000萬美金。
但令這些AI視頻Agent產品擔憂的是,如果大廠也從模型層走到產品層,跟自己搶飯碗呢?今年1月,抖音還推出了AI視頻應用“隨變”,將工具+社區兩塊業務一并做了起來。以及,產品公司設計的應用層功能又可能隨著大模型的一次升級被覆蓋。
“短期來說,這類工具型公司與大模型廠商之間還是合作關系。創業公司的利潤很大程度上由它們能接入哪些模型、能拿到多大API價格折扣來決定。”蔚來資本投資經理馮繪霓表示,“但同時,據我所知,大廠對這些‘合作伙伴’也看得很緊。在這些比較重要的賽道方向上面,大廠內可能有不止一個團隊在做。”
這是一個“等待被大廠吞沒”的行業,還是真的有可能長出像Adobe那樣的工具型公司?
產品公司在生態位上的弱勢,體現在利潤里。“如果看利潤,其實大家的毛利率都挺低。”某投資人表示,很多項目在犧牲UE(單位經濟效益)換規模,因為“目前這個行業沒什么壁壘,所以都在燒錢補貼獲客,還做不到盈虧平衡。”
但依然有不少投資人愿意對其下注。這個賽道最明星的中國公司——LibTV 的母公司LiblibAI,在去年10月完成了由紅杉中國、CMC資本等機構投資的1.3億美元B輪融資。更早之前,它還曾創下 “一年內連續四輪融資”的行業紀錄。
![]()
工具類公司融資規模排名
“今年AI視頻工具是為數不多可以投的賽道,因為視頻的迭代速度比語言、coding慢很多,所以在語言工具、coding應用大批被基模顛覆的情況下,視頻生成項目反而相對更‘可看’。”一位投資人對智能涌現表示。
這些AI視頻Agent產品依然有時間做出自己的護城河。 在這場“不對等的競爭”中,誰能活下來?
大廠之劍,與商業化護城河
目前來看,主流的工具類產品有三種形態:
要么做好“idea”,通過AI Agent將創作流程極度簡化為“自然語言指令”,比如ZeroCut、Ribbi;要么做好“editing”,把無限畫布、細節調整做到非常精細,比如LibTV、Buzzy;要么“離錢更近”,直接把視頻生成與電商交易/社媒運營掛鉤,比如TapNow。
本文包括創業者和投資人在內的所有受訪人都認同,等大模型廠商卷完了基建層面的事,勢必就要做應用層面的事,這只是一個時間早晚的問題。關鍵是,這個時間窗口有多久,以及窗口關閉了之后,自己還能否存活。
曾在大廠工作,并經歷了古典互聯網時代競爭的張云劍,打造了AI視頻創作平臺ZeroCut。他認為,“至少在五年內,大廠很難一口氣完美覆蓋掉整個AI視頻制作的全流程。”
他的判斷主要基于以下兩個認知:
第一,視頻制作是一條極長的創意服務鏈條。外界或投資人往往只關注“工程工具”和“生成”這一層面,但視頻生成實際上只占整個制作環節的一小部分。在真正生成視頻之前和之后,有著非常復雜的創意和鏈條過程,因此,AI對流程的替代將是一個逐步的過程,五年內很難達到直接面向消費者,且完全不需要人工干預的終極形態。
第二,基于市場競爭與細分邏輯,單一廠商很難在所有環節都做到極致。一個完整的AI視頻工作流需要調用語言模型、圖片模型和視頻模型。大廠雖然有能力做全流程覆蓋,但這并不意味著它能在每一個細分領域都保持最強,例如有的模型在圖片生成上做到了極致,但視頻能力未必最強。這種能力的差異化最終會促成市場細分,而非一家獨大。
同樣離開大廠、投身AI創作工具創業的Ribbi創始人兼CEO Robin,在這一點上與張云劍觀點接近。“大廠中,業務、模型和頂層之間的對齊是最困難的事,除非已經有業內共識。”Robin說,“在看到Taste的確切價值之前,為審美、品味構建模型,是大廠不愿意做的。只有當視覺創意生成從非共識,變成共識,才能激發更多大廠和頂尖人才參與進來。”
然而,投資經理馮繪霓覺得這個為期五年的這個預估有點“過于樂觀”。
“大廠在接觸這類工具型的初創公司時,其實最想挖的不是產品或算法人才,而是運營。”馮繪霓說,“這揭示了一件事情——在技術層面,大廠自認為完全有這個能力把產品做出來,而目前的短板在于用戶滲透。”
馮繪霓的判斷是,Seedance、可靈等大模型的野心非常大,“它們不會只想做一個基建或者工具,他們更想做的是‘定義下一個內容平臺、社交平臺’,而工具只是‘順帶被做了’的部分。”
一句話來說,大廠會做,但不會明天就做。在這個窗口期,創業公司能做什么呢?
從騰訊、字節跳動等大廠離職創業的Anijam CEO方晨認為,創業公司與大廠競爭的關鍵,是“要更早跑起來,形成用戶留存與數據沉淀。”
換句話來說,時間就是資源,跑起來的速度決定了達摩克利斯之劍落下之后的生死。“要盡快進入市場、獲取用戶,并在真實使用中積累數據與認知。”方晨說。
張云劍對ZeroCut的規劃是,公司的護城河在于“AI落地服務”與“社會分工”。
“即使底層模型變得非常強大,市場上依然會有大量不會使用工具的用戶,或者出于‘性價比’和‘比較優勢’考慮而不愿親自下場制作的企業客戶。”張云劍說。因此,ZeroCut將避開工具層面的硬碰硬,直接幫客戶解決最終的“交付和落地”問題。
這就涉及到了商業化路線的問題——是在大模型的算力成本與自己的用戶定價之間賺差價,還是找一條新的商業化道路?前者雖然簡單,但大模型廠商一旦降價,就會吸走用戶,大模型廠商一旦漲價,自己的利潤就會變薄。說白了終究是把命脈交在他人手中。因此,創業公司大多選擇了后一條路。
ZeroCut的思路,就是"技術+服務"模式——如果客戶有能力,可以直接使用工具;如果客戶需要代工,平臺會將訂單對接給熟練掌握該工具的創作者,提供穩定的視頻定制交付服務。至于計費標準,則從傳統內容承制公司的“人力計費”轉為AI時代的“Token計費”。客戶不需要關心固定的人力報價,而是以視頻生成過程中消耗的算力為基準來計價。
只是讓用戶“花錢買積分”根本不夠。許多AI視頻生成工具,都在將手越來越深地伸向客戶的業務深處,變得越來越像一個能包攬一切的乙方。
主打“電商+AI自動生成”商業模式的TapNow,就被外界評價為“離錢最近的項目”。傳統 4A 公司高管在《BusinessFocus》的匿名訪談中提到:“TapNow 這種‘預測+自動生成’的邏輯,搶走了原本屬于中小代理商的短視頻代運營訂單。”
Ribbi不僅能用來創作音視圖,還能幫用戶監測內容發布到社交媒體之后的數據。感知階躍也一樣,致力于覆蓋內容生成、發布、投放、A/B Test、效果分析、二創等的全流程。
“人一定是懶的動物。沒有用戶希望做一個產品、完成一個環節,就換一個模型、換一套工具。”Robin說。
社交媒體,是Agent在線進化落地的核心訓練場,將作品發布到社交媒體,是Agent與真實世界的交互。監測數據表現后,Ribbi能夠自主迭代和優化創作路徑,交付更好的結果。最終,平臺就能夠形成一個自主進化的創作閉環。
Ribbi目前的模式還沒完全確定,但Robin確定未來一定不會是積分制,因為它“不夠誠實清晰”。
但積分制仍然是目前行業的主流商業化模式,畢竟它足夠簡單,并且已經完成了用戶教育。但隨著工具能提供的服務越來越深化,以及“Token未來會越來越廉價”的美好愿景,也許未來的服務也會有未來的新商業模式。
“感知階躍”創始人兼CEO張詩瑩與方晨有一個共識,他們認為,未來時代的商業模式應該是“為效果付費,而不應該為成本付費。”
方晨認為理想的情況是,當AI生成的準確率足夠高,而Token成本足夠低時,那么用戶就可以僅在愿意下載內容時,才為最終產出買單,而非為生成過程中的Token消耗付費。
張詩瑩則認為,Agent的商業模式,應該與人類Agency越來越相似,“收費模式不會是訂閱,而更多會采用分傭的形式。”
工具型公司的時間窗口,是新時代誕生一個新的Adobe那么大的機會,還是在大廠包攬一切之前的曇花一現?對于已經入局的人來說,他們相信底層大模型歸屬大廠,但應用層也有創業公司能做的事。
“我立志成為硅基生命的墊腳石。”Robin說。“假設某一天,某家模型廠商實現了AI的自主進化,即便功不在我,我也愿意貢獻我們對Context Layer自主進化的Know-How、開源我們的技術架構,幫助模型廠商訓練更好的自主進化模型。”
技術路線之爭:提供idea,還是提供editing?
創業公司之間,目前也有顯著的思路分歧。
同樣是AI視頻生成工具,產品的形態卻千差萬別——有的一打開首頁就像進了抖音(會自動播放AI視頻)或得物(滿屏AI廣告片示范),有的卻只有簡簡單單一個對話框,像進了任意一個chatbot。這背后是行業的技術路線之爭。
到底要畫布,還是要一個包攬一切的Agent,是目前最大的技術分歧之一。
“無限畫布”的UI交互方式改變了傳統的線性時間軸,允許創作者像在Figma或Miro中一樣,通過節點連接素材和工作流。堅持這一路線的明星產品有LibTV、SkyReels、TapNow等。
在這些產品上,用戶有了一個可以無限縮放、拖拽的畫布空間。你可以將一個“圖片節點”連向“視頻節點”,再連向“音頻節點”,形成一個自動化的 Pipeline。
![]()
LibTV畫布界面
畫布的好處,在于人的意志的“強控制”——用戶可以在任意環節手動介入調整,確保AI生成內容的畫風、角色、鏡頭細節等等都在自己的規劃之內。
有創作者將LibTV的無限畫布比喻為“樂高積木”,因為它能自由搭建分鏡,徹底改變了線性剪輯邏輯。
但也有旗幟鮮明地反對畫布形態的產品,比如ZeroCut和一周收到了全球4萬多用戶使用申請的Ribbi。
這兩款產品的特征,是沒有醒目的畫布,所有的創作、編輯交互,都集中在一個小小的對話框中。用戶用自然語言與Agent對話,然后由agent去指導模型生成內容。
張云劍致力于推動從“人為主導”向“Agent為主導”的范式轉移。他對智能涌現表示,ZeroCut認為傳統的畫布或工作流模式只是過渡形態,這些模式本質上是“重人工”的,是將AI能力作為節點,讓用戶去手動串聯,屬于自動化工業方案。
![]()
ZeroCut網頁端產品界面
“當你在創作時,大部分的活是人在干,還是AI在干?”張云劍說,“這個是我們判斷的一個標準”。ZeroCut致力于讓人退居幕后,進行決策和提供靈感,而讓AI去承擔長流程的視頻制作。
Ribbi在這一點上也有這樣的共識——不做“畫布類”的產品,而是用Chat作為UI,給Agent更多的自由度。
![]()
Ribbi界面
“畫布類的產品,把模型的可能性鎖死了。”Robin說,“我們沒有把Ribbi做成畫布類的產品。畫布類的AI產品看起來交互很酷炫,能讓投資人眼前一亮,專業用戶使用起來也很順手。但它們有一個致命傷:把模型的可能性提前鎖死了。因為畫布的本質,是將工作流拆成一個個節點,模型只能沿著這條路徑走。”
Robin認為,AI時代的UI應該是容器化的,而不是功能化的。產品應該給AI創造一個容器,讓它可以自由決定調用什么樣的工具、怎么組合工具,甚至按照什么樣的順序執行任務。
在這種初衷之下,這類產品的界面就濃縮為了一個Chatbot。Robin表示,他認為Chat是一個“足夠簡單,并且靈活兼容一切的容器。”
他舉了豆包作為例子——豆包的移動端App設計得很輕量,用戶不需要打開新的對話框,只要在一個session中Chat,就能生圖、生視頻。它將用戶的交互和AI的行為,統一在一個非常簡單的框架中。
兩類技術路線之爭其實歸根結底是在爭一個問題——工具到底應該提供idea(為沒那么專業的用戶提供思路),還是提供editing(為相對專業一些的用戶提供編輯工具)?
在路線之爭尚未定勝負之時,也出現了“融合態”的產品。
由騰訊杰出科學家創業打造的AI視頻工具產品Anijam,融合了畫布和Agent兩種形態——用戶既可以用自然語言在Chat中指導Agent干活,也可以在畫布上自己上手調整。
![]()
既有Agent又有畫布的Anijam界面
Anijam CEO方晨向智能涌現展示,在創作過程中,系統會自動識別故事中的關鍵元素,包括角色、場景、道具及風格,并基于此生成完整的分鏡鏡頭。每一個鏡頭都會包含場景描述、角色狀態、鏡頭語言等信息。
對于畫面中的問題,創作者可以通過自然語言指導Agent進行修改,也可以親自使用工具,在畫布上“局部編輯”,例如只修改角色表情,而不影響動作或背景。這也是Anijam的關鍵能力之一,即從抽卡式生成視頻走向“可控編輯”。
在大模型廠商做出真正好用的應用層產品之前,兩類產品都已經積累了可觀的用戶基礎。現在的問題是,大廠給大家留了多少時間窗口?窗口關閉之后呢?
“應用層不應該去做模型層的事,因為模型一定會變得足夠好。”張詩瑩說。她是“感知階躍”創始人兼CEO,該公司的產品之一,是AI視頻創作平臺Creati。
“當下有很多‘套殼’視頻模型能力的產品,無論是畫布,還是工作流,解決的都是模型能力不夠強的問題,比如抽卡、視頻生成長度有限。但未來,模型層一定會解決生成質量和長度的問題。應用層的機會,就在于解決生成環節之外的問題。”張詩瑩說。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.