![]()
出品|虎嗅科技組
作者|SnowyM
編輯|陳伊凡
頭圖|AI生成
“AI原生100”是虎嗅科技組推出針對AI原生創新欄目,這是本系列的第「53」篇文章。
2021年初,兩個年輕人花了兩天時間做了一個自動字幕App。上線沒幾天,它就沖上了App Store排行榜榜首。
聽起來是個好的開始。但這兩個人覺得字幕工具太“小”了,不夠性感,于是轉頭去做了一個照片分享應用,想抓住Instagram從照片轉向視頻時留下的空白。照片App確實拿到了五六萬日活用戶,也順利完成了A輪融資。
而那個字幕App被他們扔在了付費墻后面,停了維護,停了更新,徹底遺忘了。創始人Gaurav Misra的個人蘋果賬戶里堆了幾千封用戶客服郵件,一封都沒讀。
一年半之后,他們偶然打開后臺,發現了一件離譜的事:這個沒人管的App,自己長到了50萬用戶,賺了50萬美元。
這個被遺忘又被撿回來的產品,就是今天剛剛拿到General Catalyst 7500萬美元、估值5億美元、累計融資1.75億美元的AI視頻平臺Mirage的前身Captions。
在AI視頻賽道競爭最激烈的2026年,Mirage走了一條很特別的路。它既沒有像Runway那樣瞄準電影級的視頻生成,也沒有像Synthesia那樣全力押注企業數字人培訓。它死磕的是一件更大眾的事:讓普通人和小團隊也能快速做出好看的短視頻。
帶著a16z、紅杉、Kleiner Perkins、Index Ventures這些頂級機構給的錢,和超過2000萬全球用戶,這家公司正試圖證明,AI視頻賽道里最大的機會,可能藏在最日常的場景里。
Mirage的轉型,是AI時代,AI視頻公司一個非常典型的樣本。L2F光源創業者基金投資總監Lela一直在一線密集看許多AI視頻的項目,她告訴虎嗅,視頻模型群雄逐鹿,國內外均有幾十億美金的創業公司,大模型公司和大廠也均有布局,應用公司的突圍方式更多要回歸創作本身。
在前幾年,創業公司會更多聚焦在單點功能和交互方式的創新上,比如captions的字幕,對口型,虛擬形象;還有typenow主推的畫布交互,出發的基點都是創作者在ai時代與agent產生的新交互。隨著模型能力的提升,模型端到端完成任務的能力趨強,創作者的心智也在改變,交互將會變得更為簡單,底層的工程框架和創作者knowhow/skill的積累會成為新一代視頻agent的核心資產,市場會一直處于紅海狀態,新的10億美金公司仍會產生,對于創業公司來說只有變化是不變的。
Lela的話,也指出了Mirage這家公司未來的挑戰,他們正是從Captions起家,迅速跑起來,然后再Pivot(轉型)最后成為一個讓AI端到端完成從素材到成片的工作流的平臺。
從一個字幕工具到AI視頻全棧平臺
Captions最早能跑起來,靠的是一個特別樸素的洞察:人們越來越多地在無聲狀態下刷短視頻。
地鐵上、辦公室里、深夜躺在床上,手機靜音是常態。TikTok、Instagram Reels、YouTube Shorts上的內容,有很大比例是在沒有聲音的情況下被消費的。a16z在投資Captions時就專門提到了這一點:無聲觀看讓字幕和文字覆蓋變成了短視頻的剛需,而當時市面上的字幕工具要么太粗糙,要么太貴。
Captions做的事情很簡單:給視頻自動加字幕,支持100多種語言,還能自定義字體、顏色、動畫效果。就這么一個看起來不起眼的功能,上線6個月就做到了10萬日活用戶。
但字幕只是起點。
2023年開始,Captions進入了功能爆發期。它推出了AI口型同步配音(Lipdub),能把視頻里的語音翻譯成28種語言,同時讓說話人的嘴型和翻譯后的語音匹配上。2025年的新版音頻模型甚至能保留說話者原本的口音特征,這在行業里很領先。
緊接著是AI虛擬形象(AI Creator),號稱全球第一個專為內容創作設計的3D數字人,用戶不用真人出鏡就能生成逼真的視頻。然后是AI一鍵編輯,系統自動給視頻加轉場、插入B-roll素材、配音樂和音效,提供21種以上的預設風格。還有AI眼神矯正,讓說話的人看起來始終在直視鏡頭。
![]()
這些功能單拎出來看都挺厲害,但Captions把它們全部塞進了同一個App里。一個從沒剪過視頻的普通人,打開Captions,錄一段話,點幾下,就能拿到一條看起來像專業團隊產出的短視頻。
2025年9月,公司做了一件引起行業關注的事:從Captions更名為Mirage。
這次改名背后有很明確的信號。創始人Gaurav Misra在官方聲明里說:「在我們看來,AI視頻的真正競賽還沒有開始。Mirage這個名字代表了我們更大的愿景——通過前沿AI研究和模型,從短視頻開始,重新定義視頻這個品類。」
改名之后的架構是這樣的:Mirage作為母公司品牌,旗下保留Captions(消費者創作應用)和新開辟的Mirage Studio(面向品牌和營銷團隊的企業平臺)。更核心的變化在技術層。公司從頭訓練了自己的基礎模型,包括Mirage Video(音頻到視頻的生成模型)和Mirage Audio(可控的表現力音頻生成模型)。
這兩個模型的特別之處在于,它們是專門為短視頻場景設計的。傳統的AI視頻模型追求的是通用的畫面生成能力,但Mirage的模型關注的是短視頻里最核心的三個變量:節奏、構圖和注意力動態。
簡單說,就是什么時候切畫面、畫面怎么擺、怎么在前幾秒抓住觀眾的注意力。這些東西對專業剪輯師來說是直覺,Mirage要做的是把這種直覺變成模型能力,讓AI替你做出這些判斷。
Mirage官方把這種方法叫做“Assembly Intelligence(組裝智能)”,核心思路是把多個專門的AI模型組合在一起,分別負責節奏、構圖、注意力和音頻,最后輸出一條完整的視頻。
在賺錢這件事上,Mirage用的是訂閱制加積分制的組合。免費版提供基礎功能,Pro版每月9.99美元(200積分),Max版24.99美元(500積分),Scale版69.99美元(1400積分),企業版定制價格。AI功能按積分消耗,比如用AI生成視頻按秒計費,用對話式編輯按消息計費。這種模式的好處是,把后臺的AI算力成本透明化了,用戶用多少付多少。
另一個讓人意外的數字是,Captions在2023年B輪融資時就已經實現了正現金流,這在AI創業公司里幾乎沒人做到過。根據AppFigures的數據,過去12個月Captions的應用內收入約為2840萬美元,其中75%來自美國以外的市場,全球化能力很突出。
融資路徑也非常清晰。種子輪和A輪由紅杉和a16z聯合領投,2023年B輪2500萬美元由Kleiner Perkins領投,2024年C輪6000萬美元由Index Ventures領投,估值達到5億美元。2026年3月,公司又拿到了General Catalyst旗下Customer Value Fund的7500萬美元增長融資,累計融資超過1.75億美元。
General Catalyst給這輪錢用的是一種特殊的“非稀釋性資本”結構,之前只有Stripe和Gusto拿過類似的錢。General Catalyst常務董事Pranav Singhvi對Mirage的評價是:Mirage的商業方程式非常成熟。他們清楚知道怎么花每一美元,并且產生很強的投資回報。如果你想想他們面對的市場,這在某種意義上是一個無限大的可尋址市場。
一個Snap設計主管和一個高盛產品經理
Mirage的兩位創始人背景差異很大,但剛好拼成了一塊完整的拼圖。
Gaurav Misra,CEO,出生在波士頓,4歲搬回印度新德里長大。在印度,計算機科學從小學就開始教,Misra 8到10歲就跟哥哥一起編程做游戲了。后來他去波士頓大學讀了計算機科學,在學校里學了機器學習的課程。
畢業后他先后在微軟Azure團隊和幾家創業公司干過,2016年加入Snap,一待就是5年。他在Snap做到了設計工程負責人(Head of Design Engineering),這是一個融合設計和工程的混合角色,專門負責創新和新產品方向。Snap Map、Spotlight(Snap對標TikTok的短視頻產品),他都參與了。
在Snap的這5年里,Misra親眼看到了短視頻從一種內容形式變成了全球最主流的表達方式。TikTok爆發、Reels跟進、Shorts入場,短視頻吞噬了幾乎所有人的注意力。但他同時也發現,絕大多數想做短視頻的人根本不會剪輯。拍攝多次、剪輯門檻高、配音和字幕費時費力,這些摩擦攔住了大量潛在的創作者。
另一位創始人Dwight Churchill,COO,走的是完全不同的路線。他在高盛做過消費金融平臺Marcus的產品開發,是Marcus團隊的早期成員。在高盛之前,他還在Taboola做過開發,后來轉型成了產品經理。增長和商業化是他的強項,他很清楚怎么把一個產品變成一門生意。
兩個人最早在一家叫Localytics的移動分析公司認識,當時在不同團隊工作,但都留意到了同一件事:短視頻平臺正在瘋狂增長,可是做視頻的門檻完全沒有降下來。
2021年初,兩人先后離開大公司,湊在一起,花了兩天時間做出了第一個產品原型。這就是前面提到的字幕App。上線幾天沖到App Store榜首,但每個月自費超過1萬美元維護服務器,兩個人扛不住成本壓力,決定先轉向做照片社交。
后面的事情我們已經知道了。照片App拿到了融資和日活,但被遺忘的字幕App在沒有任何推廣和維護的情況下自己增長到了50萬用戶、50萬美元收入。
這個數據說明了一件事:市場在用錢投票。
Misra和Churchill反復討論之后,做了一個讓投資人和團隊都有點緊張的決定:砍掉照片分享App,所有資源轉向AI視頻。用Misra后來的話說,這是他職業生涯中機器學習、設計和快速產品原型制作完美交匯的時刻。
從管理風格來看,Misra很推崇速度和取舍。他有幾個被團隊反復引用的原則:「每個工程師每周都應該發布一個可以推向市場的東西」,如果時間不夠,就 「砍范圍,砍到再砍就沒用了為止」,以及**「作為初創公司,你的工作就是承擔技術債務」**。
公司內部有兩套產品路線圖:一套基于用戶需求,對外公開;另一套充滿實驗性的創新想法,只在內部流通。Misra認為,最大的勝利往往來自那些沒人預見到的東西。
在招人上,Mirage的標準卡得很死。Churchill曾經在LinkedIn上發布了一個帖子,2025年,公司工程崗的候選人錄取率只有0.05%。做個對比,Ramp是0.23%,Y Combinator是1%,哈佛大學本科錄取率是2.58%。
一個極度擁擠的賽道和Mirage的生存邏輯
先看看Mirage正在進入的這個市場有多大。
AI視頻編輯工具市場2024年規模約16億美元,到2030年預計將達到93億美元,復合年增長率超過42%。如果把視野放得更寬,整個AI視頻市場(包括生成、編輯、分發)在2024年就已經是112億美元 的體量,到2034年預計膨脹到2460億美元。
![]()
但數字再大,也需要有人買單。買單的人是誰?是全球超過2億的內容創作者。
高盛估算,創作者經濟在2024年的規模大約是2500億美元,預計到2027年將逼近5000億美元。這些創作者中,84%已經在使用AI工具。但同時,超過一半的創作者年收入不到1.5萬美元,這意味著他們對工具價格非常敏感。任何想在這個市場里站住腳的產品,都必須足夠便宜,或者足夠讓人覺得“值”。
市場夠大,但競爭也夠殘酷。
大廠們早就動手了。CapCut(字節跳動旗下)是Mirage在消費級市場遇到的最大對手。2025年,根據breakevenpointcalculator統計,CapCut的收入達到8.15億美元,是全球收入最高的照片和視頻應用。月活用戶超過3億,Android端下載量超10億次,在移動視頻編輯領域占據81%的市場份額。更關鍵的是,CapCut基本免費,背后還有TikTok的巨大分發渠道。
Adobe在把AI全面嵌入Premiere Pro和After Effects,Firefly Video Model已經進入公測,還支持第三方模型接入。Google通過Veo模型和YouTube Shorts生態切入。Meta也推出了免費的Edits視頻編輯應用,直接對接Instagram和Facebook的分發體系。
對用戶來說,這些功能幾乎是“順手就能用”的體驗,不用額外安裝,不用學習成本,也不用額外花錢。
創業公司這邊,競爭同樣激烈。
Runway是AI視頻生成領域的標桿,累計融了5.44億美元,最新估值30億美元,年化收入約9000萬美元。
Synthesia是企業級AI視頻的頭部,它的數字人平臺提供230多個虛擬形象,支持140多種語言,超過90%的財富100強企業是它的客戶。2025年,Synthesia甚至拒絕了Adobe一筆30億美元的收購要約。
HeyGen的客戶年增長率超過1000%,Descript年化收入接近1億美元,Opus Clip拿了超過6000萬美元融資做AI視頻裁剪。光是2025年1月以來,AI視頻領域的創業公司就總共籌集了超過5億美元的新資金。
這里有一個更深層的問題:AI視頻功能正在快速商品化。 以前需要幾個月才能做出來的功能,現在幾周就能復制。a16z合伙人Justine Moore說得很直接:下一階段的差異化不在生成層,而在“編輯層”。誰能把AI變成一個隱形的后期制作團隊,誰就能贏。
這也是Mirage從Captions改名背后更深的邏輯。它不想只做一個App,它想做一個平臺,一個讓AI端到端完成從素材到成片的工作流的平臺。CEO Misra在2026年的融資公告里說了一句很有意思的話:在AI時代,光有好產品不夠。贏在獲客效率和增長速度。
這句話可以理解為,Mirage已經意識到,在一個功能趨同、競爭越來越激烈的市場里,技術優勢的保質期越來越短。真正的護城河,可能是分發效率和資本效率的組合。
Gaurav Misra說過一句話,被反復引用:AI視頻的真正競賽還沒有開始。
放在2026年的語境下看,這句話有兩層意思。一層是樂觀的:AI視頻的市場還遠遠沒有到天花板,機會依然巨大。另一層更冷靜:目前的格局隨時可能被推翻,誰也不知道最終贏家是誰。
回看Mirage這5年的路,從兩天做出的字幕原型,到被遺忘一年半后自己長出來的產品,再到砍掉照片App全力轉向AI視頻,它的每一次關鍵轉折都來自于對市場信號的敏感捕捉。用戶用腳投票說字幕是剛需,他們就回頭做字幕。短視頻創作者需要更低門檻的生產工具,他們就把所有AI功能塞進一個App。后來發現企業也需要批量生成短視頻廣告,他們又開了Mirage Studio。
這家公司最特別的地方可能就在這里:它從來沒有什么宏大的起點,一直是被市場推著走的,但每一步都踩對了。
在AI視頻這個賽道里,大廠有錢有渠道,創業公司有速度有創意。Mirage的賭注是,在這兩者之間存在一個精確的生態位:用自研模型的技術壁壘加上全球化分發的效率,在短視頻這個最大眾、最高頻的場景里跑出來。
這個賭注能不能贏,取決于三件事:自研模型能不能持續領先、企業客戶能不能真正跑起來、全球監管收緊的環境下能不能守住合規底線。
但至少有一件事是確定的:當一個沒人管的App自己長出了50萬用戶和50萬美元收入的時候,它背后代表的那個需求,是真實的。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4856233.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.