文|周鑫雨
編輯|楊軒
一句話介紹
Buzzy(https://www.buzzy.now/)是AI內容創作公司“感知階躍”旗下的視頻編輯Agent平臺,主要面向C端內容創作者和中小型商家。
好比“視頻版的PhotoShop”,用戶只需下達自然語言指令,就能驅動Agent對視頻進行背景去除、光線修正、產品替換、背景/視角更改等編輯操作。
團隊介紹
“感知階躍”創始人兼CEO Ella Zhang(張詩瑩),曾在蘋果、Oculus VR、Google負責核心產品。
在蘋果期間,她曾為AirPods產品線創始團隊核心成員,負責產品的系統集成和全周期設計落地,包括音頻產品的架構設計、元器件選型、原理圖繪制、版圖設計、驗證以及大規模生產。
此后,張詩瑩又在Google擔任AR產品的系統架構師,負責Glass、Reflector等產品的算法和架構研發。
“感知階躍”其余核心成員,來自Adobe、小米、商湯等公司。
融資進展
近期,“感知階躍”完成了新一輪融資,金額超過2000萬美元,領投方為Redpoint(紅點創投)。深渡資本擔任本輪獨家財務顧問。
產品及業務
在張詩瑩看來,隨著視頻生成模型性能的發展,生成類的工具賽道,已經逐漸“紅海”。她將市面上的視頻創作工具,大致分成了兩類:
一類是“畫布型”產品,優點在于可以通過手動控制,保證生成結果的質量,但缺點是對大多數用戶而言,使用門檻高;另一類則是向用戶提供預制的workflow和模板,劣勢在于不夠靈活,同時,idea不夠創新。
“用戶更傾向于一次性生成整段視頻,并通過不斷迭代修改的方法來修到完美方案。所以一個指哪打哪的視頻編輯器就變成了剛需。”
當下,由于視頻的連貫性以及模型理解能力的局限性,用戶很難通過Chat的方式,對視頻進行換背景、換人物、消除某元素的“局部精修”。大多AI編輯器會改變整個畫面,接近于重新生成。
近期,“感知階躍”上線的新產品Buzzy,就是一款AI視頻編輯器,讓用戶可以像P圖一樣便捷地“P視頻”。
只需要通過Chat,Buzzy就可以對視頻完成去除背景路人、修正光線、替換產品、合拍、更改背景與視角等操作,真正實現局部精修。
![]()
△背景路人去除。左:去除后;右:去除前。圖源:受訪者供圖
![]()
△改變光線。上:改變前;下:改變后。圖源:受訪者供圖
![]()
△拍攝角度改變。左:改變后;右:改變前。圖源:受訪者供圖
做到對視頻的局部編輯、維持其余部分,技術門檻并不低。張詩瑩告訴我們,局部編輯要求視頻模型有更高的視頻和語言理解能力,“首先它要識別修改的部分到底是什么、在哪里出現,其次它還要準確理解用戶的意圖,比如prompt中的梗。”
為此,“感知階躍”基于RLHF(人類反饋強化學習),訓練了一個小模型,來增強Buzzy對視頻編輯的理解。
與此同時,Buzzy也被設計為一個能夠自主學習用戶審美和品味的Agent。
Buzzy上線了一個“類OpenClaw”的Bot。用戶可以通過掃碼,直接將Bot接入Telegram和WhatsApp中。
通過向Bot分享TikTok、YouTube上的視頻鏈接,Bot會自動分析用戶的視頻偏好和品味,基于該視頻風格24*7自動全網搜索靈感素材,并將該風格沉淀為Skill。
![]()
風格沉淀。圖源:受訪者供圖
此前,自2021年成立以來,“感知階躍”經歷了兩次內容創作產品迭代:
在Midjourney、Stable Diffusion等文生圖產品爆發之前,“感知階躍”就基于GAN(生成對抗網絡),開發出了第一款面向國內B端電商客戶的AI模特圖生成平臺ZMO.ai,并在后續將落地場景擴展到商品圖設計、編輯等場景。
![]()
ZMO.圖源:受訪者供圖
占據先發優勢的ZMO.ai,MAU一度達到了700萬。
2024年起,視頻生成賽道隨著Sora的發布,迎來了一個小爆發。在風口中,“感知階躍”叫停了ZMO.ai,并在2024年4月上線了涵蓋圖片、視頻的內容創作平臺Creati。
相較于聚焦電商、廣告圖片生成和編輯的ZMO.ai,Creati將內容創作擴展到了視頻領域,包括文生視頻、基于視頻模板二創等功能。
與此同時,它為用戶提供了移動端產品。不少非專業內容生產者,就可以直接用手機拍攝素材后,直接在App端完成內容的創作、編輯和發布,而非輾轉導入電腦。
“用戶對AI生視頻的需求,比圖片更剛一些。”張詩瑩提到,“在傳播效果上,無論在社媒端,還是廣告端,視頻都比圖片更能吸引注意力。與此同時,用戶拍視頻的難度,比做圖片高很多。”
![]()
Creati。圖源:受訪者供圖
同樣轉變的還有目標用戶。ZMO.ai的主要客戶,是國內B端的電商、廣告商。但很快,張詩瑩發現,即便ZMO.ai用戶增長很快,但流量并沒有轉化為實際的付費。
核心原因在于,其一,“大B”客戶的結款周期過長;其二,圖片的創作成本比視頻更低,因此用戶對圖片的付費意愿不夠高。
Creati則是一款面向“大C小B”的產品:C端內容創作者,以及中小商戶。張詩瑩告訴《智能涌現》,“大C小B”是付費意愿最高的人群,“更大的B端企業傾向于自研工作流”。
上線一年,Creati的全球用戶量就突破了千萬級別。產品ARR(年度經常性收入),一度達到了2000萬美金。
商業模式
靠用戶訂閱,覆蓋Token消耗成本,是目前AI軟件的主流商業模式。但張詩瑩認為,訂閱是SaaS時代的商業模式,Agent時代的商業模式應該為效果付費,而不應該為成本付費。
她告訴《智能涌現》,現階段,用戶依然將Agent視作工具,而非創造價值的人。
當Agent可以覆蓋內容生成、發布、投放、A/B Test、效果分析、二創等創作全流程,Agent的商業模式,應該與人類Agency越來越相似,“收費模式不會是訂閱,而更多會采用分傭的形式。”
Founder思考大多數非專業用戶的內容創作場景,主要在Mobile端,而非PC端。
不少商家、非專業內容創作者,習慣用手機拍攝獲取商品圖、短視頻等素材。但矛盾的是,創作工具往往集中在PC端。這就會導致內容創作鏈路的斷裂。
因此,無論Creati,還是Buzzy,我們都向用戶提供了MobileApp產品,讓素材的獲取、內容創作和編輯、發布,都可以在手機上完成。
當AI生成視頻技術足夠成熟,應用層能做的事只有兩塊:內容生成之前,以及內容生成之后。
內容生成之前,應用層解決的是產生創意的問題;內容生成之后,需要解決的是“怎么改”的問題。
應用層不應該去做模型層的事,因為模型一定會變得足夠好。
當下有很多“套殼”視頻模型能力的產品,無論是“畫布”,還是workflow,解決的都是模型能力不夠強的問題,比如“抽卡”、視頻生成長度有限。
但未來,模型層一定會解決生成質量和長度的問題。應用層的機會,就在于解決生成環節之外的問題。
未來,Skill會成為可以交易的資產。
Skill本質上是用戶沉淀下的品味、認知,以及工作流。就創作領域而言,人的審美和品味,以及掌握找素材的技能,都是有價值的。
因此未來,賣Skill可能會成為一種商業模式。
新的時代,應該獨立開發新的產品,而不是在舊產品上加上一個新入口。
Buzzy和Creati是兩代完全不同的產品。Creati聚焦生成,Buzzy聚焦生成后的編輯。不同代的產品,會形成不同的用戶心智。
所有的Go Viral(走紅)都很偶然,產品不應該過分追求Go Viral。
很多用戶剛需,其實不具備在社媒上Go Viral的潛質,比如PDF Editor,但它們的用戶量非常大。
根據我們的經驗,能夠Go Viral的產品有幾個特點:第一,產品形態、設計比較創新;第二,實用,只有解決了用戶的痛點,他們才愿意自發傳播;第三,降低用戶生產有趣內容的門檻。
歡迎交流!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.