![]()
用戶對做出真正好的有故事性和敘事性的長視頻有非常大的需求。
5月12日,「尋酷科技SEEKOO」宣布已累計完成千萬美金級別的融資,投資方包括奇績創(chuàng)壇、Atypical Ventures和元璟資本。
今年4月中旬,尋酷科技上線了AI視頻創(chuàng)作平臺Anijam.ai。事實上,尋酷科技早在2023年就已推出了一款名為dzine.ai的產(chǎn)品,海外注冊用戶數(shù)達500萬的量級,ARR現(xiàn)約為1000萬美元。
尋酷科技聯(lián)合創(chuàng)始人兼CEO方晨指出,其認為video這個方向的空間非常大,有很多新的增量用戶,尤其是那些原來并不知道怎么做視頻的用戶都會加入進來,所以尋酷科技想去打造一款協(xié)助用戶完成視頻制作的Agent,這也是Anijam.ai誕生的初衷。
![]()
據(jù)方晨介紹,在上線不到一個月的時間內(nèi),Anijam.ai已收獲了數(shù)千名全球付費用戶,且用戶大都通過口碑傳播而來。“這主要得益于通過我們產(chǎn)品制作出來的視頻質(zhì)量比較高,從而具有傳播屬性。我們看到的一種比較強的增長方式是:Anijam.ai做出的作品在社媒上,特別是Instagram上,形成爆款、形成傳播。”
而之所以能在短時間內(nèi)獲得用戶的青睞和“真金白銀”的支持,核心原因無疑是Anijam.ai較好匹配了市場上尚未滿足的需求。
在尋酷科技兩位創(chuàng)始人方晨、王玨看來,基于上一代技術(shù)(以GAN為代表)打造的產(chǎn)品并沒有把高質(zhì)量和容易上手這兩件事統(tǒng)一起來;而在新一代技術(shù)的加持下,視頻內(nèi)容創(chuàng)作能夠?qū)崿F(xiàn)普惠且天花板非常之高。
“這個增量市場比想象中大得多得多——之前大家覺得好像有這些需求的人沒那么多,實際情況則是他們有需求、但沒有好的工具和產(chǎn)品幫助他們完成這件事。一旦有了我們這樣的新產(chǎn)品,他們的使用意愿和付費意愿是很強的。”王玨補充道。
這里不妨補充一點,尋酷科技的兩位創(chuàng)始人方晨、王玨在Adobe、字節(jié)跳動、騰訊等大廠工作多年,對專業(yè)用戶和普通用戶的需求洞察頗深————其中,聯(lián)合創(chuàng)始人兼CEO方晨曾就職于Adobe Research、字節(jié)跳動北美AI Lab和騰訊北美,擁有達特茅斯學院計算機視覺博士學位。他將生成式AI率先落地于Photoshop中,并以此打造出抖音歷史上使用量排名第二的移動端AI特效,對專業(yè)創(chuàng)作工具與億級用戶產(chǎn)品均有極深的實戰(zhàn)理解;聯(lián)合創(chuàng)始人兼CTO王玨曾擔任Adobe Research首席科學家、曠視北美研究院創(chuàng)始院長、騰訊AI Lab視覺計算中心負責人,是IEEE Fellow。其博士期間的研究成果直接促成了相關產(chǎn)品榮獲奧斯卡技術(shù)獎,技術(shù)廣泛落地于Adobe旗艦產(chǎn)品,并在曠視率先推動移動端計算影像技術(shù)大規(guī)模應用于手機廠商,成為行業(yè)標準方案,對從底層研究到工程化、產(chǎn)品化擁有全鏈路把控力。
某種程度上而言,這樣深厚的團隊背景是Anijam.ai能夠真正滿足用戶需求的重要基礎。“今天去打造一個Agent其實并不難,難的是基于在某個領域的專業(yè)知識讓幾個Agent協(xié)作起來。而如何解決這一塊的問題,關鍵就在于團隊的背景。”方晨坦言。
同時,方晨還透露,鑒于Anijam.ai產(chǎn)生的作品時長基本上都是5分鐘、10分鐘的甚至20分鐘的視頻,因為token消耗量非常大,且用戶對內(nèi)容質(zhì)量以及發(fā)布的頻率都有比較高的要求。
談及未來的發(fā)展空間時,王玨表示,假設未來尋酷科技能通過Anijam.ai把一個創(chuàng)意變成一個非常高質(zhì)量的電影,某種程度上其實就是世界模型的一種實現(xiàn)。“因為它理解了這個世界的演進、故事的演進,這就是通往更高層次的智能的一條路徑。所以從技術(shù)天花板的角度來看是非常非常高的,當然也對我們提出了更高的要求。”
“我們的愿景是讓所有想要去創(chuàng)作創(chuàng)意型視頻的人都能用到我們的Anijam.ai,并且我們期待Anijam.ai將是一款在任何地方、任何設備、任何時間都能觸達的產(chǎn)品。”方晨說道。
![]()
作為新一輪融資的投資方,元璟資本執(zhí)行董事任易強調(diào),視頻生成行業(yè)增長迅猛,用戶對做出真正好的有故事性和敘事性的長視頻有非常大的需求,而尋酷科技通過在生成模型和agent上的技術(shù)積累,通過產(chǎn)品幫助專業(yè)用戶可以快速的構(gòu)建出高質(zhì)量的視頻;在團隊方面,尋酷科技初創(chuàng)團隊來自 Adobe、騰訊、字節(jié)北美 AI Lab等頂尖機構(gòu),科研與工程落地經(jīng)驗頂尖,長期搭檔、深度互信。
“優(yōu)秀的產(chǎn)品力正在驅(qū)動尋酷科技的用戶活躍度持續(xù)攀升,元璟資本也將持續(xù)陪伴公司成長,期待尋酷科技在全球賦能更多視頻創(chuàng)作者。”任易表示。
日前,尋酷科技兩位創(chuàng)始人方晨與王玨向「IPO早知道」分享了Anijam.ai的定位、未來的發(fā)展空間以及對Agent產(chǎn)品形態(tài)的最新理解。
![]()
SEEKOO尋酷科技創(chuàng)始人方晨(右)、王玨
以下系經(jīng)「IPO早知道」整理的對話精選:
在新一代AI技術(shù)的加持下
視頻內(nèi)容創(chuàng)作能夠?qū)崿F(xiàn)普惠且天花板非常高
Q:你們公司的成立時間其實還是比較早的。
方晨:我們從2023年底開始做了一款名為dzine.ai的產(chǎn)品,海外注冊用戶數(shù)在500萬左右的量級,目前的ARR約1000萬美元。
Q:為什么今年開始做了Anijam.ai這款視頻制作的Agent產(chǎn)品?
方晨:我們之所以開始做Anijam.ai,關鍵在于我們發(fā)現(xiàn)了一個更大的新機會——video這個方向的空間非常大,有很多新的增量用戶,尤其是那些原來并不知道怎么做視頻的用戶都會加入進來,所以我們想去打造一款協(xié)助用戶完成視頻制作的Agent。
Q:應該和你們兩位創(chuàng)始人的背景比較契合。
方晨:首先,我們兩個人之前的工作履歷都是服務專業(yè)用戶,譬如我們在Adobe的時候就服務非常多專業(yè)的內(nèi)容制作用戶。后來我作為字節(jié)跳動北美AI Lab最早一批的員工,服務于純C端的創(chuàng)作者。
我們其實觀察到一點,普通用戶對制作大量精品視頻內(nèi)容、高質(zhì)量視頻內(nèi)容的需求是持續(xù)存在的。舉個例子,2022年春節(jié)的時候抖音上線了一款在手機端實時做臉部屬性變換(比如性別、年齡等)的產(chǎn)品,15天之內(nèi)的發(fā)布量就突破了3000萬,這已經(jīng)在當時排名抖音特效發(fā)布歷史排行的前三位了。
只是說,痛點在于技術(shù)本身,上一代對抗生成網(wǎng)絡(GAN)技術(shù)所呈現(xiàn)出的產(chǎn)品效果相對一般,可能也就在及格線的水平。在我們看來,在新一代技術(shù)的加持下,視頻內(nèi)容創(chuàng)作是能夠?qū)崿F(xiàn)普惠的,這件事不可阻擋且天花板非常高。
這里我也可以分享一個細節(jié),在我們做上一款產(chǎn)品的時候其實訪談過不少海外用戶,其中既有專門從事視頻制作的用戶,也有很多非專業(yè)的,比如網(wǎng)文作家、學生、視頻愛好者等等,他們的需求也非常強烈。在技術(shù)的加持下,很多原先非專業(yè)的用戶都會加入到內(nèi)容創(chuàng)作領域里來。即使是那些專業(yè)用戶,就算是大牌的導演、制片人,他們也希望有能力孵化一些自己的IP,而這種項目又沒辦法高成本地去請一個專業(yè)團隊來進行制作,所以他們也需要 AI工具的幫忙。
Agent對生產(chǎn)力軟件的交互是革命性的影響
基于專業(yè)知識讓幾個Agent協(xié)作起來是難點
Q:為什么選擇了Agent這個產(chǎn)品形態(tài)?或者說Agent這個產(chǎn)品形態(tài)為什么能解決行業(yè)痛點?
方晨:我個人看法的是這樣的。在過去,制作一段視頻內(nèi)容是需要一個團隊協(xié)作完成的,或者至少也是一個內(nèi)容創(chuàng)作者身兼數(shù)職來完成整個過程,是分階段的工作流程。而這件事情剛好契合了Agent 這個產(chǎn)品形態(tài),我們的產(chǎn)品相當于打造了一個“Agent團隊”,每一個Agent都擅長于其中一個步驟,同時Agent之間互相有編排。在這個過程中,用戶要是覺得哪一個地方不好,系統(tǒng)會自動地讓負責那一塊工作Agent啟動去完成修改。一句話總結(jié)的話,Agent能夠很好地模擬或者說實現(xiàn)原先一個團隊才能提供的服務。
另外有一個比較容易忽視的點,坦白講今天去打造一個Agent其實并不難,難的是基于在某個領域的專業(yè)知識讓幾個Agent協(xié)作起來。而如何解決這一塊的問題,關鍵就在于團隊的背景,我們的團隊背景相對來講就比較深厚,能夠真正打造出一個Agent團隊、滿足用戶想要的內(nèi)容。
![]()
王玨:我補充一點我的看法。我們在Adobe工作了比較長的時間,發(fā)現(xiàn)上一代甚至更早的技術(shù)往往最后會出現(xiàn)一個兩極分化的現(xiàn)象——要么這個工具非常完備也非常復雜,但只有非常少的人能夠去學習使用;要么這個工具比較簡潔但沒法做出來高質(zhì)量的專業(yè)內(nèi)容。舉個例子的話,Photoshop就是非常復雜的,Canva就是比較簡潔的有大量模板。總之上一代的技術(shù)很難把高質(zhì)量和容易上手這兩件事統(tǒng)一起來。
Agent的出現(xiàn),實際上對設計軟件的交付,乃至生產(chǎn)力軟件的交互都是一個革命性的影響。在使用Agent的過程中,用戶不需要花很多的時間和精力去思考下一步要用什么工具、這個工具放在哪、怎么去用它,創(chuàng)作者可以沿著自己的創(chuàng)作思維去思考這個事情,整個創(chuàng)作流程會更加順暢,門檻會更低,但同時能保證最終的質(zhì)量還不錯。當然,現(xiàn)在也不能馬上達到專業(yè)用戶很長時間做出的產(chǎn)品,但是至少可以做出一個用戶相對比較滿意的結(jié)果。并且,隨著Agent技術(shù)的提升,未來產(chǎn)品的質(zhì)量必然會越來越高。所以得益于Agent的出現(xiàn),創(chuàng)作的過程和以前已經(jīng)是一個完全不一樣的范式了。
產(chǎn)品面向沒那么專業(yè)的創(chuàng)作者群體
早期用戶大都通過口碑傳播而來
Q:Sora關停了,市場對于視頻生成領域的觀點褒貶不一,你們和文生視頻這類產(chǎn)品的本質(zhì)區(qū)別是什么?
方晨:使用文生視頻或是圖生視頻的用戶,他們直接去調(diào)用相對底層的模型,模型能夠提供給用戶的更像是一個渲染器或者說一個打印機,是需要用戶把他想要的畫面描述得非常清楚,那部分用戶可能是非常專業(yè)的用戶。而我們其實更多面向的是那些制作視頻或者動畫沒有那么專業(yè)、不知道怎樣使用一些表現(xiàn)手法、不太懂如何敘事、不太擅長使用一些底層剪輯工具的用戶。
Q:目前的用戶畫像是怎樣的?
方晨:我們Anijam.ai上線不到一個月的時間就已經(jīng)了數(shù)千名付費用戶,大致分為兩類:其一、做教育類視頻的,以YouTube博主為主,他們需要有很多的大量的視頻去起號、吸引觀看;其二、做廣告類視頻的,主要是宣傳自己產(chǎn)品,這些產(chǎn)品的表現(xiàn)手法不一定需要那種寫實的視頻。有一些大品牌也是,他們通過更加豐富的藝術(shù)手法去做視頻。
Q:種子用戶以及早期階段的用戶是如何獲得的?
方晨:我們的用戶大都是口碑傳播而來的,這主要得益于通過我們產(chǎn)品制作出來的視頻質(zhì)量比較高,從而具有傳播屬性。我們看到的一種比較強的增長方式是:Anijam.ai做出的作品在社媒上,特別是Instagram上,形成爆款、形成傳播。
另一方面,我們的產(chǎn)品是多端的,既有手機端也有電腦端,所以我們看到手機端的這部分用戶很好地承接了設備帶來的流量,大量的用戶是從手機端過來,并且在手機端通過簡單的對話,就像跟ChatGPT對話一樣完成制作。同時,更高質(zhì)量的內(nèi)容是在PC端進入創(chuàng)作的第二階段,也就是在PC端完成進一步創(chuàng)作,這是我們目前看到的一個趨勢。
用戶量級和token消耗量遠比大家想象中大
海外市場有自己獨特的發(fā)展空間
Q:投資人有對你們的天花板產(chǎn)生過質(zhì)疑嗎?
方晨:首先,就像我之前提到的,用戶的量級遠比大家想象中大。
其次,付費用戶的token消耗量非常高,我們Anijam.ai這款產(chǎn)品的token消耗量遠高于我們之前做的那款產(chǎn)品。因為Anijam.ai不是幫助用戶做時長在十幾秒的視頻,很多用戶做的是5分鐘、10分鐘、甚至20分鐘的視頻。所以一個視頻做下來,對token的需求量是非常大的。同時,這種用戶會不斷持續(xù)地燒token,因為他們對內(nèi)容質(zhì)量以及發(fā)布的頻率都有比較高的要求。
整體而言,我們用戶的畫像是非常多元化的,各種各樣的背景、各種各樣的行業(yè)、各種各樣的需求。我們認為,Anijam.ai這類產(chǎn)品的天花板遠高于Vibe Coding類的產(chǎn)品,其實真正coding的人并不多。
王玨:我還是想強調(diào)那一點,增量市場比想象中大得多得多——之前大家覺得好像有這些需求的人沒那么多,實際情況則是他們有需求、但沒有好的工具和產(chǎn)品幫助他們完成這件事。一旦有了我們這樣的新產(chǎn)品,他們的使用意愿和付費意愿是很強的。
Q:你們的產(chǎn)品專注海外市場有哪些大家容易忽視的想象空間?
王玨:首先,海外用戶對個性化的需求比較強。舉個例子,我們的動畫有角色,他們更傾向使用一些比較容易被人記住的形象,而不是通用的一些形象,這種個性化的需求實際上也會刺激他們的創(chuàng)作。其次,從故事創(chuàng)意的角度來講,海外用戶會有很多很好的創(chuàng)意,整體水平會比較強。
方晨:另外有一點,Anijam.ai著眼全球化,不光面向歐美。即使在歐美、甚至即使在美國,文化也比較多元,每一種文化都想要去講述自己的故事,去為自己的文化發(fā)聲,這個訴求可能是在國內(nèi)體會不到的。
接下來迭代速度與占領用戶心智尤為關鍵
要讓想進行創(chuàng)作視頻的人都能用上這款產(chǎn)品
Q:你們Anijam.ai這款產(chǎn)品的壁壘有哪些?Agent產(chǎn)品被詬病的一點在于“護城河”沒有那么深。
方晨:對我們而言,有兩件事比較重要:
第一、Anijam.ai生成出來的視頻質(zhì)量一定要非常高,即我們的Agent需要特別聰明,我們前期就已經(jīng)花了很大的精力去讓我們的Agent能夠達到專業(yè)導演的水準。目前我們評估下來,我們的成片質(zhì)量在行業(yè)里最好的,特別是在講故事這個能力上我們是最好的,我們的目標是長期保持在行業(yè)最前沿。
第二、mobile first。我們認為之后的創(chuàng)作會以Agent對話為主,那么相應的那些專業(yè)的工具都會走到幕后。所以我們從設備平臺的選擇上,以及整體產(chǎn)品的交互上都會往這個方向去走。目前,我們其實看到海外的一些競品工具,更多還是以服務為主。我們希望能有足夠的差異化,我們要更加面向未來。
王玨:說實話,今天的Agent還沒有辦法像一個高水平的導演一樣把這個故事講得非常好的。也就是說從未來的發(fā)展來看,我覺得我們的產(chǎn)品提升空間還是非常大的,或者說可擴展性是非常大的——我們的Agent首先要有對故事的理解、對視覺元素的理解、對情感的理解、節(jié)奏的理解,某種程度而言我們要把這個Agent 變成一個真正專業(yè)的導演團隊。從這個角度來看,技術(shù)的發(fā)揮空間很大,現(xiàn)階段我們處于一個比較領先的身位,我們要持續(xù)保持領先。
可以設想一下,假設未來我們真的能通過我們的Agent把一個創(chuàng)意變成一個非常高質(zhì)量的電影,某種程度上其實就是世界模型的一種實現(xiàn)。因為它理解了這個世界的演進、故事的演進,這就是通往更高層次的智能的一條路徑。所以從技術(shù)天花板的角度來看是非常非常高的,當然也對我們提出了更高的要求。
Q:在接下來的產(chǎn)品演化迭代過程中,優(yōu)先級更高的是什么?
王玨:速度無疑是非常重要的。當越來越多的用戶使用我們的產(chǎn)品后,我們也能從用戶的使用習慣和使用數(shù)據(jù)里沉淀出一些更專業(yè)的知識,從而把整個飛輪跑起來,反哺我們在技術(shù)上能夠?qū)崿F(xiàn)用戶最想要的效果。
在AI時代,我想很難有絕對的技術(shù)壁壘,往往都是暫時性的、階段性的領先。我們?nèi)绻龅酶纭⒆龅酶欤覀兙透袡C會占領這個用戶群體的心智,后續(xù)我們發(fā)展自然就會越來越好。
方晨:在搶占先機的同時,我們當下非常關鍵的一點是要獲得我們的用戶、也就是那些創(chuàng)作者的信賴。如果當這些創(chuàng)作者想要去制作視頻的時候,第一時間想到的就是我們的Anijam.ai,或者說他們心中最便捷的方法就是在Anijam.ai上創(chuàng)作,那我想后續(xù)無論是其他的大廠或者創(chuàng)業(yè)公司,再想把他們轉(zhuǎn)化成自己的用戶,這個難度就會比較大。
Q:你們對Anijam.ai這款產(chǎn)品的長期期待是什么?
方晨:我們的愿景是讓所有想要去創(chuàng)作創(chuàng)意型視頻的人都能用到我們的Anijam.ai,并且我們期待Anijam.ai將是一款在任何地方、任何設備、任何時間都能觸達的產(chǎn)品。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.