答案是,可能還會很久。對于區(qū)別主要在于是 AI 驅(qū)動、還是人驅(qū)動的 AITuber 和 VTuber 而言,商業(yè)模式不變,核心問題是,AI 到底能不能換掉中之人、多久能換掉中之人。
![]()
輿論熱炒、資本入局,但粉絲并不買賬
隨著 ChatGPT 的出現(xiàn),業(yè)界對于 AIGC 的能力的認(rèn)知也更新了,資本和創(chuàng)業(yè)者的熱情一下子被點(diǎn)高。在 4 月 16 日,我們觀察到 Twitch 上的 AITuber-Neuro-sama 僅用五個(gè)月就快速積累了 30 萬粉絲,她幾乎全能,打游戲,聊天,和粉絲互動樣樣精通,尤其她和“老父親” Vedal 相愛相殺的斗嘴場面更是笑翻了一眾看客。
而且三月初,推出過 VTuber“斗和奇跡”的日本公司 Pictoria 也成立了世界首個(gè)專注 AITuber 的事務(wù)所 AI CAST,并已經(jīng)推出了三位全新的 AITuber,開始了公司化運(yùn)營的嘗試。
AITuber,頗有一番顛覆 VTuber 行業(yè)的意味在。
但是在查看數(shù)據(jù)后我們發(fā)現(xiàn),雖然 AITuber 的熱度一度被炒得很高,但是在粉絲數(shù)據(jù)上,卻呈現(xiàn)出相反的態(tài)勢,觀眾似乎對 AITuber 不再買賬了。
AI CAST 現(xiàn)在已經(jīng)推出了三位 AITuber,“魔法少女艾曼”,“月夜野 Sama”和“朝日奈萊拉”,算上先前已經(jīng)推出的“紡粘”,AI CAST 旗下已經(jīng)有四位 AITuber 了。3 月 10 號,艾曼在 YouTube 首次直播,但到現(xiàn)在,三個(gè)月的時(shí)間只收獲了 527 個(gè)訂閱,除了初次直播之外,所有視頻和直播的觀看量不到 1000。而“月夜野 sama“也已經(jīng)推出兩周,直播三次,僅收獲 180 個(gè)粉絲訂閱。
之前,一炮而紅的 Neuro-sama 也出現(xiàn)了新鮮感和熱度下降的情況。她在 4 月 16 日粉絲數(shù)達(dá)到 30 萬,但在之后的兩個(gè)月僅漲粉 5 萬,直播和視頻觀看量等互動數(shù)據(jù)也沒有進(jìn)一步增長。盡管她在 5 月 28 日,更新了更精致的第二代 Avatar,同時(shí)也擁有了更智能的語言模型、可以呈現(xiàn)更豐富的表情和動作,但數(shù)據(jù)表現(xiàn)卻不盡人意。
![]()
Neuro-sama 和 Vedal 合體直播 | 圖片來源:YouTube
此外,觀看了 Neuro 的直播后,我們發(fā)現(xiàn)她并不是由 AI 單獨(dú)進(jìn)行直播,人類直接的參與是 Neuro-sama 直播的重要組成部分。Neuro 的直播內(nèi)容中,以聊天形式進(jìn)行的單獨(dú)直播只占不到一半。而真正吸引人的部分在于 Neuro 與人類的互動。她的直播中會定期由開發(fā)者 Vedal 或者其他 VTuber 一同出鏡,進(jìn)行聊天、玩游戲、唱歌等活動,此時(shí)的 Neuro 就開啟了“神評論”技能,時(shí)不時(shí)冒出的一句話讓人類哭笑不得,節(jié)目效果滿分。甚至,開發(fā)者 Vedal 會把維護(hù)和訓(xùn)練語音模型的代碼開發(fā)過程進(jìn)行直播,觀眾也會被修復(fù) Bug 時(shí) Neuro 的胡言亂語和 Vedal 的抓狂逗得哈哈大笑。
而根據(jù)觀看量數(shù)據(jù),有其他 VTuber 或 Vedal 參與的直播的觀看量,明顯高于 Neuro 單獨(dú)直播時(shí)的觀看量。也就是說,Neuro-sama 的爆紅離不開人類的參與,用戶觀看 Neuro,一方面出于對 AITuber 的新鮮感、一方面也有對 Vedal“養(yǎng) AI 女兒”過程的好奇,真正的 AI 單獨(dú)直播目前的吸引力,看似是不足的。
![]()
左邊兩次是 Vedal 與 Neuro 合體直播,而右邊則是 Neuro 單獨(dú)直播 | 圖片來源:Twitch
看 AITuber 直播,依然出戲
AI 直播沒有那么受歡迎的一個(gè)主要原因是情緒表達(dá)過于單一,造成了交流的不自然,觀眾難免出戲。基于現(xiàn)在的 AI 技術(shù),情緒表達(dá)主要的方式為,用預(yù)設(shè)表情表達(dá)情緒和基于語音表達(dá)情緒。在這兩個(gè)方面,AI 的表現(xiàn)是無法和人類相提并論的。
![]()
魔法少女艾曼幾種預(yù)設(shè)表情 | 圖片來源:YouTube
上圖是 AI CAST 的 AITuber 魔法少女艾曼的幾種預(yù)設(shè)表情,分別是開心,生氣,臉紅。而在直播過程中,艾曼就是通過判斷觀眾聊天的情緒,然后給出這些預(yù)設(shè)的情緒反應(yīng),豐富度不夠。
另一個(gè)例子來自 Neuro-sama,雖然她的 AI 模型現(xiàn)在來看更好一些,但是情緒表達(dá)方面仍然很不自然。以下面的畫面為例,此時(shí) Neuro 應(yīng)該是因?yàn)?Vedal 打斷了她說話而生氣,但畫面上,卻沒法體現(xiàn)出生氣的情緒。而 Vedal 套的 VTuber 皮卻能夠通過實(shí)時(shí)的動作和表情抓取,完全表現(xiàn)出有點(diǎn)無奈、有點(diǎn)不屑的情緒。
![]()
開發(fā)者 Vedal 以烏龜?shù)?VTuber的形象出現(xiàn) | 圖片來源:YouTube
在情緒與表情方面,AI 目前只能做到判斷識別觀眾傳達(dá)的情緒并表達(dá)自己的情緒,但是只能使用預(yù)設(shè)的模版表情,現(xiàn)在仍然做不到 VTuber 那樣豐富的表情,這就限制了 AI 的情緒表達(dá),沒法做到像人類一樣自然的交流。
另外一個(gè)問題來自于 AI 合成語音,與真人直播差別很大。目前 AI 語音在情緒表達(dá)方面不足是一個(gè)普遍的觀點(diǎn),AI 合成語音通常通過學(xué)習(xí)大量的語音數(shù)據(jù)并進(jìn)行情感標(biāo)注來生成語音,而與真實(shí)人聲相似的細(xì)微差別就很難進(jìn)行學(xué)習(xí),所以 AI 合成語音聽起來都缺乏真實(shí)感。同樣 AITuber 也面臨這個(gè)問題,在語音、語調(diào)、語氣方面,無法達(dá)到人類的水平。聲音作為塑造角色,與觀眾互動的主要方式,合成語音并不能令觀眾滿意。
Neuro-sama 算是被認(rèn)可的情緒豐富的 AITuber,但是整體語調(diào)依然很平,情緒的表達(dá)更多時(shí)候通過預(yù)設(shè)表情和在句末 Heart 或者 Wink 來打輔助。下面的畫面是 Neuro 出 bug 時(shí)說 heart 時(shí)的搞笑場面。而最近很火的 AI 視頻聊天 App Call Annie,無論受到質(zhì)疑、還是道歉,也是一個(gè)語調(diào)應(yīng)對所有場景。
![]()
Neuro 正在給觀眾比心 | 圖片來源:YouTube
在國內(nèi),小冰近期上線的 AI 驅(qū)動的“半藏森林”,也被各種吐槽,主要問題也集中在語音回復(fù)中情感表達(dá)困難,機(jī)器感強(qiáng)。在 1 v 1 環(huán)節(jié),都無法清楚表達(dá)情感的 AI,在直播場景下,弊端會被進(jìn)一步放大。再進(jìn)一步,技術(shù)問題仍待解決。
但即便 AITuber 的市場反饋并不好,創(chuàng)業(yè)者和資本們還是一路小跑入局。
去觀察這些公司的業(yè)務(wù),會發(fā)現(xiàn),AITuber 雖然有自己現(xiàn)在比較難解決的問題,但其本身商業(yè)模式和 VTuber 相同(直播、IP 授權(quán)、周邊銷售等等),市場需求已經(jīng)得到驗(yàn)證,而如果技術(shù)問題能得到解決,也解決了 VTuber 產(chǎn)業(yè)的最大 Bug。
這些都能從 2023 年,VTuber 產(chǎn)業(yè)首個(gè)上市公司的財(cái)報(bào)中,看出端倪。
VTuber 產(chǎn)業(yè)出現(xiàn)首家上市公司,一年收入 1.4 億美金
VTuber 作為一個(gè)已經(jīng)發(fā)展了多年的產(chǎn)業(yè),其市場認(rèn)可度、或商業(yè)模式,已經(jīng)得到了驗(yàn)證,在 2023 年也迎來了行業(yè)首家上市公司。
在 2023 年一季度統(tǒng)計(jì)的女主播在 Twitch 和 YouTube 的觀看時(shí)長排名,前 10 中有 6 位是都是 VTuber,而這其中有五位都是來自日本 VTuber 公司 Hololive production。其母公司 COVER 也于今年 3 月 27 日在東京交易所掛牌上市, 股價(jià)從上市時(shí)的 1400 日元一路飆漲,達(dá)到了 2729 日元(7 月 13 日收盤價(jià))。
而 5 月 12 日 Hololive 發(fā)布了 2023 財(cái)年(2022.4.1-2023.3.31)的財(cái)務(wù)報(bào)表,這也是該公司公布的第一份財(cái)務(wù)報(bào)表。
![]()
女主播在 Twitch 和 YouTube 的觀看時(shí)長排名(2023 年一季度) | 圖片來源:Stream Charts
2023 財(cái)年,Hololive 營業(yè)收入 1.4 億美元,相比去年增長 49.7%,凈利潤 1700 萬美元,相比去年增加了 101.6%,凈利潤率 12.14%,其他各項(xiàng)數(shù)據(jù)對比去年也都有這不錯(cuò)的增長。
![]()
2023 財(cái)年 Hololive 財(cái)務(wù)數(shù)據(jù) |圖片來源:Hololive production
從收入結(jié)構(gòu)來看,Hololive 的收入主要分 4 塊,直播及內(nèi)容收入,活動收入,產(chǎn)品銷售收入,授權(quán)及合作收入。其中,在 2023 財(cái)年直播收入僅占 31%,而且根據(jù)歷年數(shù)據(jù)這個(gè)占比有下降的趨勢。而活動、產(chǎn)品銷售、授權(quán)合作等與 IP 有關(guān)的收入占據(jù)了更大的比例,主要增長點(diǎn)也在 IP 價(jià)值。
從 Hololive 的商業(yè)模式來看,VTuber 提供的主要服務(wù)是是直播與內(nèi)容的輸出,以積累粉絲基礎(chǔ),然而從歷年的數(shù)據(jù)可以看出,隨著 IP 逐漸成熟,直播收入的占比逐年下降,基于 IP 的收入比例提升,這也解釋了利潤增幅高于收入增幅的現(xiàn)象。
這是 Hololive 走向成熟的標(biāo)志,更多地通過 IP 價(jià)值進(jìn)行變現(xiàn),而直播變成了維護(hù)和增加 IP 價(jià)值的手段。
![]()
2023財(cái)年Hololive收入組成數(shù)據(jù) |圖片來源:Hololive production
但實(shí)際上,Top 10 占其 6 的 Hololive,雖然已經(jīng)是不折不扣的頭部位置,但也有自己的問題。
繁華之下現(xiàn)問題,本土市場飽和與“中之人”風(fēng)險(xiǎn)成瓶頸
![]()
2024 財(cái)年預(yù)期數(shù)據(jù) | 圖片來源:Hololive production
在對 2024 財(cái)年的展望中營業(yè)額和凈利潤的預(yù)期增幅僅有 30%,遠(yuǎn)遠(yuǎn)低于本財(cái)年增幅,說明公司對于收入的持續(xù)高增長缺乏信心,其主要原因是日本 VTuber 市場的飽和。這種情況,從財(cái)報(bào)中的 YouTube 訂閱人數(shù)增長也可以窺見一二,日本頻道在這一年只有少量的增長,而國際頻道訂閱數(shù)增長則占了絕大部分,日本市場的增長緩慢,可能是 Hololive 調(diào)低增長預(yù)期的原因。
![]()
Hololive YouTube 頻道訂閱數(shù)據(jù)| 圖片來源:Hololive production
所以,在對下一財(cái)年目標(biāo)的闡述中,國際化是 Hololive 的主要目標(biāo),包括推出面向國際市場的 VTuber 并進(jìn)一步擴(kuò)展國際授權(quán)規(guī)模,繼續(xù)執(zhí)行“Holomeet”線下活動,擴(kuò)展到更多的國家。
另外一個(gè)問題來自“中之人”,在 Hololive 的招股書的風(fēng)險(xiǎn)提示部分也闡述了這個(gè)問題,當(dāng)“中之人”因?yàn)樨?fù)面事件影響或個(gè)人原因,活動頻率下降或無法繼續(xù)其活動時(shí),將會對 IP、內(nèi)容和商品價(jià)值造成負(fù)面影響。也就是說,雖然公司能夠通過多元業(yè)務(wù),在營收上減少對中之人直接活動的依賴,但是IP價(jià)值依然需要其維護(hù),IP 價(jià)值的降低,依然會對其他應(yīng)收造成影響。
雖然 Hololive 內(nèi)部,還沒有出現(xiàn)類似問題。但相似的情況早有出現(xiàn)。
絆愛是世界首個(gè)達(dá)到 100 萬和 200 萬 YouTube 訂閱的 VTuber,由于更換中之人的風(fēng)波被粉絲大量取關(guān)。雖然公司解決了問題,但是關(guān)注度大幅下降,粉絲的增長也停止了。陷入了空有 300 萬訂閱數(shù),但視頻播放量不足 10 萬的窘境。不久之后便宣布無限期休眠,退出了 VTuber 市場。VTuber 的價(jià)值,是和“中之人”深度綁定的,而對以公司來運(yùn)營 VTuber 業(yè)務(wù)的模式來說,這一直是一個(gè)難解之題。
![]()
絆愛告別 | 圖片來源:B 站視頻截圖
AITuber 正在一波熱,但貌似依然是“正確方向”
VTuber 這些年的發(fā)展,已經(jīng)驗(yàn)證了市場需求,Hololive 不錯(cuò)的收入與利潤率也證明了公司運(yùn)營的可能性。雖然現(xiàn)在的運(yùn)營模式,有點(diǎn)類似于 MCN,其本質(zhì)問題,也是一樣,人的變動性太大,而導(dǎo)致公司增長依然受到限制。
VTuber 相較于傳統(tǒng)經(jīng)紀(jì)公司,如果說往前了一步,那么 AITuber,雖然問題依然很多,但顯然是能夠在一定程度上找到了解決核心問題的正確方向。因此,我們可以看到 AITuber 雖然問題多多,但資本和創(chuàng)業(yè)者們依然一路小跑入局。
![]()
2023 年 AITuber 相關(guān)新聞
以最近完成融資的硅谷的初創(chuàng)公司 Hyper 為例,主要做 2 個(gè)方向的研究。
一方面,解決 VTuber 的成本問題,可以看出,Hyper 并沒有直接想要用 AI 一步替代中之人,這個(gè)方向還是比較接地氣的,可能也是相較于很多短期無法實(shí)際落地的項(xiàng)目,Hyper 能融資的一個(gè)重要原因。另一方面,就是去嘗試解決 AI 技術(shù)現(xiàn)有的應(yīng)用難題。
在硬件方面,VTuber 的成本是非常高的,進(jìn)行直播時(shí)需要專業(yè)的動作捕捉套件和一臺配置很高的電腦,才能實(shí)現(xiàn) Avatar 的實(shí)時(shí)渲染和動作呈現(xiàn)。Hyper 推出了一項(xiàng)技術(shù),只需要一臺 iPhone 和一個(gè)應(yīng)用,就可以生成一個(gè) Avatar 并進(jìn)行直播,大大降低 VTuber 的門檻。也就是說,人人都可以做 VTuber 了。
反觀以公司化運(yùn)營 VTuber 的 Hololive,則需要在“中之人”上付出高昂的成本。Hololive 的成本主要分為,演員報(bào)酬,活動成本、外包成本、其他成本。除了財(cái)年的第四季度舉辦大型線下活動“Hololive Super EXPO”會額外活動成本之外,在 2022 和 2023 財(cái)年“中之人“報(bào)酬的成本占比平均達(dá)到了 40%-50%。從歷年數(shù)據(jù)來看,當(dāng)公司的 IP 價(jià)值較低,以直播作為主要業(yè)務(wù)的時(shí)期,“中之人”報(bào)酬的成本占比更高。隨著 IP 價(jià)值的提升,更多的活動以及其他成本開始增長,但是“中之人”報(bào)酬成本仍占據(jù)很大的比例。VTuber 公司通過 IP 產(chǎn)出源源不斷的利潤,必須靠“中之人”進(jìn)行直播維護(hù)和增長 IP 的價(jià)值,同時(shí)要為此付出高昂的成本。
![]()
Hololive 歷年成本數(shù)據(jù) |圖片來源:Hololive production
而在 AI 方面,公司新推出的 Hyper AI,可以自動為用戶生成 Avatar 和 AI 語言模型內(nèi)核。這項(xiàng)功能基于 OpenAI 的 GPT 模型,由 Hyper 進(jìn)行定制化訓(xùn)練以適應(yīng)語言環(huán)境。創(chuàng)始人透露,目前它已經(jīng)可以實(shí)現(xiàn)問答和講故事的功能,未來它將可以在直播間進(jìn)行流暢互動,成為真正的 AITuber。
鑒于還沒有辦法體驗(yàn)到的產(chǎn)品,所以也無法確認(rèn)效果,而針對于現(xiàn)在比較明顯的表情生意、合成語音等問題,Hyper 也沒有特別提出。
但 Hyper 針對于虛擬直播產(chǎn)業(yè)專門去訓(xùn)練垂類模型,總算是往前前進(jìn)了一步,未來能讓不論是個(gè)人、還是公司,都有更多嘗試的可能性。而 AI 作為“中之人”,起碼在成本方面,確實(shí)能夠省下不少錢。根據(jù)現(xiàn)在所掌握的情況來看,訓(xùn)練 AI 模型的成本是顯著低于“中之人“的報(bào)酬成本。以 Vedal 的案例來看,雖然無法知道具體數(shù)字,但是開發(fā) Neuro-sama 的成本是他個(gè)人可以負(fù)擔(dān)的。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.