昨天,阿里 ATH 團隊正式開啟了HappyHorse 1.0的灰度測試。
只需輸入簡單的文字描述,HappyHorse 1.0即可生成一段3s-15s長度的視頻,視頻中可以實現(xiàn)多鏡頭切換、連貫劇情等要素。
創(chuàng)作者可在阿里云百煉平臺、千問App、造點AI和HappyHorse官網(wǎng)注冊使用。
![]()
官網(wǎng)鏈接:
https://www.happyhorse.cn/
![]()
造點AI:
https://create.qianwen.com/
在HappyHorse-1.0的官網(wǎng)上,新用戶完成賬號注冊,可領(lǐng)取66積分,同時視頻生成服務(wù)享7 折權(quán)益,生成5秒720P視頻需消耗45積分,折扣后實際扣除32積分。
造點AI同樣也是45點積分,只不過沒有優(yōu)惠。
在千問APP內(nèi),每位用戶每天可獲得10點免費額度,生成一個高清、10秒的視頻會消耗2點。
![]()
HappyHorse 1.0目前支持兩個核心功能:多模態(tài)視頻生成、視頻編輯。
這意味著,它不僅可以實現(xiàn)音視頻同出,還支持在原片基礎(chǔ)上實現(xiàn)精準修改,支持上傳參考圖進行視頻編輯。
OK!廢話不多說,這匹屠榜的快樂馬實力到底如何,咱們實測見分曉。
本來想讓HappyHorse 1.0與Seedance 2.0進行PK,但可能是Seedance 2.0使用的用戶太多,生成一個視頻要10小時(難怪網(wǎng)上對它們的吐槽那么多),所以,小編將它的對手換為了可靈3.0。
復(fù)雜指令遵循和音畫同步能力
提示詞:
在一個小酒館內(nèi),一支五位成員的樂隊正在角落正演唱一首民謠,鏡頭從廣角搖鏡頭切換至中間成員特寫鏡頭,然后演唱完畢,最終定格于全體成員。
![]()
HappyHorse-1.0
可靈3.0
HappyHorse 1.0的生成速度與可靈3.0相比,略微有些遜色,大概在2分鐘左右。
從生成結(jié)果上來看,HappyHorse 1.0與可靈3.0生成的人像沒有出現(xiàn)肢體異常、扭曲等問題,鏡頭運動、畫面燈光等元素均符合提示詞要求。
只不過,HappyHorse 1.0視頻在剛開始時,小提琴在演奏,但并沒有音樂,音畫同步效果上還是有些欠缺。
多角色對話
提示詞:
電影劇本中的一幕場景,發(fā)生在灑滿陽光的巴黎咖啡館內(nèi),金色的午后陽光透過拱形窗戶傾瀉而入。一位男子身著定制深藍色西裝,坐在一位穿著飄逸深紅色連衣裙的優(yōu)雅女子坐的對面,兩人之間擺放著兩杯咖啡。空氣中彌漫著一種難以言喻的緊張氣氛。他身體前傾,聲音低沉而平穩(wěn):“你從一開始就心知肚明,不是嗎?這一切都不是真實的。”她直視著他,臉上沒有絲毫動搖,嘴角掛著一絲若有若無的微笑,緩緩攪動著手中的咖啡:“一切都是真實的。而這正是它如此危險的原因。”電影式的廣角構(gòu)圖,溫暖的金色黃昏光線,淺景深效果,膠片顆粒質(zhì)感,柔和復(fù)古色彩調(diào)配以深紅色點綴,服裝與面部表情細節(jié)豐富,黑色浪漫美學(xué)風(fēng)格,充滿情感氛圍,歐洲街頭攝影風(fēng)格,戲劇性敘事手法,35毫米膠片質(zhì)感。
![]()
HappyHorse-1.0
可靈3.0
在多角色對話的鏡頭里,Happy Horse-1.0和可靈3.0生成的視頻簡直完美。
對話銜接流暢,語調(diào)也很貼合具體情境,人物的語氣沒有了刻意模仿人類的偽人感,停頓得也恰到好處,將提示詞完美的演繹了出來,包括氛圍、人物情緒、表情等。
鏡頭語言
提示詞:
海岸緩?fù)乒湃伺e巨齒鯊的牙對光驟推面部牙齒逆光微距定格。三段遞進運鏡:側(cè)面推進→舉牙對光→驟推面部逆光定格,人物表情:眉鎖眼震撼困惑嘴微張手觸鋸齒,原始敬畏框架外,逆光冷白邊,緩?fù)企E推定格,原始敬畏,順滑過渡,保持結(jié)構(gòu)穩(wěn)定避免形變。匹配音效(強)和背景音樂(弱)。
![]()
HappyHorse-1.0
可靈3.0
HappyHorse-1.0還是有一點瑕疵,在最后人物頭后冒出的白煙有點讓人摸不到頭腦。同時在配樂上,小編認為還是可靈3.0更有感覺。
情緒和動作刻畫
提示詞:
封閉昏暗狹長走廊,少女孤身身處詭異走廊,正面仰拍,鏡頭特寫神情再展開環(huán)境,雙手收緊抱臂,眼神警惕環(huán)顧四周,腳步緩慢遲疑向前挪動,室內(nèi)弱光,局部冷光打亮,高對比暗黑色調(diào),大面積陰影,墻面暗光紋路、空氣中浮塵粒子特效,音效:空曠走廊回聲、細碎異響、壓抑懸疑背景音。少女:“這里……到底是什么地方?”
![]()
HappyHorse-1.0
可靈3.0
兩個視頻各有不足:按照提示詞,鏡頭應(yīng)該是由近到遠,而可靈3.0則是直接切的鏡頭,HappyHorse-1.0則是完全忽略了“向前挪動”,同時墻兩邊還有“鬼畫符”。
相較而言,小編更傾向于可靈3.0。
物理真實性
提示詞:
一個超高幀率的慢動作特寫鏡頭,明亮的廚房內(nèi),深色橡木餐桌邊緣,放著一只晶瑩剔透的圓柱形玻璃杯,杯中盛有滿的純凈清水,水面平靜。畫面左側(cè),一顆網(wǎng)球飛來,撞上玻璃杯底部右側(cè)。杯子受力的瞬間,與桌面產(chǎn)生相對滑動,清水表面泛起同心漣漪。杯子隨即開始傾斜墜落,摔碎在地板上。
![]()
HappyHorse-1.0
可靈3.0
在物理真實性上,HappyHorse-1.0明顯效果不如可靈3.0,雖然可靈3.0生成的視頻中,水杯降落時有些許瑕疵,但整體來看還不錯。
HappyHorse-1.0生成的視頻中,先是水直接穿模,然后杯子碎裂后卻還是完整的,水體的形態(tài)變化也十分詭異。
綜上結(jié)果來看,對比可靈3.0,HappyHorse 1.0還有一些再提升空間,如物理真實性、提示詞遵循度、文字渲染等。
但不得不說,HappyHorse 1.0在人物對話方面做的還是非常出色的,人物神情、語氣等。
目前HappyHorse 1.0也只是小試牛刀,仍在不斷進化中。 開場就能有這個成色,后面的表現(xiàn)令人期待。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.