看遍北京車展里里外外,叩響自動(dòng)駕駛的大門(mén),目前方法貌似只有一個(gè):
世界模型+強(qiáng)化學(xué)習(xí)。
華為乾崑智駕ADS 5、Momenta R7、輕舟乘風(fēng)Max,這三套北京車展期間發(fā)布的方案,無(wú)一例外,均搭載了這一技術(shù)組合。
華為車BU CEO靳玉志,表示ADS 5是面向“自動(dòng)駕駛”的解決方案;Momenta官方表示物理AI正從理念走向量產(chǎn)。
輕舟智能CEO于騫直接斷言,世界模型+強(qiáng)化學(xué)習(xí)是通向物理AI的必經(jīng)之路。
![]()
車展舞臺(tái)之外,世界模型+強(qiáng)化學(xué)習(xí)的身影也已無(wú)處不在。
蔚來(lái)早在2年前就推出了世界模型;地平線的HSD融合了這一技術(shù)方案。
小鵬第二代VLA、理想的MindVLA,盡管與世界模型之間存在路線分歧,但這二者的云端訓(xùn)練,仍然依托于世界模型+強(qiáng)化學(xué)習(xí)。
各家廠商的想法分歧仍在,但行動(dòng)卻十分統(tǒng)一,目標(biāo)更是一致宏大:
自動(dòng)駕駛猶嫌不足,要沖線物理AI終局。
那么這篇文章,我們就跟大家聊聊,世界模型+強(qiáng)化學(xué)習(xí)到底是什么?
看懂世界
經(jīng)過(guò)了近兩年輔助駕駛方案的迅速迭代和普及下放,L2的體驗(yàn)?zāi)壳罢谘杆仝呁?/p>
從這次北京車展就能看出,各價(jià)位車型的輔助駕駛能力都變得越發(fā)全面。
![]()
即便是七八萬(wàn)的零跑A10,也搭載了激光雷達(dá),支持車位到車位級(jí)的輔助駕駛。
至于城區(qū)領(lǐng)航、高速領(lǐng)航,如今更是遍地開(kāi)花。
但能用與好用之間,仍有巨大鴻溝。
而填平這道巨大鴻溝的關(guān)鍵,就在于補(bǔ)齊系統(tǒng)對(duì)場(chǎng)景的理解與預(yù)測(cè)能力。
這二者就恰恰決定了輔助駕駛是只能對(duì)當(dāng)下做出被動(dòng)反應(yīng),還是能像人類一樣預(yù)判未來(lái)、提前布局。
![]()
我們自己在駕駛時(shí),也并非只盯著眼前的路況機(jī)械應(yīng)對(duì)。
越是駕駛經(jīng)驗(yàn)豐富,越知道要時(shí)刻觀察周圍環(huán)境的動(dòng)態(tài),在心中推演未來(lái)幾秒可能發(fā)生的狀況,并提前做出防御性動(dòng)作。
比如前方有很多胡同口,人類駕駛員自然就會(huì)減速行駛,以防胡同里忽然竄出打鬧的小孩、騎著三輪車的老人......
這才是合理的駕駛狀態(tài),輔助駕駛依托世界模型,也正在朝這個(gè)方向進(jìn)化。
不過(guò),要合理的預(yù)測(cè),系統(tǒng)首先必須真正掌握這個(gè)世界的運(yùn)行規(guī)律,看透各種因果關(guān)系。
![]()
譬如在高速上,當(dāng)看到前方剎車燈亮成一片時(shí),你就自然猜想到可能出現(xiàn)交通事故了,然后提前剎車、打起精神觀察周圍路況,甚至打開(kāi)雙閃,提醒后方車輛及早剎車。
正是基于這種內(nèi)含上下文因果關(guān)系的邏輯,世界模型在云端根據(jù)真實(shí)的物理規(guī)律進(jìn)行仿真訓(xùn)練,才讓系統(tǒng)更清晰、更本質(zhì)地理解人類世界的運(yùn)行法則。
與此同時(shí),世界模型也能彌補(bǔ)采集數(shù)據(jù)工作的不足。
因?yàn)橛行﹫?chǎng)景全憑現(xiàn)場(chǎng)采集的話,隨機(jī)性太強(qiáng)了,比如鬼探頭、一些極端天氣,而世界模型則可以在虛擬環(huán)境中生成這種場(chǎng)景,然后進(jìn)行針對(duì)性的訓(xùn)練。
![]()
理解世界規(guī)律,只是第一步,如何讓系統(tǒng)基于這種理解,做出最優(yōu)的駕駛決策?這就輪到強(qiáng)化學(xué)習(xí)登場(chǎng)了。
強(qiáng)化學(xué)習(xí)你可以把它理解成一套獎(jiǎng)勵(lì)機(jī)制,做得符合設(shè)計(jì)目標(biāo)了就有獎(jiǎng)勵(lì),不符合就得接受懲罰。
久而久之,系統(tǒng)自己就摸索出了一套最優(yōu)駕駛策略,而不是簡(jiǎn)單機(jī)械地模仿人類司機(jī)的操作。
![]()
由此,世界模型和強(qiáng)化學(xué)習(xí)就構(gòu)建出了一個(gè)更完整的訓(xùn)練閉環(huán):
前者提供還原物理世界的訓(xùn)練場(chǎng),后者則讓系統(tǒng)日以繼夜的瘋狂特訓(xùn),把實(shí)際問(wèn)題前置,把駕駛經(jīng)驗(yàn)攢足。
這就是世界模型+強(qiáng)化學(xué)習(xí)的價(jià)值,相當(dāng)于給車裝了一顆“人腦”,它讓輔助駕駛真正去理解現(xiàn)實(shí)世界的運(yùn)行規(guī)律,最終實(shí)現(xiàn)自動(dòng)駕駛。
而這套方案其實(shí)也并不局限于自動(dòng)駕駛,本質(zhì)上,世界模型+強(qiáng)化學(xué)習(xí)就是在教機(jī)器如何去看懂世界,汽車只是最快的量產(chǎn)載體。
跟FSD比誰(shuí)更強(qiáng)?
北京車展上,Momenta將“矛頭”直指特斯拉。
Momenta CEO曹旭東在群訪上對(duì)我們直言,Momenta R7這套基于世界模型+強(qiáng)化學(xué)習(xí)的解決方案,對(duì)標(biāo)的就是特斯拉FSD V14,目標(biāo)是為中國(guó)年輕人造一臺(tái)屬于他們的特斯拉。
如今,特斯拉FSD雖尚未真正進(jìn)入中國(guó)市場(chǎng),但它卻仿佛已經(jīng)成為中國(guó)智駕玩家的“公敵”。
幾乎每一個(gè)中國(guó)智駕玩家,都在以超越FSD為己任,渴望在這場(chǎng)技術(shù)競(jìng)賽中證明自己。
![]()
事實(shí)上,特斯拉FSD與世界模型之間也有著千絲萬(wàn)縷的聯(lián)系。
去年10月,特斯拉正式官宣了神經(jīng)網(wǎng)絡(luò)世界模擬器。
它基于真實(shí)道路采集的海量數(shù)據(jù),在云端重建了一個(gè)遵循物理規(guī)律的虛擬世界,不僅能預(yù)測(cè)未來(lái)幾秒內(nèi)環(huán)境的動(dòng)態(tài)演化,還能提前評(píng)估每一種駕駛動(dòng)作可能帶來(lái)的后果。
對(duì)于那些現(xiàn)實(shí)中極難采集的長(zhǎng)尾場(chǎng)景,比如暴雪中的山路、突發(fā)事故后的混亂路口,神經(jīng)網(wǎng)絡(luò)世界模擬器也可以主動(dòng)生成,進(jìn)而虛擬世界中反復(fù)特訓(xùn)。
![]()
這與世界模型+強(qiáng)化學(xué)習(xí)的技術(shù)邏輯,幾乎如出一轍。
特斯拉的這一技術(shù)方案將同時(shí)服務(wù)于自動(dòng)駕駛和人形機(jī)器人,換句話說(shuō),世界模型+強(qiáng)化學(xué)習(xí)也是特斯拉走向物理AI的橋梁。
從技術(shù)范式上看,特斯拉與中國(guó)主流玩家之間并不存在方向性的差異。
至于孰強(qiáng)孰弱,真正的分野恐怕就在于工程落地能力。
誰(shuí)的模型推理延遲更低?誰(shuí)的博弈能力更強(qiáng)?誰(shuí)更能應(yīng)對(duì)小概率的長(zhǎng)尾場(chǎng)景?
盡管都已經(jīng)開(kāi)始聊終局了,但面向自動(dòng)駕駛和物理AI的工程落地競(jìng)賽,或許才剛剛拉開(kāi)帷幕。
技術(shù)需要天馬行空,同時(shí)也更需要腳踏實(shí)地。
物理AI終局很美好,但它最終需要建構(gòu)在資金、人才和商業(yè)閉環(huán)等基礎(chǔ)上,這注定只是少數(shù)強(qiáng)者的游戲。
對(duì)于各大AI玩家來(lái)說(shuō),跋山涉水這么多年,面對(duì)愈發(fā)宏大的藍(lán)圖,殘酷競(jìng)爭(zhēng)仍然遠(yuǎn)沒(méi)有結(jié)束。
如今,在世界模型+強(qiáng)化學(xué)習(xí)的驅(qū)使下,他們正在同一條賽道上,奔向同一個(gè)終點(diǎn)。
而在緊張刺激的角逐之中,我們所有人好像也都成為了這些強(qiáng)者游戲的一環(huán),生活或?qū)⒁驗(yàn)樽詣?dòng)駕駛、物理AI發(fā)生巨大的變化。
最終,當(dāng)物理AI從理念變成現(xiàn)實(shí),我們也不僅僅會(huì)迎來(lái)更聰明的汽車,還將處在一個(gè)更智慧的、被重新定義的物理AI世界。
人在其中又該或者又能扮演什么角色,更是一個(gè)值得討論的命題。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.