內(nèi)容提要:
前字節(jié)跳動(dòng)工程師、北大教授張池指出,中美人工智能差距并未縮小,反而在擴(kuò)大。國(guó)內(nèi)大模型沉迷于“刷榜”拿高分,實(shí)際應(yīng)用拉胯;訓(xùn)練數(shù)據(jù)質(zhì)量低、迭代周期是美國(guó)2-4倍、用戶付費(fèi)意愿弱形成負(fù)循環(huán)。那些美國(guó)名人“中國(guó)正在趕超”的論調(diào),可能只是美國(guó)企業(yè)家的“煙霧彈”。
![]()
盡管外界普遍說(shuō)我們?cè)谌斯ぶ悄茴I(lǐng)域正在趕上美國(guó),在有些領(lǐng)域可能已經(jīng)領(lǐng)先。但一位前字節(jié)跳動(dòng)工程師認(rèn)為,實(shí)際上差距正在進(jìn)一步擴(kuò)大。
周末,北京大學(xué)助理教授、研究科學(xué)家兼助理教授張池(音譯)在《進(jìn)入亞洲》播客節(jié)目中說(shuō):“我甚至不同意中國(guó)模型正在追趕的假設(shè)——我認(rèn)為我們?nèi)匀贿h(yuǎn)遠(yuǎn)落后。非常遺憾,我認(rèn)為差距正在擴(kuò)大”。
張池表示,他在字節(jié)跳動(dòng)的人工智能部門(mén)工作了大約一年,專注于人工智能模型,之后重返學(xué)術(shù)界。他表示,不否認(rèn)人工智能的中國(guó)初創(chuàng)企業(yè)在快速發(fā)展,但由于美國(guó)的發(fā)展可能更快,我們必須認(rèn)識(shí)到在我們快速發(fā)展的同時(shí),實(shí)際上差異不僅沒(méi)有縮小,反而在持續(xù)擴(kuò)大。這應(yīng)該是正確認(rèn)識(shí)我們的人工智能行業(yè)的重要的一部分。
一、中國(guó)大模型專注于如何提高基準(zhǔn)測(cè)試的得分,但在實(shí)際應(yīng)用中表現(xiàn)拉跨。
![]()
張池認(rèn)為,雖然像字節(jié)跳動(dòng)和阿里巴巴這樣的大公司開(kāi)放的大模型在基準(zhǔn)測(cè)試中得分不錯(cuò),但這并不意味著它們?cè)诂F(xiàn)實(shí)世界的應(yīng)用中表現(xiàn)同樣出色。理論上,我們的每家大型科技公司都有好的大模型。但實(shí)際上它們還不夠好。因?yàn)樵S多大模型團(tuán)隊(duì)專注于“benchmaxxing”——更注重考試成績(jī)而非實(shí)際表現(xiàn)的模型。如同于我們的一些名頭響亮的高中,專注于培訓(xùn)學(xué)生如何提高高考得分,成為考試機(jī)器,但很少注意如何提高學(xué)生的創(chuàng)造力。
字節(jié)跳動(dòng)和阿里巴巴推出了高知名度的AI模型——從像Seedance這樣的視頻生成器到像Qwen這樣的開(kāi)源系統(tǒng)——但他們也因深度偽造、版權(quán)糾紛以及這些模型在現(xiàn)實(shí)中是否經(jīng)得起考驗(yàn)而遭遇了用戶端的廣泛質(zhì)疑。
二、中美大模型在基礎(chǔ)設(shè)施和訓(xùn)練數(shù)據(jù)方面存在難以彌補(bǔ)的差距。
![]()
美國(guó)的大模型和中國(guó)大模型的基礎(chǔ)設(shè)施方面存在的巨大差距,是最公開(kāi)的差距。這種差別不僅僅表現(xiàn)在我們無(wú)法獲取先進(jìn)芯片,數(shù)據(jù)中心基礎(chǔ)設(shè)施薄弱,這些硬件的差距擺在桌面上,大家容易看到。更大地、大家看不到的差距是大模型訓(xùn)練數(shù)據(jù)質(zhì)量較低。我們的大模型無(wú)法獲得高質(zhì)量的數(shù)據(jù),訓(xùn)練數(shù)據(jù)甚至被人為污染,這是中國(guó)大模型普遍存在結(jié)構(gòu)性劣勢(shì)。
而且,訓(xùn)練大模型的數(shù)據(jù)質(zhì)量較低這一劣勢(shì)難以逆轉(zhuǎn)。因?yàn)樵斐蛇@一劣勢(shì)的兩大原因是制度性的而非技術(shù)性的。比如我們對(duì)互聯(lián)網(wǎng)普遍存在的敏感單詞的審查導(dǎo)致的語(yǔ)言污染,比如我們的大模型應(yīng)用產(chǎn)品和軟件一樣難以獲得付費(fèi)用戶,導(dǎo)致人工智能獲利模式轉(zhuǎn)向異端——如同互聯(lián)網(wǎng)時(shí)代的搜索引擎一樣利用關(guān)鍵詞獲利,導(dǎo)致訓(xùn)練數(shù)據(jù)甚至被人為污染。
邏輯上,在被污染的大模型數(shù)據(jù)面前,大模型的理論評(píng)分,有何意義?
很多人不理解我們的大多數(shù)大模型公司,為何熱衷于并依賴于從領(lǐng)先的美國(guó)模型中提取數(shù)據(jù),而非建立自己的數(shù)據(jù)管道。公開(kāi)的評(píng)論大都認(rèn)為這是一條捷徑,可以節(jié)省大模型投資。但大家忽略了其背后兩大問(wèn)題:一是依賴對(duì)美國(guó)大模型的蒸餾,一些人工智能公司可能是迫不得已,因?yàn)樗麄兎浅G宄覀兲峁┙o大模型訓(xùn)練的數(shù)據(jù)質(zhì)量堪憂。二是美國(guó)三大大模型巨頭和白宮,都在出手遏制對(duì)其大模型的蒸餾,這必然將限制我們大模型的長(zhǎng)期發(fā)展。
三、我們的大模型更新迭代的周期是美國(guó)的2-4倍。
![]()
張池說(shuō),我們大模型差距擴(kuò)大的一個(gè)關(guān)鍵問(wèn)題是速度。他說(shuō),美國(guó)頂級(jí)公司可以更快地迭代大模型。
可以確定的是,谷歌可以在三個(gè)月內(nèi)培訓(xùn)或完成一整輪LLM培訓(xùn),包括培訓(xùn)前和培訓(xùn)后。但字節(jié)跳動(dòng)和其他幾乎所有的模型迭代,周期幾乎在半年甚至一年。
我們的大模型迭代較慢,與投入有關(guān),也與用戶有關(guān)。
此外,更強(qiáng)的用戶反饋對(duì)大模型的優(yōu)化大有裨益。美國(guó)的人工智能企業(yè)也受益于更強(qiáng)的用戶反饋循環(huán)。像ChatGPT、Claude和Gemini這樣的產(chǎn)品,他們通過(guò)與用戶的持續(xù)互動(dòng)而不斷更新、不斷提升,有助于隨著時(shí)間推移優(yōu)化模型。
相比之下,中國(guó)的大模型有陷入負(fù)循環(huán)的風(fēng)險(xiǎn)。往往中國(guó)大模型起初表現(xiàn)不佳,但較少有人真正用它們做重要的事情,所以大模型的優(yōu)化和更新很難依賴于用戶的反饋,導(dǎo)致起點(diǎn)不錯(cuò)的模型難以在后續(xù)中繼續(xù)提高。而缺少用戶反饋的主要原因在于大模型使用對(duì)象中的中國(guó)企業(yè)用戶和個(gè)人用戶的現(xiàn)有收入水平,難以負(fù)擔(dān)大模型的收費(fèi),比如社交媒體中的專業(yè)創(chuàng)作者,他們從平臺(tái)獲得的收入越來(lái)越少,使用付費(fèi)的大模型大幅增加成本而難以同步增加收入。
四、不要沉迷于我們正在縮小與美國(guó)人工智能差距的幻覺(jué)中。
![]()
張池的觀點(diǎn)可能與我們媒體上一些最知名的聲音形成鮮明對(duì)比,許多人認(rèn)為我們正在迅速縮小與美國(guó)的差距,甚至可能領(lǐng)先。
我們的媒體經(jīng)常援引英偉達(dá)首席執(zhí)行官黃仁勛和特斯拉與space創(chuàng)始人馬斯克的觀點(diǎn)來(lái)證明我們?cè)谌斯ぶ悄芊矫婵梢耘c美國(guó)并駕齊驅(qū)甚至超越美國(guó)。
黃仁勛曾警告稱,美國(guó)的人工智能有落后風(fēng)險(xiǎn);而埃隆·馬斯克則表示,中國(guó)在能源和計(jì)算領(lǐng)域的優(yōu)勢(shì)可能幫助其超越競(jìng)爭(zhēng)對(duì)手。人工智能先驅(qū)杰弗里·辛頓也表示,美國(guó)的領(lǐng)先優(yōu)勢(shì)可能比表面看起來(lái)更小,并警告其可能隨著時(shí)間推移而縮小。但人們往往忽略了,這些美國(guó)的企業(yè)家和技術(shù)大拿,其表達(dá)的背后,并非對(duì)我們?nèi)斯ぶ悄馨l(fā)展水平的認(rèn)可和蓋章,指出一個(gè)假想敵,制造危機(jī)感,吸引更多的投資和政府的支持,才是他們發(fā)表這一觀點(diǎn)的唯一目的,也一直是美國(guó)企業(yè)家和官員吸引社會(huì)關(guān)注某一領(lǐng)域的基本手段。
![]()
張池的觀點(diǎn)反映了我們?nèi)斯ぶ悄苌鷳B(tài)系統(tǒng)內(nèi)部更為悲觀的觀點(diǎn)——暗示與美國(guó)的差距可能正在擴(kuò)大。但持有這一觀點(diǎn)的人可能更多,只是表達(dá)更委婉。比如阿里巴巴董事長(zhǎng)蔡崇信認(rèn)為,人工智能競(jìng)賽的勝負(fù)將更多取決于AI部署的速度,而非模型的評(píng)分實(shí)力。
三郎自2024年初開(kāi)始,也一直在使用大模型快速獲得全球和一些特定國(guó)家的經(jīng)濟(jì)數(shù)據(jù),生成文章的內(nèi)容提要,自動(dòng)校對(duì)文章的錯(cuò)字和錯(cuò)詞。從初期同時(shí)使用國(guó)內(nèi)、國(guó)外六個(gè)模型,到現(xiàn)在主要依賴ChatGPT和Google Gemini,也是因?yàn)閲?guó)內(nèi)大模型在實(shí)際應(yīng)用中太一言難盡。
三郎也持有與張池一樣的觀點(diǎn):“公平地說(shuō),我認(rèn)為沒(méi)有哪個(gè)中國(guó)人工智能公司能很快趕上美國(guó)的同類企業(yè)”。
【作者:徐三郎】
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.