網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

一位前大模型工程師認(rèn)為，我們?nèi)斯ぶ悄芘c美國(guó)的差距還在擴(kuò)大

2026-04-26 21:56:02　來(lái)源: 火星宏觀

湖南舉報(bào)

分享至

內(nèi)容提要：

前字節(jié)跳動(dòng)工程師、北大教授張池指出，中美人工智能差距并未縮小，反而在擴(kuò)大。國(guó)內(nèi)大模型沉迷于“刷榜”拿高分，實(shí)際應(yīng)用拉胯；訓(xùn)練數(shù)據(jù)質(zhì)量低、迭代周期是美國(guó)2-4倍、用戶付費(fèi)意愿弱形成負(fù)循環(huán)。那些美國(guó)名人“中國(guó)正在趕超”的論調(diào)，可能只是美國(guó)企業(yè)家的“煙霧彈”。

盡管外界普遍說(shuō)我們?cè)谌斯ぶ悄茴I(lǐng)域正在趕上美國(guó)，在有些領(lǐng)域可能已經(jīng)領(lǐng)先。但一位前字節(jié)跳動(dòng)工程師認(rèn)為，實(shí)際上差距正在進(jìn)一步擴(kuò)大。

周末，北京大學(xué)助理教授、研究科學(xué)家兼助理教授張池（音譯）在《進(jìn)入亞洲》播客節(jié)目中說(shuō)：“我甚至不同意中國(guó)模型正在追趕的假設(shè)——我認(rèn)為我們?nèi)匀贿h(yuǎn)遠(yuǎn)落后。非常遺憾，我認(rèn)為差距正在擴(kuò)大”。

張池表示，他在字節(jié)跳動(dòng)的人工智能部門(mén)工作了大約一年，專注于人工智能模型，之后重返學(xué)術(shù)界。他表示，不否認(rèn)人工智能的中國(guó)初創(chuàng)企業(yè)在快速發(fā)展，但由于美國(guó)的發(fā)展可能更快，我們必須認(rèn)識(shí)到在我們快速發(fā)展的同時(shí)，實(shí)際上差異不僅沒(méi)有縮小，反而在持續(xù)擴(kuò)大。這應(yīng)該是正確認(rèn)識(shí)我們的人工智能行業(yè)的重要的一部分。

一、中國(guó)大模型專注于如何提高基準(zhǔn)測(cè)試的得分，但在實(shí)際應(yīng)用中表現(xiàn)拉跨。

張池認(rèn)為，雖然像字節(jié)跳動(dòng)和阿里巴巴這樣的大公司開(kāi)放的大模型在基準(zhǔn)測(cè)試中得分不錯(cuò)，但這并不意味著它們?cè)诂F(xiàn)實(shí)世界的應(yīng)用中表現(xiàn)同樣出色。理論上，我們的每家大型科技公司都有好的大模型。但實(shí)際上它們還不夠好。因?yàn)樵S多大模型團(tuán)隊(duì)專注于“benchmaxxing”——更注重考試成績(jī)而非實(shí)際表現(xiàn)的模型。如同于我們的一些名頭響亮的高中，專注于培訓(xùn)學(xué)生如何提高高考得分，成為考試機(jī)器，但很少注意如何提高學(xué)生的創(chuàng)造力。

字節(jié)跳動(dòng)和阿里巴巴推出了高知名度的AI模型——從像Seedance這樣的視頻生成器到像Qwen這樣的開(kāi)源系統(tǒng)——但他們也因深度偽造、版權(quán)糾紛以及這些模型在現(xiàn)實(shí)中是否經(jīng)得起考驗(yàn)而遭遇了用戶端的廣泛質(zhì)疑。

二、中美大模型在基礎(chǔ)設(shè)施和訓(xùn)練數(shù)據(jù)方面存在難以彌補(bǔ)的差距。

美國(guó)的大模型和中國(guó)大模型的基礎(chǔ)設(shè)施方面存在的巨大差距，是最公開(kāi)的差距。這種差別不僅僅表現(xiàn)在我們無(wú)法獲取先進(jìn)芯片，數(shù)據(jù)中心基礎(chǔ)設(shè)施薄弱，這些硬件的差距擺在桌面上，大家容易看到。更大地、大家看不到的差距是大模型訓(xùn)練數(shù)據(jù)質(zhì)量較低。我們的大模型無(wú)法獲得高質(zhì)量的數(shù)據(jù)，訓(xùn)練數(shù)據(jù)甚至被人為污染，這是中國(guó)大模型普遍存在結(jié)構(gòu)性劣勢(shì)。

而且，訓(xùn)練大模型的數(shù)據(jù)質(zhì)量較低這一劣勢(shì)難以逆轉(zhuǎn)。因?yàn)樵斐蛇@一劣勢(shì)的兩大原因是制度性的而非技術(shù)性的。比如我們對(duì)互聯(lián)網(wǎng)普遍存在的敏感單詞的審查導(dǎo)致的語(yǔ)言污染，比如我們的大模型應(yīng)用產(chǎn)品和軟件一樣難以獲得付費(fèi)用戶，導(dǎo)致人工智能獲利模式轉(zhuǎn)向異端——如同互聯(lián)網(wǎng)時(shí)代的搜索引擎一樣利用關(guān)鍵詞獲利，導(dǎo)致訓(xùn)練數(shù)據(jù)甚至被人為污染。

邏輯上，在被污染的大模型數(shù)據(jù)面前，大模型的理論評(píng)分，有何意義？

很多人不理解我們的大多數(shù)大模型公司，為何熱衷于并依賴于從領(lǐng)先的美國(guó)模型中提取數(shù)據(jù)，而非建立自己的數(shù)據(jù)管道。公開(kāi)的評(píng)論大都認(rèn)為這是一條捷徑，可以節(jié)省大模型投資。但大家忽略了其背后兩大問(wèn)題：一是依賴對(duì)美國(guó)大模型的蒸餾，一些人工智能公司可能是迫不得已，因?yàn)樗麄兎浅Ｇ宄覀兲峁┙o大模型訓(xùn)練的數(shù)據(jù)質(zhì)量堪憂。二是美國(guó)三大大模型巨頭和白宮，都在出手遏制對(duì)其大模型的蒸餾，這必然將限制我們大模型的長(zhǎng)期發(fā)展。

三、我們的大模型更新迭代的周期是美國(guó)的2-4倍。

張池說(shuō)，我們大模型差距擴(kuò)大的一個(gè)關(guān)鍵問(wèn)題是速度。他說(shuō)，美國(guó)頂級(jí)公司可以更快地迭代大模型。

可以確定的是，谷歌可以在三個(gè)月內(nèi)培訓(xùn)或完成一整輪LLM培訓(xùn)，包括培訓(xùn)前和培訓(xùn)后。但字節(jié)跳動(dòng)和其他幾乎所有的模型迭代，周期幾乎在半年甚至一年。

我們的大模型迭代較慢，與投入有關(guān)，也與用戶有關(guān)。

此外，更強(qiáng)的用戶反饋對(duì)大模型的優(yōu)化大有裨益。美國(guó)的人工智能企業(yè)也受益于更強(qiáng)的用戶反饋循環(huán)。像ChatGPT、Claude和Gemini這樣的產(chǎn)品，他們通過(guò)與用戶的持續(xù)互動(dòng)而不斷更新、不斷提升，有助于隨著時(shí)間推移優(yōu)化模型。

相比之下，中國(guó)的大模型有陷入負(fù)循環(huán)的風(fēng)險(xiǎn)。往往中國(guó)大模型起初表現(xiàn)不佳，但較少有人真正用它們做重要的事情，所以大模型的優(yōu)化和更新很難依賴于用戶的反饋，導(dǎo)致起點(diǎn)不錯(cuò)的模型難以在后續(xù)中繼續(xù)提高。而缺少用戶反饋的主要原因在于大模型使用對(duì)象中的中國(guó)企業(yè)用戶和個(gè)人用戶的現(xiàn)有收入水平，難以負(fù)擔(dān)大模型的收費(fèi)，比如社交媒體中的專業(yè)創(chuàng)作者，他們從平臺(tái)獲得的收入越來(lái)越少，使用付費(fèi)的大模型大幅增加成本而難以同步增加收入。

四、不要沉迷于我們正在縮小與美國(guó)人工智能差距的幻覺(jué)中。

張池的觀點(diǎn)可能與我們媒體上一些最知名的聲音形成鮮明對(duì)比，許多人認(rèn)為我們正在迅速縮小與美國(guó)的差距，甚至可能領(lǐng)先。

我們的媒體經(jīng)常援引英偉達(dá)首席執(zhí)行官黃仁勛和特斯拉與space創(chuàng)始人馬斯克的觀點(diǎn)來(lái)證明我們?cè)谌斯ぶ悄芊矫婵梢耘c美國(guó)并駕齊驅(qū)甚至超越美國(guó)。

黃仁勛曾警告稱，美國(guó)的人工智能有落后風(fēng)險(xiǎn)；而埃隆·馬斯克則表示，中國(guó)在能源和計(jì)算領(lǐng)域的優(yōu)勢(shì)可能幫助其超越競(jìng)爭(zhēng)對(duì)手。人工智能先驅(qū)杰弗里·辛頓也表示，美國(guó)的領(lǐng)先優(yōu)勢(shì)可能比表面看起來(lái)更小，并警告其可能隨著時(shí)間推移而縮小。但人們往往忽略了，這些美國(guó)的企業(yè)家和技術(shù)大拿，其表達(dá)的背后，并非對(duì)我們?nèi)斯ぶ悄馨l(fā)展水平的認(rèn)可和蓋章，指出一個(gè)假想敵，制造危機(jī)感，吸引更多的投資和政府的支持，才是他們發(fā)表這一觀點(diǎn)的唯一目的，也一直是美國(guó)企業(yè)家和官員吸引社會(huì)關(guān)注某一領(lǐng)域的基本手段。

張池的觀點(diǎn)反映了我們?nèi)斯ぶ悄苌鷳B(tài)系統(tǒng)內(nèi)部更為悲觀的觀點(diǎn)——暗示與美國(guó)的差距可能正在擴(kuò)大。但持有這一觀點(diǎn)的人可能更多，只是表達(dá)更委婉。比如阿里巴巴董事長(zhǎng)蔡崇信認(rèn)為，人工智能競(jìng)賽的勝負(fù)將更多取決于AI部署的速度，而非模型的評(píng)分實(shí)力。

三郎自2024年初開(kāi)始，也一直在使用大模型快速獲得全球和一些特定國(guó)家的經(jīng)濟(jì)數(shù)據(jù)，生成文章的內(nèi)容提要，自動(dòng)校對(duì)文章的錯(cuò)字和錯(cuò)詞。從初期同時(shí)使用國(guó)內(nèi)、國(guó)外六個(gè)模型，到現(xiàn)在主要依賴ChatGPT和Google Gemini，也是因?yàn)閲?guó)內(nèi)大模型在實(shí)際應(yīng)用中太一言難盡。

三郎也持有與張池一樣的觀點(diǎn)：“公平地說(shuō)，我認(rèn)為沒(méi)有哪個(gè)中國(guó)人工智能公司能很快趕上美國(guó)的同類企業(yè)”。

【作者：徐三郎】

聲明：個(gè)人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.