<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      馬斯克的GPU也在摸魚?狂囤幾十萬張顯卡,只有11%在干活

      0
      分享至


      新智元報道

      編輯:元宇

      【新智元導讀】馬斯克囤了幾十萬張卡,結(jié)果只跑了11%?據(jù)媒體報道,xAI的MFU只有約11%,xAI總裁Michael Nicolls在內(nèi)部備忘錄中稱這一數(shù)字「低得尷尬」。AI競賽的KPI正從囤卡切換為把卡跑滿。

      馬斯克囤了幾十萬張卡,結(jié)果只跑了11%?

      這個數(shù)字最先被The Information曝出,后又被Business Insider根據(jù)一份xAI內(nèi)部備忘錄實錘。

      這份備忘錄出自xAI總裁Michael Nicolls之手。

      面對這個數(shù)字,他甩出四個字:低得尷尬

      The Information報道,xAI手里約有50萬張英偉達GPU,雖然xAI官方至今未公開確認,但其官網(wǎng)已寫明:Colossus集群已擴展到20萬張GPU,目標是100萬張。

      無論按哪個數(shù)字,xAI都坐擁公開披露中規(guī)模最大的AI算力集群之一。

      但根據(jù)Nicolls備忘錄,這幾十萬張GPU實際只跑出了約11%的有效訓練算力。

      Nicolls給團隊定的目標,未來幾個月內(nèi)要把這個數(shù)字拉到50%。

      從11%到50%,差的不是幾臺機器,而是一整套訓練棧。


      xAI在孟菲斯建成的Colossus集群內(nèi)部,目前已擴至20萬張GPU,目標是100萬張,是公開披露中最大的AI超算之一。

      11%不等于89%的GPU在睡覺

      很多人第一次看到「11%」這個數(shù)字,會下意識理解成「89%的GPU在睡覺」,這也是它最容易被誤讀的地方。

      11%對應(yīng)一個行業(yè)指標MFU(Model FLOPs Utilization,模型浮點運算利用率)。

      AI算力公司Lambda在白皮書里給它的定義是:MFU等于實際觀測到的FLOPS,除以GPU理論峰值FLOPS。

      換句話說,它衡量的是你買的這塊卡,在訓練這一刻,把多少理論算力真正轉(zhuǎn)化成了有效的訓練吞吐。

      它不是任務(wù)管理器里那個「GPU占用率」。GPU可以100%忙著等數(shù)據(jù)、忙著同步、忙著重新計算,但有效輸出寥寥。MFU衡量的正是那點真正干活的部分。

      這11%意味著,理論上能產(chǎn)生100份訓練吞吐的硬件,實際只跑了11份。剩下的89%不是閑著,是在做無用功,或者在等待。

      從燒錢的角度看,低MFU意味著大量電力和硬件時間消耗在通信、等待、數(shù)據(jù)搬運、重計算等環(huán)節(jié),而沒有轉(zhuǎn)化為理想狀態(tài)下的有效訓練吞吐。

      那11%在工程現(xiàn)實里到底差到什么程度?這就要看歷史對照表。

      Lambda在白皮書里提到:生產(chǎn)級LLM訓練的MFU通常落在35%到45%之間。這是正常水平。

      還有一組更犀利的對比數(shù)據(jù)來自谷歌PaLM論文。


      https://arxiv.org/pdf/2204.02311

      這篇論文有一張被廣為引用的MFU對比表:


      英偉達自己維護的訓練框架Megatron-LM,其GitHub頁面上寫明:在H100集群上訓2B到462B參數(shù)模型,MFU最高可以到47%。強擴展到4608張H100時,因為通信開銷暴露,MFU會從47%降到42%。

      把xAI的11%放進這張表里,它低于GPT-3那個被嘲笑過效率低的古早年代,也低于Gopher、MT-NLG、PaLM、Megatron-LM。

      幾乎是低于所有公開前沿訓練系統(tǒng)的下沿。

      至于低MFU的原因,Lambda也總結(jié)過。

      顯存壓力、單卡batch太小、過度的激活重計算(activation checkpointing)、把權(quán)重切得過碎的張量并行帶來的跨GPU通信開銷,任何一個都會拖累MFU。

      一位同行研究員的描述更形象:HBM顯存比加速器慢得多,芯片大量時間在等數(shù)據(jù)進來;網(wǎng)絡(luò)拓撲里任何一處瓶頸,都會拖垮幾千張卡的同步。

      業(yè)內(nèi)管這個叫「記憶墻(memory wall)」。

      11%不是單點故障,是系統(tǒng)級問題。

      這不止是xAI一家的問題

      不過,把xAI單拎出來說事,也未必公平。

      The Information報道里還提到了一位同行匿名研究員的一句評價:「跑過40%對xAI的大多數(shù)競爭對手來說也很難」。

      這是一個刺破全行業(yè)體面的問題。

      報道里提到,一些研究員為了讓自己的MFU數(shù)字「好看一點」,會反復重跑訓練實驗,人為抬高利用率。

      原因有兩個:一是怕被老板罵;二是怕GPU被調(diào)走分給別的團隊。

      這些研究員的邏輯是,我的卡現(xiàn)在確實在閑著,但我只是「在分析上一輪訓練結(jié)果,馬上就要再跑」,不能讓它被收走。

      在AI大廠里,跑分這件事不只發(fā)生在公開榜單上,也發(fā)生在內(nèi)部GPU調(diào)度系統(tǒng)里。

      xAI并不是一個硬件部署上的反面教材。The Information提到,xAI在業(yè)內(nèi)以「按英偉達推薦方式部署GPU」著稱,是模范生。

      模范生只跑了11%,說明問題不在硬件、網(wǎng)絡(luò)拓撲標準,而在更上層的訓練棧、并行策略和模型工程。

      11%這個數(shù)字,也捅破了行業(yè)心照不宣的那層窗戶紙:買卡和用卡是兩回事。

      Colossus開始把卡租出去了

      也幾乎在同一時間,xAI開始把卡租出去了。


      xAI CEO馬斯克(左)與Cursor CEO Michael Truell(右)。Cursor計劃用數(shù)萬張xAI的GPU訓練Composer 2.5。

      據(jù)Business Insider報道,編程創(chuàng)業(yè)公司Cursor將使用「數(shù)萬張xAI的GPU」來訓練它的最新編程模型Composer 2.5。

      Cursor此前估值約290億美元,近期又被曝正洽談約500億美元估值。

      如果把兩件事放在同一時間線上看,至少可以說明:在自訓效率尚未完全釋放時,把部分算力外部化,可能成為xAI攤薄基礎(chǔ)設(shè)施成本的一種選擇。

      更微妙的是xAI基礎(chǔ)設(shè)施團隊近期的人事地震。

      原基礎(chǔ)設(shè)施負責人Heinrich Küttler離職,Jake Palmer接管了物理基礎(chǔ)設(shè)施,SpaceX的Daniel Dueri被調(diào)來負責算力基礎(chǔ)設(shè)施。

      與此同時,Cursor原產(chǎn)品工程負責人Andrew Milich和Jason Ginsburg跳槽到xAI,直接向馬斯克和Nicolls匯報。

      把這些信號串起來,能看到一個正在變形的Colossus:

      它在官方敘事里是「世界最大超算」、是xAI打敗OpenAI的算力底牌;但在業(yè)務(wù)層,它正在一點點變成一座「半成品云廠商」。

      AWS、Azure、GCP靠著出租算力賺到的利潤是天文數(shù)字;CoreWeave、Lambda這種新玩家干脆圍繞租GPU建生意。

      xAI如今走的是同一條路,只不過一邊租一邊自己也得訓模型。

      自己跑不滿,就讓別人來跑,這是當代GPU資本的標準動作。

      xAI官方至今沒有正面回應(yīng)過11%這個數(shù)字,官網(wǎng)首頁仍然掛著122天建成、92天翻倍到20萬張GPU、路線圖通往100萬張GPU的官方敘事。


      xAI Colossus 122天建成,從10萬張GPU擴到20萬張只用了92天,路線圖通往100萬張。但越快擴張,訓練棧和并行策略的復雜度也越大。

      但速度有速度的代價。

      Megatron-LM公開的數(shù)據(jù)已經(jīng)給出了警告:當你把H100集群強擴展到4608張時,僅僅是通信開銷,就足以把MFU從47%拖到42%。

      這是英偉達自己的旗艦訓練框架,跑在標準化最強的硬件上。

      xAI要把卡數(shù)從20萬推到100萬,意味著通信、調(diào)度、容錯、并行策略的復雜度還可能要再漲一個數(shù)量級。

      122天建成是工程奇跡,但每一天的奇跡背后,都有一筆運維債在悄悄記賬。

      AI競賽的KPI正在切換

      過去比的是倉庫:誰先囤到H100、誰先建成超算、誰能從英偉達手里搶到下一批GB200。

      這個游戲花錢就能玩,所以馬斯克、奧特曼、扎克伯格、黃仁勛都下場了。

      現(xiàn)在比的是工程師:誰的訓練棧調(diào)得最好、誰能把每一美元GPU CapEx轉(zhuǎn)化成最多的有效token。

      這個游戲花錢解決不了,只能靠時間、人才和工程文化。

      GPU是入場券,但MFU才是真正的考驗。

      xAI雖然拿到了最大的那張入場券,但它能不能把這張券兌現(xiàn),還要看那個「低得尷尬」的數(shù)字,能不能真的拉到Nicolls所說的50%。

      參考資料:

      https://www.theinformation.com/newsletters/ai-agenda/xai-shows-hard-use-lot-gpus?rc=epv9gi

      https://arxiv.org/pdf/2204.02311

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      民航人要注意“漢坦病毒”,一空姐被感染

      民航人要注意“漢坦病毒”,一空姐被感染

      中國民航人
      2026-05-08 12:10:03
      天舟飛船為什么不回收而是墜入大海?專家:增加返回功能會擠占運貨空間,飛船大部分結(jié)構(gòu)燒蝕氣化,少量殘骸不會造成威脅

      天舟飛船為什么不回收而是墜入大海?專家:增加返回功能會擠占運貨空間,飛船大部分結(jié)構(gòu)燒蝕氣化,少量殘骸不會造成威脅

      極目新聞
      2026-05-08 21:58:00
      急瘋了!國際足聯(lián)三降轉(zhuǎn)播費求央視,6200萬紅線絕不退讓

      急瘋了!國際足聯(lián)三降轉(zhuǎn)播費求央視,6200萬紅線絕不退讓

      黑鷹觀軍事
      2026-05-08 15:32:42
      日本盜竊成風:資本異化下的道德荒漠

      日本盜竊成風:資本異化下的道德荒漠

      烽火瞭望者
      2026-05-08 09:03:59
      釣友在成都一河道發(fā)現(xiàn)大量注射器,街道辦:系用于控糖減重的注射器,已打撈,水質(zhì)檢測無異常

      釣友在成都一河道發(fā)現(xiàn)大量注射器,街道辦:系用于控糖減重的注射器,已打撈,水質(zhì)檢測無異常

      極目新聞
      2026-05-08 15:36:19
      98.6%!挪威基本沒人買油車了!

      98.6%!挪威基本沒人買油車了!

      王煜全
      2026-05-06 15:16:01
      先訪華再訪日?美方故技重施,中方斬釘截鐵,特朗普能不能來華?

      先訪華再訪日?美方故技重施,中方斬釘截鐵,特朗普能不能來華?

      有范又有料
      2026-05-08 16:07:58
      上市僅14個交易日,又一10倍股誕生!

      上市僅14個交易日,又一10倍股誕生!

      財聞
      2026-05-08 14:36:52
      5月起退休老人看病報銷大變!高血壓糖尿病老人重點看

      5月起退休老人看病報銷大變!高血壓糖尿病老人重點看

      牛鍋巴小釩
      2026-05-08 13:04:10
      3:0!3:1!世乒賽四強已出2席,日乒強勢闖關(guān),國乒決戰(zhàn)勁敵!

      3:0!3:1!世乒賽四強已出2席,日乒強勢闖關(guān),國乒決戰(zhàn)勁敵!

      隱于山海
      2026-05-09 01:36:25
      日媒:中國對日反制“正在產(chǎn)生影響”

      日媒:中國對日反制“正在產(chǎn)生影響”

      參考消息
      2026-05-08 15:36:10
      第1現(xiàn)場|紅場閱兵在即:首次取消展示重型裝備,俄再次呼吁撤離基輔

      第1現(xiàn)場|紅場閱兵在即:首次取消展示重型裝備,俄再次呼吁撤離基輔

      澎湃新聞
      2026-05-08 18:48:28
      從知名女星到廣州老板娘,一個女兒用皮肉苦力,買斷了父親的命

      從知名女星到廣州老板娘,一個女兒用皮肉苦力,買斷了父親的命

      杰絲聊古今
      2026-05-08 12:49:39
      20歲女足球員性侵14歲美國男孩!多次強奸虐待發(fā)裸照 對方還戴牙套

      20歲女足球員性侵14歲美國男孩!多次強奸虐待發(fā)裸照 對方還戴牙套

      科學發(fā)掘
      2026-05-08 16:36:59
      扎哈羅娃怒斥亞美尼亞,敦促其站在“歷史正確的一邊”

      扎哈羅娃怒斥亞美尼亞,敦促其站在“歷史正確的一邊”

      山河路口
      2026-05-08 11:01:39
      剛剛,納指大漲,再創(chuàng)歷史新高!蘋果、英偉達也創(chuàng)新高,美光科技暴漲10%;中概股多數(shù)上漲,百度漲3%

      剛剛,納指大漲,再創(chuàng)歷史新高!蘋果、英偉達也創(chuàng)新高,美光科技暴漲10%;中概股多數(shù)上漲,百度漲3%

      每日經(jīng)濟新聞
      2026-05-08 22:40:11
      亨得利希望2029年世錦賽留在謝菲爾德!特魯姆普:找不到任何理由

      亨得利希望2029年世錦賽留在謝菲爾德!特魯姆普:找不到任何理由

      世界體壇觀察家
      2026-05-08 08:12:17
      千年難遇的美人,太漂亮了,沒有一點毛病,太完美了

      千年難遇的美人,太漂亮了,沒有一點毛病,太完美了

      情感大頭說說
      2026-04-24 12:46:24
      10萬訂單:比亞迪大唐捅穿了純電大七座SUV那層沒人敢碰的窗戶紙

      10萬訂單:比亞迪大唐捅穿了純電大七座SUV那層沒人敢碰的窗戶紙

      電科技網(wǎng)
      2026-05-08 14:45:22
      誰是五一“吸金王”?這5座城市讓游客心甘情愿掏錢包

      誰是五一“吸金王”?這5座城市讓游客心甘情愿掏錢包

      曉栗
      2026-05-08 01:08:33
      2026-05-09 02:07:00
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
      15163文章數(shù) 66850關(guān)注度
      往期回顧 全部

      數(shù)碼要聞

      聯(lián)力推出DK-07木紋版升降電腦桌:整合PC支架 可安裝雙E-ATX系統(tǒng)

      頭條要聞

      外籍銀行高層在香港豪宅性虐及殺害兩女子 內(nèi)幕解密

      頭條要聞

      外籍銀行高層在香港豪宅性虐及殺害兩女子 內(nèi)幕解密

      體育要聞

      他把首勝讓給隊友,然后用一年時間還清賬單

      娛樂要聞

      古天樂被曝隱婚生子,新娘竟是她

      財經(jīng)要聞

      估值3000億 DeepSeek尋求500億元融資

      科技要聞

      SK海力士平均獎金600萬 工服成相親神器

      汽車要聞

      MG 4X實車亮相 將于5月11日開啟盲訂

      態(tài)度原創(chuàng)

      數(shù)碼
      藝術(shù)
      教育
      家居
      公開課

      數(shù)碼要聞

      華碩京東重磅新品日,華碩天選7系列游戲本開啟預約

      藝術(shù)要聞

      砸22億!OPPO在東莞建了一批“O字樓”

      教育要聞

      摒棄打壓式教育,皮格馬利翁效應(yīng)

      家居要聞

      流動的尺度 打破家的形式主義

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 亚洲精品AV久久看| 亚洲AV无码综合一区二区在线| 日本中文字幕一区二区有码在线| 一本加勒比HEZYO熟女| 亚洲国产麻豆综合一区| 久久国产欧美日韩精品图片| 九九久久精品免费观看| 久久精品私人影院免费看| 3d动漫精品啪啪一区二区下载| 国产美女视频一区二区| 中文字幕人妻熟女在线| 99蜜桃臀久久久欧美精品网站| 久久人妻系列无码一区| 日韩人妻精品无码一区二区三区| 最新成免费人久久精品| 无码人妻丰满熟妇啪啪区日韩久久| 国产精品女生自拍第一区| wwww免费网站| 亚洲视频4444| 草逼网址| 久久综合亚洲色社区| 亚洲精品无码一二区a片| 国产av一区二区三区日韩| 尹人香蕉久久99天天拍久女久 | 野花社区在线观看视频| 五月天婷婷网站| 久久夜色精品| 人妻人人做人做人人爱| 激情欧美日韩一区二区| 好吊色欧美一区二区三区视频| 国产剧情福利av一区二区| 精品无码黑人又粗又大又长| 国产一码二码三码区别| 天天操.com| 免费无遮挡无码视频在线观看| 亚洲欧洲精品国产二码| 精品人妻一区二区三区在| 无码人妻精品一区二区在线视频| 久久国产福利播放| 成人区人妻精品一熟女| 国产精品国产三级国产aⅴ下载|