![]()
2026 年 5 月 4 日,《 The Information》報道,xAI 目前只用上了其 550,000 塊 NVIDIA GPU 中的大約 11%。
而 Meta 和 Google 的 GPU 利用率可達到 43% 至 46%。
xAI 位于孟菲斯和 Colossus 的大規(guī)模 GPU 集群部署了 H100、H200 等 NVIDIA 芯片,其中還包括液冷配置,但整體利用率只有約 11%。
![]()
按這一比例計算,550,000 塊已安裝 GPU 中,實際活躍運行的約為 60,000 塊。
這個問題并非 xAI 獨有。
如何高效運行數(shù)十萬塊 GPU,已經(jīng)成為當(dāng)下 AI 行業(yè)最難的工程挑戰(zhàn)之一。隨著集群規(guī)模不斷擴大,閑置時間會迅速累積,軟件棧也越來越難跟上硬件擴張速度。
Meta 和 Google 在軟件優(yōu)化上投入很深,因此 GPU 利用率分別達到 43% 和 46%。
相比之下,xAI 的分布式訓(xùn)練網(wǎng)絡(luò)和軟件棧仍在成熟過程中,導(dǎo)致更長的空閑時間,以及數(shù)據(jù)管道中的瓶頸。
xAI 的目標(biāo)是通過后續(xù)基礎(chǔ)設(shè)施和軟件升級,將 GPU 利用率提高到 50%。隨著部分工作負(fù)載轉(zhuǎn)向更適合智能體 AI 任務(wù)的硬件,xAI 未來也可能開始對外出租其 GPU 算力。
除此之外,Elon Musk 還在加碼 Terafab 項目,計劃自研芯片,并采用 Intel 的 14A 工藝,為下一代 xAI、SpaceX 和 Tesla 的計算需求提供支持。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.