<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      硅谷深陷算力荒:H200一夜?jié)q價(jià)30%,H100搶到缺貨,Karpathy也未能幸免

      0
      分享至


      作者 | 四月

      2026 年 5 月的硅谷,對于 AI 算力的“饑荒”和焦慮,正達(dá)到一個(gè)前所未有的高度。

      哪怕那些站在算力中心的人,也不得不開始為算力排隊(duì)。

      在英偉達(dá),負(fù)責(zé)應(yīng)用深度學(xué)習(xí)研究團(tuán)隊(duì)的 Bryan Catanzaro 找黃仁勛申請訓(xùn)練卡。最近大家一直抱怨卡不夠用,受限太多。

      “不好意思,那些卡已經(jīng)賣掉了”,這是老黃給出的回復(fù)。

      Catanzaro 是英偉達(dá)的大功臣。十多年前,正是他留意到,GPU 迎來了首批 AI 買家——研究員,且?guī)缀醑偪駫哓洝;谶@個(gè)洞察,老黃才下定決心把整間公司押注 AI 賽道。

      當(dāng)年幫英偉達(dá)賭對算力卡的人,現(xiàn)在卻買不到自家的 GPU 了。

      而比“賣鏟子的沒鏟子了”更戲劇性的事,還發(fā)生在谷歌。

      去年夏天,DeepMind 的研究員 Andrew Dai 判斷,視覺推理是個(gè)值得做的方向。于是向公司內(nèi)部提了一批 TPU 的資源需求。

      但申請遲遲未批。拒絕的理由,倒不是研究方向不夠好,而是項(xiàng)目不能為下一代的 Gemini 服務(wù)。當(dāng)時(shí)的內(nèi)部原則是,資源應(yīng)該優(yōu)先流向付費(fèi)客戶和旗艦?zāi)P汀?/p>

      “在谷歌內(nèi)部,每一塊 TPU 的背后,都有三位競爭者”,華盛頓大學(xué)計(jì)算機(jī)系的榮譽(yù)教授 Oren Etzioni 聊到。現(xiàn)實(shí)很殘酷,如果你的項(xiàng)目不能直接帶來收入,你就是在和付費(fèi)客戶搶資源。

      Dai 最終選擇離職創(chuàng)業(yè)。和他做出同樣選擇的,還有 Anna Goldie。

      有趣的是,谷歌用來挽留 Goldie 的籌碼不是加薪,也不是期權(quán),而是——更多的 TPU 算力卡。

      但 Goldie 還是走了,還拿到了 3.35 億美元的融資,“這筆錢能買到的算力,和當(dāng)初 DeepMind 挽留我開出的條件,幾乎相當(dāng)。”

      當(dāng)大廠圍墻內(nèi)的算力變成一種“組織權(quán)限”,出走就成了唯一解。

      而在圍墻之外,獨(dú)立開發(fā)者和研究員面對的,是比“GPU 短缺”更難的處境:連卡都租不到。

      這事已經(jīng)迫切到什么程度了呢?


      這兩天,AI 大神 Andrej Karpathy 都忍不住發(fā)帖吐槽。他表示,在錄制 nanochat 教學(xué)視頻時(shí),才突然意識到,如果實(shí)驗(yàn)的第一步是,讓學(xué)員“從云平臺(tái)啟動(dòng)一臺(tái) 8×H100 的服務(wù)器”,那么絕大部分人將倒在起跑線上。

      有大神出來喊話,評論區(qū)迅速變成大型比慘現(xiàn)場。

      H100 搶不到,H200 一夜?jié)q價(jià) 30%


      看這話問得,顯然是我方友軍無疑了。


      有人補(bǔ)刀,其實(shí)真正的第一步,還不是啟動(dòng) Server,而是求爺爺告奶奶等 quota approval。 現(xiàn)在大多數(shù)的普通用戶,是連 8×H100 的預(yù)審批權(quán)限都沒有的。




      更有開發(fā)者直接曬后臺(tái)截圖:RunPod 上多種 GPU 型號顯示 unavailable;Azure 上 H100 虛擬機(jī)啟動(dòng)失敗,提示 capacity 不足;Google Colab 選擇 GPU 后,被系統(tǒng)自動(dòng)降檔到 G4。


      Rohan Bansal 看著賬戶里僅存的兩個(gè) H100 實(shí)例,發(fā)了條推文:“holding on for dear life”。

      如果說資源緊缺必然導(dǎo)致價(jià)格上漲,尚可理解。但這漲價(jià)的姿勢未免也有些詭異。

      正常的邏輯是,新一代出來,舊款降價(jià)。B200 已經(jīng)穩(wěn)定供貨,四年前的 H100 也理應(yīng)降價(jià)。


      但 SemiAnalysis 數(shù)據(jù)顯示,H100 一年期的合約租金,半年漲了近 40%(從 2025 年 10 月的 $1.70/ 小時(shí),漲到 2026 年 3 月的 $2.35)。


      現(xiàn)貨市場更夸張,lambda 的報(bào)價(jià)已上浮到 4 美元 +/ 小時(shí),是兩年前的兩倍。而 H200 的現(xiàn)貨價(jià)格甚至比新一代 B200 還要貴。"這價(jià)格是兩年前的兩倍還多,而且通常很難搶到,要寫腳本盯著 API 才有機(jī)會(huì)。"


      圖注:從 4.96 美元 / 小時(shí)漲到 6.40 美元 / 小時(shí),漲幅 29%;而更新一代的 B200 為 5.68 美元 /GPU 小時(shí)。

      5% 的利用率和 B200 的倒掛

      一邊是高端 GPU 緊缺,一邊卻是算力中心里的利用率低得令人發(fā)指。

      Cast AI 的報(bào)告顯示,不少大企業(yè) GPU 集群的平均利用率只有 5% 左右。此前,馬斯克的兆瓦級算力中心 Colossus 的 MFU(模型算力利用率)僅為 11% 左右。

      其實(shí)并不是企業(yè)意識到不到算力資源的浪費(fèi),而是不敢放手。

      排隊(duì)幾個(gè)月,云廠商銷售突然打電話:“你要的卡現(xiàn)在只剩 36 張了,只能簽一年的長約。不要的話,后面還有五家排隊(duì)等著呢。”

      這時(shí)候,問題已經(jīng)不是“公司是否需要租用這么長時(shí)間的芯片”,而是“我敢不敢錯(cuò)過這筆訂單”。

      先簽下來,哪怕閑置也不釋放,因?yàn)榻怀鋈サ乃懔赡芫驮僖材貌换貋砹恕?/p>

      芯片不只是產(chǎn)能短缺,更是流動(dòng)性短缺:它卡在企業(yè)的算力長約里,困在云廠商的容量池里,但就是不在普通開發(fā)者今晚能點(diǎn)開購買的頁面上。

      短缺制造恐慌,恐慌制造囤積,囤積制造更深的短缺。

      而這種流動(dòng)性的枯竭,也放大了另一個(gè)結(jié)構(gòu)性問題:為什么偏偏是 H100/H200 被推上了天價(jià),甚至比新一代 B200 還貴?

      因?yàn)樗懔κ袌鰪膩聿皇前础罢l更新”來定價(jià),而是按“誰更好用、更好接入”來定價(jià)的。

      過去大家搶 GPU,想象中的場景是巨頭訓(xùn)練下一代大模型,當(dāng)然要追求極致先進(jìn)。但現(xiàn)在,消耗 GPU 的地方變多了:推理服務(wù)、代碼 Agent、RL 后訓(xùn)練、自動(dòng)評測、小模型復(fù)現(xiàn)、教學(xué)實(shí)驗(yàn),都在持續(xù)吃算力。

      對于這些海量需求來說,B200 代表的下一代性能上限并不是首選。

      做工程的人最懂:最先進(jìn)不等于最好用,真正值錢的是確定性。

      H100/H200 足夠強(qiáng),且生態(tài)足夠成熟。你用 H100 跑,別人的 benchmark 也是 H100;你用 H200 做推理,調(diào)參經(jīng)驗(yàn)已經(jīng)有人踩過坑。

      相比之下,新一代芯片再強(qiáng),也需要時(shí)間消化到框架、集群、調(diào)度和成本模型里。

      訓(xùn)練市場還沒完全切到 Blackwell,推理和后訓(xùn)練市場又把需求重重疊加上來。舊卡本該退場,卻因?yàn)椤按_定性”成了剛需。

      AI 民主化,卡在了算力門檻上

      這一輪的芯片荒,和過去還不太一樣。

      過去聊缺芯,是頂級 AI Lab 的軍備競賽,巨頭誰搶到更多 GPU,誰就能訓(xùn)練更大模型。但這一次,焦慮正在往下沉。

      Karpathy 錄教程要先考慮開發(fā)者能不能拿到 8×H100;LocalLLaMA 社區(qū)討論能不能用本地 Mac 硬跑;高校研究員擔(dān)心拿不到算力,小團(tuán)隊(duì)擔(dān)心擴(kuò)容被大客戶擠掉。

      這背后已經(jīng)不是“我要訓(xùn)練 GPT-5”的野心,而是一個(gè)更樸素的問題:我只是想復(fù)現(xiàn)一個(gè)實(shí)驗(yàn),為什么第一步就變成搶算力了?

      AI 開源這幾年確實(shí)降低了許多門檻。模型權(quán)重可以下載,代碼可以 fork。但算力把另一扇門關(guān)上了。

      代碼可以開源,但 H100 不能 fork。

      真正的 AI 研究從來不只是看懂代碼,還得你能跑通實(shí)驗(yàn)、復(fù)現(xiàn)結(jié)果,調(diào)參、失敗,以及很多次的再重來。

      如果每次實(shí)驗(yàn)的前提,都是拿到一組昂貴且不穩(wěn)定的 GPU,那么開源的平等,就會(huì)被算力的不平等重新抵消。

      從 Google 研究員離職創(chuàng)業(yè),到英偉達(dá)內(nèi)部爭 GPU,然后是 Karpathy 的教學(xué)視頻卡在 8 張 H100,它們指向同一件事:算力正在從基礎(chǔ)設(shè)施,變成一種篩選機(jī)制。

      它篩掉的未必是沒有想法的人,而是沒有預(yù)算、沒有配額資源、沒有長期合同的群體。

      這才是 AI 民主化最尷尬的現(xiàn)實(shí):模型越來越開放,但能跑起來的人,可能并沒有變多。

      國內(nèi)開發(fā)者的痛:過渡期的壓力

      把視線拉回國內(nèi),如果說海外開發(fā)者是在成熟生態(tài)里搶 H100/H200 現(xiàn)貨;那么國內(nèi)開發(fā)者面對的,則是過渡期的多重壓力考驗(yàn),要在新的算力結(jié)構(gòu)里找"能用且好用"的解法。

      某云 H100 排期已到 2027 年第一季度,更多的云平臺(tái)同樣面臨高端卡供應(yīng)瓶頸,"有錢也租不到"是真實(shí)的用戶反饋。

      與此同時(shí),高端卡的獲取仍然受政策影響,當(dāng)然國產(chǎn)算力替代正在加速。但從 CUDA 體系切換的工程成本是真實(shí)存在的,適配層、代碼改動(dòng)、調(diào)試周期,對小團(tuán)隊(duì)而言不是輕松的遷移。

      其實(shí),大家底層的處境不盡相同。算力底座從來不是一個(gè)宏大詞,而是非常具體的體驗(yàn)——實(shí)例能不能啟動(dòng),價(jià)格扛不扛得住,實(shí)驗(yàn)結(jié)果能不能復(fù)現(xiàn)。

      今天 AI 圈真正稀缺的,也許不是最新的芯片,而是普通人能穩(wěn)定拿到、馬上用起來、跑出結(jié)果的有效算力。

      1. Even Nvidia’s own research teams can’t get enough GPUs amid the race for AI computing power(https://fortune.com/2026/04/09/nvidia-gpu-shortage-impacts-even-nvidias-own-research-teams-bryan-catanzaro-eye-on-ai/)

      2. The Great GPU Shortage – Rental Capacity – Launching our H100 1 Year Rental Price Index(https://newsletter.semianalysis.com/p/the-great-gpu-shortage-rental-capacity)

      3. FOMO is why enterprises pay for GPUs they don't use — and why prices keep climbing(https://venturebeat.com/infrastructure/fomo-is-why-enterprises-pay-for-gpus-they-dont-use-and-why-prices-keep-climbing)

      4. https://semianalysis.com/gpu-pricing-index/

      5. Nvidia A100 vs H100 vs B200 GPU Rental Price and Performance(https://ornn.com/insights/nvidia-a100-vs-h100-vs-b200-gpu-rental-price-and-performance)

      聲明:本文為 AI 前線原創(chuàng),不代表平臺(tái)觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。

      會(huì)議推薦

      Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發(fā)體系不重構(gòu),還能撐多久?

      AICon 上海站 2026,13 大重磅專題已上線,誠摯邀請你登臺(tái)分享實(shí)戰(zhàn)經(jīng)驗(yàn)。AICon 2026,期待與你同行。快來掃碼鎖定 8 折專屬席位或提交演講議題

      今日薦文

      你也「在看」嗎?

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      洗廁所6年,洗碗6年,3次瀕臨破產(chǎn):黃仁勛的“活下去”哲學(xué),打臉多少眼高手低的人?

      洗廁所6年,洗碗6年,3次瀕臨破產(chǎn):黃仁勛的“活下去”哲學(xué),打臉多少眼高手低的人?

      蘇格拉高
      2026-05-27 08:13:34
      原來洗錢這件事一直都貼近生活!網(wǎng)友:手段變化多端,長見識了

      原來洗錢這件事一直都貼近生活!網(wǎng)友:手段變化多端,長見識了

      另子維愛讀史
      2026-05-27 07:52:25
      泳渡賽女選手隱私照被直播,當(dāng)事人最新發(fā)聲:正處于哺乳期,很震驚

      泳渡賽女選手隱私照被直播,當(dāng)事人最新發(fā)聲:正處于哺乳期,很震驚

      19樓
      2026-05-27 08:16:56
      山西沁源礦難背后:淪為空文的141項(xiàng)煤礦安全標(biāo)準(zhǔn),與“通風(fēng)報(bào)信”式檢查

      山西沁源礦難背后:淪為空文的141項(xiàng)煤礦安全標(biāo)準(zhǔn),與“通風(fēng)報(bào)信”式檢查

      大風(fēng)新聞
      2026-05-26 17:48:27
      災(zāi)情如火,豈容“審批”擋道?——評三支藍(lán)天救援隊(duì)被通報(bào)事件

      災(zāi)情如火,豈容“審批”擋道?——評三支藍(lán)天救援隊(duì)被通報(bào)事件

      細(xì)雨中的呼喊
      2026-05-26 13:37:48
      割四賠五后續(xù):全網(wǎng)震怒!免工錢反被訛,大媽正臉曝光遭全網(wǎng)唾棄

      割四賠五后續(xù):全網(wǎng)震怒!免工錢反被訛,大媽正臉曝光遭全網(wǎng)唾棄

      行者聊官
      2026-05-26 16:49:25
      俄外長與美國務(wù)卿通話,要求美方撤離駐基輔大使館人員

      俄外長與美國務(wù)卿通話,要求美方撤離駐基輔大使館人員

      界面新聞
      2026-05-26 21:44:51
      鄭爽徹底垮了!抱娃與張恒家當(dāng)街互撕,滿頭白發(fā)狀態(tài)詭異疑精神失常

      鄭爽徹底垮了!抱娃與張恒家當(dāng)街互撕,滿頭白發(fā)狀態(tài)詭異疑精神失常

      八卦王者
      2026-05-27 11:36:00
      新出行幫你選 | 總有一個(gè)配置為你而來 華境 S 保姆級購車指南

      新出行幫你選 | 總有一個(gè)配置為你而來 華境 S 保姆級購車指南

      新出行
      2026-05-27 10:00:00
      雞蛋獸藥殘留嚴(yán)重超標(biāo)!山東、河南、安徽等地通告雞蛋抽檢不合格

      雞蛋獸藥殘留嚴(yán)重超標(biāo)!山東、河南、安徽等地通告雞蛋抽檢不合格

      新浪財(cái)經(jīng)
      2026-05-26 22:02:15
      雷軍宣布:大幅降價(jià),最高降99%!

      雷軍宣布:大幅降價(jià),最高降99%!

      每日經(jīng)濟(jì)新聞
      2026-05-27 10:27:25
      家暴妻子致死,男子高清照曝光:3個(gè)姐姐1個(gè)媽挑撥他們夫妻的關(guān)系

      家暴妻子致死,男子高清照曝光:3個(gè)姐姐1個(gè)媽挑撥他們夫妻的關(guān)系

      漢史趣聞
      2026-05-26 19:23:37
      每天限駕8小時(shí)涉及網(wǎng)約車、出租車嗎?疲勞駕駛認(rèn)定“三問三答”

      每天限駕8小時(shí)涉及網(wǎng)約車、出租車嗎?疲勞駕駛認(rèn)定“三問三答”

      界面新聞
      2026-05-27 15:05:07
      北京車展直擊:紅旗全矩陣亮劍,定義中式豪華新坐標(biāo)

      北京車展直擊:紅旗全矩陣亮劍,定義中式豪華新坐標(biāo)

      AutoBusiness
      2026-04-29 17:37:31
      韓國綜合股價(jià)指數(shù)漲幅擴(kuò)大至5%

      韓國綜合股價(jià)指數(shù)漲幅擴(kuò)大至5%

      每日經(jīng)濟(jì)新聞
      2026-05-27 08:08:13
      朱時(shí)茂陳佩斯現(xiàn)狀曝光差距大,一人家財(cái)萬貫,一人真被倪萍說中了

      朱時(shí)茂陳佩斯現(xiàn)狀曝光差距大,一人家財(cái)萬貫,一人真被倪萍說中了

      孤城落日
      2026-05-26 19:45:03
      收評:滬指跌超1% 防御性板塊逆勢走強(qiáng)

      收評:滬指跌超1% 防御性板塊逆勢走強(qiáng)

      財(cái)聯(lián)社
      2026-05-27 15:04:06
      多地接連關(guān)店、100萬打水漂!網(wǎng)紅地方小吃批量收割創(chuàng)業(yè)者

      多地接連關(guān)店、100萬打水漂!網(wǎng)紅地方小吃批量收割創(chuàng)業(yè)者

      財(cái)經(jīng)八卦
      2026-05-26 17:32:55
      從月銷1.5萬到2982輛!全新一代問界M9把BBA的飯碗端了!

      從月銷1.5萬到2982輛!全新一代問界M9把BBA的飯碗端了!

      凡兮說
      2026-05-26 14:07:44
      這跟不穿有啥區(qū)別?戛納閉幕式,女星下垂、副乳突出,露的好辣眼

      這跟不穿有啥區(qū)別?戛納閉幕式,女星下垂、副乳突出,露的好辣眼

      天馬幸福的人生
      2026-05-26 11:05:02
      2026-05-27 15:43:00
      AI前線 incentive-icons
      AI前線
      面向AI愛好者、開發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊。
      1522文章數(shù) 150關(guān)注度
      往期回顧 全部

      科技要聞

      韜定律:全球在卷納米數(shù) 華為換了一把尺子

      頭條要聞

      受害者多為中國女性 震驚全球的迷奸案細(xì)節(jié)披露

      頭條要聞

      受害者多為中國女性 震驚全球的迷奸案細(xì)節(jié)披露

      體育要聞

      這群老阿姨,是最硬核的馬刺球迷

      娛樂要聞

      王鶴棣風(fēng)波連累父親炸串店遭差評?

      財(cái)經(jīng)要聞

      ST巖石退市背后:A股“炒殼”時(shí)代終結(jié)

      汽車要聞

      極狐問道V9今日將正式上市 搭載華為雪鸮增程系統(tǒng)

      態(tài)度原創(chuàng)

      游戲
      房產(chǎn)
      教育
      家居
      公開課

      《DQ》123重制銷量突破400萬 HD-2D風(fēng)大受歡迎

      房產(chǎn)要聞

      地產(chǎn)投資又跌30%!連跌15月!海南房子將越來越少?

      教育要聞

      新傳考研名詞解釋:加速暴力

      家居要聞

      古老而持久 石影扶手椅

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产一区二区在线视频播放| av自拍一区| 日本无遮挡吸乳视频| 久久久久久久女国产乱让韩| 国产美女被遭高潮免费网站| 在线观看的黄网| 777亚洲熟妇自拍无码区| 无码中文人妻| 欧美黑人又粗又大又爽免费| 天天婬欲婬香婬色婬视频播放| 欧美精品成人一区二区在线观看| 亚洲国产精品久久久久秋霞影院| 国产精品欧美福利久久| 激情呻吟久久久久久99av| 久久伊人中文字幕| 亚洲尤物av一区| 国产大片喷水在线在线视频| 54pao国产成人免费视频| 狠狠躁天天躁无码中文字幕| 国产精品日韩中文字幕| 伦为黑人性n奴的少妇| 久久久久国产精品人妻| 蜜桃av麻豆av果冻传媒| 国产草莓精品国产AV片国产 | 乱伦一区二| 日本在线看片免费人成视频1000 | 国产成人v片视频在线观看 | 九九热在线视频中文字幕| 日韩av激情在线| 国产精品原创不卡在线| 成人片99久久精品国产桃花岛| 国产精品国三级国产av| 国产成人亚洲综合无码品善网| 日本久久免费| 亚洲高清国产拍精品熟女| 黄色日本视频| 国产精品乱码人妻一区二区三区 | 亚洲欧美日韩中文高清www777| 97福利| 拍真实国产伦偷精品| 人妻丰满精品一区二区|