<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      當工程師拒絕更聰明的模型:AI推理大戰,OpenAI換了一把"槍"

      0
      分享至

      人工智能推理市場正在經歷一場深刻的范式轉變——速度,而非智能,正成為開發者愿意為之付費的核心變量。這一偏好的逆轉,將長期處于邊緣地位的芯片公司Cerebras推向了聚光燈下,也讓OpenAI斥資數百億美元押注一家即將上市的晶圓級芯片制造商。

      據行業研究機構SemiAnalysis的深度報告,OpenAI已與Cerebras簽署總規模高達750兆瓦算力的主協議,潛在擴展至2吉瓦,對應剩余履約義務達246億美元。

      這筆交易的核心邏輯在于:OpenAI旗下GPT-5.3-Codex-Spark模型在Cerebras硬件上可實現每用戶每秒2000個token的生成速度,遠超基于HBM的GPU集群所能提供的交互體驗。與此同時,Cerebras正站在IPO的門檻上,其命運已與OpenAI深度綁定。

      這場速度革命的市場信號已相當清晰。SemiAnalysis披露,其團隊80%的AI支出(年化峰值達1000萬美元)集中在Anthropic的Opus 4.6快速模式上——該模式以6倍溢價換取2.5倍交互速度。更具說服力的是,當Opus 4.7發布時,團隊中多名工程師拒絕升級,原因僅僅是新版本不支持快速模式。這是SemiAnalysis團隊首次主動放棄前沿智能,轉而選擇更快的token生成速度。


      速度溢價:開發者用錢包投票

      推理市場的競爭格局正在沿著一條新的軸線重新劃分。

      正如英偉達CEO Jensen Huang在今年GTC大會上反復強調的,吞吐量(每GPU每秒token數)與交互性(每用戶每秒token數)是推理的根本性權衡——前者服務于批量處理,后者決定用戶體驗。SemiAnalysis將其比喻為"公共汽車與法拉利"的選擇:你可以慢速服務大量用戶,也可以快速服務單個用戶。


      市場的偏好已通過消費行為得到驗證。Opus 4.6快速模式以6倍價格換取約2.5倍的交互速度,一度成為Anthropic利潤率最高的產品SKU,也是其今年ARR爆發式增長的重要驅動力。然而,SemiAnalysis與OpenRouter合作收集的數據顯示,該模式近期已出現性能退化——標準Opus 4.6的交互速度穩定在約40 tps,快速模式曾超過100 tps,但近期已降至約70 tps,實際加速比從2.5倍縮水至約1.75倍。

      OpenAI和Anthropic均已意識到這一需求分層,并通過快速模式、優先模式、批量定價等多種產品形態,試圖覆蓋整個市場并尋找利潤最大化的組合點。

      晶圓級芯片:一場豪賭的技術邏輯

      Cerebras的核心賭注,是突破光刻機單次曝光的物理極限,將整張晶圓做成一塊芯片。

      其第三代產品WSE-3基于臺積電N5工藝制造,在一張晶圓上集成了44GB SRAM,提供21PB/s的內存帶寬——比HBM高出數千倍。這一架構的本質是:用極高的內存帶寬換取極低的訪存延遲,使得在小批量、低算術強度的解碼場景下,WSE-3能夠充分發揮其理論算力,而基于HBM的GPU在同等場景下往往處于"算力饑渴"狀態。

      然而,這一架構也帶來了顯著的計算密度代價。SemiAnalysis指出,WSE-3的稠密FP16算力實際僅為15.625 PFLOPS——這與Cerebras官方宣傳的125 PFLOPS相差8倍,差距源于其采用了8:1非結構化稀疏假設,SemiAnalysis將此稱為"Feldman公式",并將其與英偉達的"Jensen數學"相提并論,但認為前者走得更遠。

      在系統成本方面,SemiAnalysis估算每臺CS-3服務器的物料成本(含KVSS CPU節點)約為45萬美元,遠高于其硅片本身約2萬美元的臺積電晶圓成本。高昂的定制化電源模塊(來自Vicor)、液冷系統以及每批次晶圓所需的定制掩膜版,共同推高了整體成本結構。


      架構短板:網絡帶寬的幾何困境

      WSE-3最顯著的弱點,是極為有限的片外帶寬。

      每塊WSE-3僅提供150GB/s(1.2Tb/s)的片外帶寬,僅為英偉達Blackwell NVLink5單GPU 900GB/s規模擴展帶寬的六分之一。這一限制并非設計疏忽,而是晶圓級架構的內在約束——SemiAnalysis將其稱為"島嶼問題"。

      問題的根源在于晶圓的均勻步進曝光機制。WSE-3由84個相同的曝光單元(die)拼接而成,每個曝光單元必須完全相同,以確保跨die的片上2D網格互聯正常工作。這意味著無法將SerDes PHY集中部署在晶圓邊緣——若要增加I/O帶寬,就必須在每個曝光單元中都預留PHY面積,而位于晶圓內部的PHY無法連接外部,形成大量"擱淺硅"。此外,PHY模塊還會在片上網格中形成"空洞",增加數據路由延遲,削弱晶圓級架構的核心優勢。

      這一帶寬瓶頸直接限制了Cerebras服務大模型的能力。對于參數量超過1萬億、上下文窗口達到百萬token級別的現代智能體工作負載,Cerebras不得不采用流水線并行策略,將模型按層切分到多塊晶圓上,僅在晶圓間傳輸激活值。但隨著模型規模擴大,所需晶圓數量線性增加,每次晶圓間傳輸的固定延遲也隨之累積,最終侵蝕速度優勢。

      SRAM擴展已死:路線圖的隱憂

      Cerebras面臨的另一個結構性挑戰,是SRAM密度擴展的物理極限。

      從WSE-1(臺積電16nm,18GB SRAM)到WSE-2(7nm,40GB),SRAM容量實現了2.2倍的代際提升。但WSE-3從7nm升級至5nm,SRAM容量僅從40GB增至44GB,增幅僅10%,而邏輯晶體管數量增長了約50%。SemiAnalysis的數據顯示,在5nm之后,臺積電N3E相對N5的SRAM單元面積幾乎沒有縮減,N2及后續節點亦然——SRAM擴展實際上已經停滯。


      這意味著Cerebras未來提升SRAM容量的唯一路徑,是在固定晶圓面積內犧牲計算面積換取存儲面積,形成嚴格的零和權衡。下一代CS-4系統將沿用基于N5的WSE-3,僅通過提升功耗來提高時鐘頻率和算力,SRAM容量維持不變。

      相比之下,英偉達收購Groq后,可通過混合鍵合技術在Z軸方向疊加SRAM芯片(即LP40路線圖),繞開平面擴展的限制。Cerebras也在探索類似路徑——將DRAM晶圓或光子互聯晶圓通過混合鍵合疊加在WSE上,但SemiAnalysis對其技術可行性和時間表持審慎態度,認為晶圓級混合鍵合面臨的熱機械應力和鍵合波挑戰遠比常規芯片復雜。

      OpenAI交易:單一客戶的雙刃劍

      Cerebras與OpenAI的關系,已遠超普通供應商與客戶的范疇。

      根據SemiAnalysis援引的S-1文件,雙方于2025年12月簽署主關系協議(MRA),OpenAI承諾在2026至2028年間分批采購750兆瓦AI推理算力,每批次合同期3至4年,可延長至5年,并持有額外采購1.25吉瓦的選擇權。截至2025年12月31日,Cerebras剩余履約義務達246億美元。


      資本結構上,OpenAI同時扮演三重角色:向Cerebras提供10億美元有擔保營運資金貸款(年利率6%,若以算力交付方式償還則豁免利息);持有3344.5萬股N類(無投票權)普通股認股權證,行權價格接近于零;并在完全稀釋基礎上可能持有Cerebras約12%的股份。若MRA因OpenAI以外的原因終止,Cerebras須立即償還全部貸款余額及應計利息,且OpenAI有權直接控制托管賬戶資金的使用。

      這一結構意味著Cerebras的增長前景與單一客戶高度綁定。SemiAnalysis預計,Cerebras未來數年收入將出現明顯拐點,OpenAI是主要增長驅動力,但執行風險同樣集中——在2028年前,Cerebras需要交付的服務器數量將比其歷史累計出貨量高出一個數量級,而數據中心容量的落地進度是最大的不確定性。

      速度換智能:這筆交易值多少錢

      OpenAI在Cerebras上運行的旗艦產品GPT-5.3-Codex-Spark,并非真正的GPT-5.3-Codex,而是基于gpt-oss-120B架構、經GPT-5.3-Codex蒸餾訓練的小型模型,參數量比原版小逾10倍。

      SemiAnalysis對此直言不諱:Cerebras的芯片在經濟上目前只能高效服務相對較小的模型。對于參數量超過1萬億、上下文窗口達到100萬token的現代智能體工作負載,OpenAI若要在Cerebras上運行,需要接受顯著的成本溢價,且預計實際交互速度將低于每秒1000個token。

      然而,這一判斷背后存在一個關鍵變量:算法進步的速度。SemiAnalysis認為,距離120B參數模型達到GPT-5.5級別的智能,可能不到一年時間。屆時,"以前沿智能換極速token"的價值主張將發生質變——正如今天工程師們寧愿放棄Opus 4.7的更高智能,也要堅守Opus 4.6快速模式的交互體驗。

      750兆瓦的初始承諾已經鎖定。真正的問題是:當120B模型的智能追上今天的前沿水平,OpenAI是否會選擇將選擇權轉化為實際采購,將協議規模擴展至2吉瓦乃至更多。這一答案,將決定Cerebras的IPO估值能否兌現,也將定義下一階段推理戰爭的勝負手。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      福建漳州楊梅泡藥風波持續發酵,無人收購,果農欲哭無淚,被害慘

      福建漳州楊梅泡藥風波持續發酵,無人收購,果農欲哭無淚,被害慘

      魔都姐姐雜談
      2026-05-17 09:52:03
      網友們這幾天都在吃著名毛巾集團潔麗雅的瓜,諷刺其家族“丑聞”

      網友們這幾天都在吃著名毛巾集團潔麗雅的瓜,諷刺其家族“丑聞”

      網絡易不易
      2026-05-17 12:29:12
      隨著衛冕冠軍2-3落敗,沙特聯最新積分榜出爐

      隨著衛冕冠軍2-3落敗,沙特聯最新積分榜出爐

      側身凌空斬
      2026-05-18 04:58:01
      豐田亞洲龍落地價12.68萬元?一車主團購買車比4S店還貴,代購方稱超低價有前提條件

      豐田亞洲龍落地價12.68萬元?一車主團購買車比4S店還貴,代購方稱超低價有前提條件

      半島官網
      2026-05-18 17:11:59
      三星堆竟不屬于任何朝代?考古學家顫抖:中華文明源頭要改寫!

      三星堆竟不屬于任何朝代?考古學家顫抖:中華文明源頭要改寫!

      抽象派大師
      2026-05-19 00:44:23
      特朗普警告伊朗:美軍48小時后將全面打擊不留情

      特朗普警告伊朗:美軍48小時后將全面打擊不留情

      春之韻
      2026-05-18 11:58:59
      血管好不好,看排汗量就知道?提醒:血管有病的人排汗多有異常

      血管好不好,看排汗量就知道?提醒:血管有病的人排汗多有異常

      芹姐說生活
      2026-05-17 23:30:46
      來了!首個冠軍點!阿森納最快兩天內奪冠,每輸一場,或丟一冠

      來了!首個冠軍點!阿森納最快兩天內奪冠,每輸一場,或丟一冠

      嗨皮看球
      2026-05-18 12:19:47
      有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

      有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

      夜深愛雜談
      2026-02-18 20:55:58
      “他們求我不要曝光,我說沒有辦法”

      “他們求我不要曝光,我說沒有辦法”

      南風窗
      2026-05-18 13:36:18
      鰲拜倒臺,康熙審問其女:“你父親罪孽深重,該當何罪?”

      鰲拜倒臺,康熙審問其女:“你父親罪孽深重,該當何罪?”

      卡西莫多的故事
      2025-12-25 09:43:53
      心理學上有個詞叫:逆火效應(永遠不要指出你身邊人的任何問題,包括你的親戚朋友。成年人的最大清醒就是不介入他人的生活)

      心理學上有個詞叫:逆火效應(永遠不要指出你身邊人的任何問題,包括你的親戚朋友。成年人的最大清醒就是不介入他人的生活)

      德魯克博雅管理
      2026-05-18 17:11:20
      院士憂心青年擇業觀:年輕人應該多想著為國家做貢獻

      院士憂心青年擇業觀:年輕人應該多想著為國家做貢獻

      映射生活的身影
      2026-05-17 21:45:58
      馬斯克和范冰冰什么關系?偷稅8億的范冰冰,如今在國外重回巔峰

      馬斯克和范冰冰什么關系?偷稅8億的范冰冰,如今在國外重回巔峰

      追風小狗
      2024-11-12 21:52:56
      約會時女人說去廁所,其實是在給你兩個暗示,聽懂的都不是凡人

      約會時女人說去廁所,其實是在給你兩個暗示,聽懂的都不是凡人

      心理觀察局
      2026-05-18 09:11:14
      教育改革,正在成為“毒草”毀掉基礎教育

      教育改革,正在成為“毒草”毀掉基礎教育

      現實的聲音
      2026-05-12 08:23:50
      陳道明沒說謊!被張藝謀力捧,致女孩癱瘓的劉浩存,證實他的評價

      陳道明沒說謊!被張藝謀力捧,致女孩癱瘓的劉浩存,證實他的評價

      動物奇奇怪怪
      2026-05-19 01:40:47
      駙馬一腳踢死康熙五公主,康熙得知后震怒,懲罰手段令人膽寒

      駙馬一腳踢死康熙五公主,康熙得知后震怒,懲罰手段令人膽寒

      卡西莫多的故事
      2025-11-19 10:57:09
      “普京語錄”衛衣在中國熱銷,“俄羅斯”國家中心正版授權,可印制普京本人簽名

      “普京語錄”衛衣在中國熱銷,“俄羅斯”國家中心正版授權,可印制普京本人簽名

      極目新聞
      2026-05-18 16:25:24
      馬斯克這次訪華,萬萬沒想到,居然把聯想CEO楊元慶帶火了!

      馬斯克這次訪華,萬萬沒想到,居然把聯想CEO楊元慶帶火了!

      趣味萌寵的日常
      2026-05-17 22:00:06
      2026-05-19 03:24:49
      華爾街見聞官方 incentive-icons
      華爾街見聞官方
      中國領先的金融商業信息提供商
      146261文章數 2653597關注度
      往期回顧 全部

      科技要聞

      蘋果WWDC26定檔6月9日凌晨:iOS27將亮相

      頭條要聞

      69名中國公民在菲律賓被突擊查扣 中使館通報

      頭條要聞

      69名中國公民在菲律賓被突擊查扣 中使館通報

      體育要聞

      58順位的保羅,最強第三中鋒

      娛樂要聞

      票房會破14億!口碑第一電影出現了

      財經要聞

      中國芯片,怎么突然不便宜了?

      汽車要聞

      40.98萬起!充電5分鐘純電續航420km 騰勢N9閃充版勝算有多少?

      態度原創

      家居
      教育
      房產
      數碼
      本地

      家居要聞

      觀山隱秀 心靈沉淀

      教育要聞

      新鮮出爐!今年各區公辦高中招生計劃變化匯總!

      房產要聞

      突發!海口重磅調規!碧桂園要解套;新埠島要起飛了!

      數碼要聞

      TOPPING拓品推出DX1 II游戲HiFi解碼耳放一體機,769元

      本地新聞

      用蘇繡的方式,打開江西婺源

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 综合网视频| 免费毛片视频| 亚洲国产精品综合久久20| 国产va在线播放| 乱人伦国语对白| 久久久久亚洲Av片无码一区| 18禁黄网站免费| 亚洲精品视频免费| 在线a网站| 国产精品99久久久久久www| 国产精品白浆视频一区| 久久国产精品视频影院| 青草青草久热精品视频国产4| 99精品国产综合久久久久五月天| 99re国产高清| 精品无码久久久久久久久久| 一区二区三区福利午夜| 免费国产黄线在线播放| 国模无码一区二区三区不卡| 最新国产精品亚洲二区| 正在播放重口老熟女露脸| 亚洲区一区二| 国产精品久久久久免费观看| 久久精品国产亚洲AV麻豆甜| 久久国产精品久久国产 | 永久天堂网av手机版| 国产无码久久| 内射中出高清晰| 亚洲奇米精品一区二区| 日韩人妻久久中文字幕| 邻居少妇张开腿让我爽了在线观看| 精品国产中文字幕第一页| 手机看片日韩欧美| 国产精品亚洲av三区色| 国产免费人成网站在线播放| 亚洲国产精品久久久久4婷婷| 亚洲精品毛片一区二区三区 | 国产v专区| 色婷婷狠狠久久综合五月| 国产精品拍天天在线| 日韩无码乱了www亚洲无码视频|