<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      梁文鋒搭箭,黃仁勛難安

      0
      分享至


      “箭”已上弦,但遲遲未發

      作者 | 徹諾

      來源 | 盒飯財經(ID:daxiongfan)

      頭圖及封面來源 | 網絡及即夢制作

      不發一言,全網卻在時刻盯梢。

      3月29日晚至30日上午,DeepSeek經歷了一場大規模服務中斷。據環球時報,29日22時開始,網頁端與App全面卡頓,頻繁彈出“服務器繁忙”提示,相關功能無法正常使用。至30日清晨,仍有用戶反饋無法正常使用。

      而后,“DeepSeek崩了”相關話題迅速沖上百度、微博、今日頭條等多個平臺的熱搜榜前十。海外科技圈也在關注,除了媒體報道,更有不少專業用戶進行實測,對比前后同一任務的執行結果。

      對比外界的高度關注和推測,DeepSeek官方沒有進度通報,也沒有解釋原因。3月30日上午,官網發布公告:【已解決】DeepSeek網頁/APP性能異常,服務狀態顯示“正常”。

      3月中上旬,更是因為 OpenRouter上出現的一款名為Hunter Alpha神秘模型,而引發了猜測。當時,不少開發者認為這可能是V4的隱身測試版。后來,證明該神秘模型并非V4,是小米旗艦模型MiMo-V2-Pro的內部測試版本。而DeepSeek對該推測并未發聲。

      一動一靜,微妙的張力來自梁文鋒:“箭”已上弦,但遲遲未發。

      2024年年底V3,隨后的2025年年初R1發布,DeepSeek瞬間比肩OpenAI等巨頭,登頂中美等國App Store榜首。產品技術之外,因極低的算力成本,引發美股半導體板塊劇烈震蕩。現如今,行業正屏息以待梁文鋒的下一個大招——DeepSeek V4。然而,原本業內預期在今年一季度就會亮相的 V4,卻一再推遲。

      2月、春節前后、3月初、最早4月,外界對DeepSeek V4發布的時間猜測一路后移。除此,V4的定位、架構、性能、上下文窗口、定價、供應鏈等情況也在高度關注中,傳聞不斷。

      其中,一條供應鏈相關的報道,更是在技術之外引發了各種猜想。據路透社報道,兩位了解情況的消息人士表示,DeepSeek在即將進行重大模型更新之前,未向美國芯片制造商展示其即將推出的旗艦模型,這打破了行業標準做法。

      短短幾行字,透露的是一個“釜底抽薪”的鏈路。

      英偉達能撐起這萬億市值,靠的不僅僅是GPU硬件本身,還有其打磨了十幾年的CUDA軟件生態。CUDA就像是給全球AI開發者鋪好的一條路,沿著走總能“大力出奇跡”。但如真和上述報道透露的一樣,DeepSeek要做的便是鋪好了一條“繞過CUDA”的高速公路。

      而更戲劇性的是,從2025年12月至今DeepSeek相關方面陸續發布的論文和開源項目來看,這些推測并非空穴來風。

      拿著放大鏡找變化

      當地時間3月29日傍晚,X平臺上,名為“AiBattle”的用戶發了一條推文。

      The DeepSeek model that they serve on the WEB/APP may have been updated again The model does seem to consistently identify itself as V3 now The zero-shot coding outputs I’m getting now also seem different in style from the ones I got a few days ago It needs more testing to be completely sure

      翻譯過來,大概的意思就是:網頁和APP端上,DeepSeek模型可能已經再次更新。現在,這個模型似乎始終將其自身標識為V3版本。做了一些測試,發現零提示能力大漲,輸出的風格和幾天前不太一樣。但還需要進行更多測試才能完全確定結論。

      配圖則是兩張鵜鶘騎自行車的前后對比圖。


      通過這張對比圖,明顯能看到其空間與圖形代碼能力大幅提升。在畫面構圖、色彩搭配以及元素邏輯上,肉眼可見地碾壓一周前的版本。截至3月31日18:47,該條推文累計獲得162.8K個Views。

      用SVG(可縮放矢量圖形)畫一只騎自行車的鵜鶘,常被視為大模型空間與渲染能力“試金石”的極限測試題。

      這道測試題,來自全球知名的開源開發者、Django框架聯合創始人Simon Willison。他認為現在大模型刷榜的數據水分太大,而SVG本質上是由無數的坐標、曲線公式和顏色代碼組成的純代碼。讓一個沒有真手真眼的“純文本 AI”用代碼去精確描繪“一只鵜鶘”的生物特征和“一輛自行車”機械結構,能直接暴露出大模型的空間想象能力和代碼邏輯能力。

      一天后,該用戶補充發布了“更多測試”的結果。

      “AiBattle”表示,在7小時的宕機之后,DeepSeek可能再次對模型進行了修改。在停機之前,該模型自稱為V3版本。現在它又變回自稱“最新版本”。SVG的質量似乎也變得更差,回到了以前的狀態。


      如“AiBattle”這樣的開發者并不是少數。AI圈如同被DeepSeek“斷更”,他們拿著放大鏡,試圖找到蛛絲馬跡,以證明V4已在弦上。


      例如,他們發現知識庫截止日期可能悄悄延后了。有用戶發現,DeepSeek不開啟聯網搜索的前提下,知道2025年美國選舉結果,但對2026年2月的大事則一無所知,這使得外界推測新版本的知識截止日期可能是2026年1月。

      例如,上下文token方面。2月11日,DeepSeek悄悄把現有模型的上下文窗口從128K擴到1M tokens,并將知識截止更新到2025年5月。社區很多人把這理解為V4相關基礎設施正在上線前測試。

      底層技術論文,往往是新一代大模型的預告片和說明書。

      對比外界的推測和社區的測試,更確定的是自2025年年底以來,DeepSeek發布的論文和開源的項目。

      2025年12月31日,梁文鋒上傳發布了一篇名為《mHC: Manifold-Constrained Hyper-Connections》的論文。


      這篇文章解決了傳統Hyper-Connections在大規模訓練中信號指數放大(最高可達3000×)導致的訓練崩潰問題,以及通過將HC的殘差空間投影到特定流形,恢復恒等映射(identity mapping)屬性,保證信息守恒。

      論文中,梁文鋒的名字出現在作者一欄中。


      2026年1月,DeepSeek在GitHub上發布了一項名為“Engram”的研究成果,并同步上傳了名為《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models(基于可擴展查找的條件記憶:大語言模型稀疏性的新維度)》的論文。

      這一研究成果,被業內稱為“用哈希表替代大模型死記硬背”的神器。

      2月26日,DeepSeek聯合北京大學、清華大學發布了最新推理架構論文。論文標題為《DualPath: Breaking the Storage Bandwidth Bottleneck in Agentic LLM Inference》,解決的是Agent長文本吞吐瓶頸的框架問題。

      這或許是梁文鋒準備的三支利箭。


      有的放矢,想要榨干硬件的每一滴性能

      如今的大模型軍備競賽中,頂級AI公司發布底層技術論文,早就不是傳統意義上的“秀肌肉”了。

      這三支箭,自然也是有的放矢。

      mHC、Engram、DualPath這三項技術,表面上看分別屬于算法數學、模型架構和系統工程三個截然不同的領域,但如果把它們拼在一起,會發現它們不是孤立的學術論文。

      先看,mHC(Manifold-Constrained Hyper-Connections)。類似一個穩定的骨架,解決“練得出來”的問題。


      當模型參數飆升到幾千億甚至萬億時,傳統的殘差連接會成為信息流通的“窄門”,但隨意增加跨層連接又會導致訓練崩潰。mHC通過將這些連接約束在特定的數學流形(雙隨機矩陣)上,保證了超大模型在極深、極寬的架構下依然能穩定訓練。

      怎么直白的理解?

      這種新型的連接結構,就相當于花一點點小錢,換來團隊高效率。就好像,在AI內部稍微調整了一下“部門間的溝通機制”,雖然增加了6-7%的溝通成本,但讓整個模型在學習時再也不會出現“配合混亂”的問題,變得更穩定、更聰明。

      而Engram(條件記憶模塊),就像是外掛的硬盤,解決“記得住且夠聰明”的問題。

      基于mHC搭好的超大模型骨架,Engram開始對“大腦”進行分區。過去的大模型把所有知識都死記硬背在昂貴的神經網絡權重里,導致“推理計算”和“記憶”搶占資源。Engram 引入了全新的稀疏性,把靜態知識打包成哈希表卸載到廉價的CPU內存里,通過O(1) 極速查找,從而把極其寶貴的GPU算力100%釋放出來,專門用于復雜的邏輯推理。

      這種稀疏注意力,就相當于讓大模型學會“一目十行”和“抓重點”的能力。原本讓AI讀一篇長文,哪怕是廢話,也要逐字精讀。當AI獲得“一目十行”這一buff后,看長文的速度直接翻倍,計算壓力大大減輕。

      更直白的理解,這種知識存儲,類似于把死記硬背變成了查字典。以前AI為了記住某本書是誰寫的、某國首都是哪這樣的固定知識,需要消耗大腦大量的算力去硬記。現在DeepSeek的做法是,把這些“死知識”拎出來單獨做成了一本“字典”。AI 遇到這種問題直接去“翻字典”,不用再耗費腦力,把算力全省下來用在“邏輯推理”和“思考”。

      DualPath(雙路徑推理框架),則是高效的物流系統,解決“用得起、跑得快”的問題。


      模型練好了,大腦也變聰明了,當它作為Agent去處理幾十萬字的長文本和多輪代碼任務時,會產生海量的上下文緩存(KV-Cache)。這時候計算不再是瓶頸,“讀取硬盤數據到顯卡”的 I/O 帶寬成了瓶頸。DualPath巧妙地調用了集群中原本閑置的解碼節點(Decode)的網卡,去幫預填充節點(Prefill)搬運數據,讓端到端的吞吐量暴增近2倍。

      簡單的理解,就是AI在處理超長任務時,其實不是“腦子”不夠用,而是“手腳”搬運數據的速度太慢拖了后腿。DualPath這項技術就像一個聰明的車間主任,把別處閑置的“運輸車”調過來幫忙搬數據,直接讓整體工作效率翻了一倍。

      理論上來看,mHC,刺向了“CUDA 生態墻”,證明了非英偉達的底層硬件加上極致的數學通信優化,依然能跑通萬億參數大模型;Engram,刺向了“顯存焦慮”,把死知識踢出GPU,大幅降低推理的硬件門檻;DualPath,針對的則是“Agent 吞吐瓶頸”,大幅提升大模型的并發處理能力。

      這三項技術看似解決不同問題,但背后的技術信仰完全一致:不迷信算力堆砌,通過極致的解耦,榨干硬件的每一滴性能。

      但,這與硅谷所信奉的Scaling Law(規模法則)并不一致。Scaling Law的核心就是“大力出奇跡”,更多更先進的芯片,燒出更聰明的大模型。

      這一路徑下,大模型越做越大,對算力的需求便是無底洞。這也是黃仁勛掛在嘴邊的“The more you buy,The more you save(買得越多,省得越多)”,讓人信奉的底層邏輯。


      “算力溢價”的定價權是否會轉移

      2025年GTC大會上,黃仁勛將他那句“買得越多,省得越多”,升級為了“The more you buy, the more you make(?買得越多,賺得越多)?”。

      這句話的精妙之處,在于直接用超市打折區的標語,消解企業花幾十億美金采購顯卡的財務焦慮。在這套邏輯下,高昂的資本支出不知不覺成了極具性價比的投資。

      但,如果奇跡不一定非要大力呢?

      如果mHC、Engram、DualPath這三大底層技術真的能在商業中規模化貫通,這就意味著DeepSeek找到了一條新路,一條跳出“花錢買算力、漲參數、再買算力”循環的新路。甚至,哪怕V4遲遲未發布,但在想象中植入了一個念頭:過去堆算力的暴力美學路徑并不是唯一選擇,還可以拼算法、拼工程、拼數學。

      當地時間2月25日, 路透社經合作媒體轉載的報道指出,DeepSeek似乎已將其即將推出的旗艦模型提前給包括華為在內的中國芯片供應商做適配,但沒有同樣給英偉達或AMD預覽。

      從行業慣例來看,過去幾年,全球大部分大模型在發布前,通常會和英偉達、AMD等芯片制造商共享主要模型的預發布版本,以確保其軟件在廣泛使用的硬件上高效運行。

      底層技術論文在先,不確定的不利消息在后,心癢要撓未撓,利箭將射未射。

      對于英偉達這樣體量的企業而言,自然并不擔心少賣了幾張卡。但,如果是開辟的路線被繞開呢?那關乎的是“算力溢價”的定價權是否會轉移?如果DeepSeek V4真的把多模態和Agent的成本打到極低,甚至讓手機或PC端側推理成為主流,那么硅谷奉為圭臬的“云端算力霸權”就會動搖。

      當然,V4一天未發,以上這些都只是建立在“如果”之上的推測。

      商業世界的殘酷在于,有想法有野心,并不意味著立刻就能鋪平新道。V4一直未發布,或許也有這類原因存在。

      但,DeepSeek 的核心邏輯始終清晰:用算法效率彌補硬件劣勢,用開源策略強化商業模式,用效率革命挑戰算力暴力。一旦V4正式落地,市場震蕩將再次不可避免——問題不是“會不會”,而是“何時”。

      參考資料:

      1.《DualPath: Breaking the Storage Bandwidth Bottleneck in Agentic LLM Inference》,https://arxiv.org/abs/2602.21548

      2.《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》,https://github.com/deepseek-ai/Engram

      3.《mHC: Manifold-Constrained Hyper-Connections》,https://arxiv.org/abs/2512.24880

      4.《DeepSeek to launch new AI model focused on coding in February, The Information reports》,Reuters

      5.《DeepSeek V4 什么時候發布?2026 最新消息、規格與值得關注的重點》,Jessie,

      https://evolink.ai/zh/blog/deepseek-v4-release-window-prep

      6.《DeepSeek宕機8小時后升級?新模型能力大增引熱議》,第一電動網

      7.《消息稱DeepSeek V4模型讓華為等早期訪問,不讓英偉達AMD先用》,IT之家

      8.《DeepSeek V4 Is Coming This Month. Why It Could Rattle the Markets, Again.》

      9.《Exclusive-DeepSeek withholds latest AI model from US chipmakers including Nvidia, sources say》,Reuters

      歡迎在評論區留言~如需開白請加微信:YPYP01234567

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      王皓奪冠回京就提新車,妻子穿平底鞋比他還高

      王皓奪冠回京就提新車,妻子穿平底鞋比他還高

      軍武英雄
      2026-05-15 18:38:29
      白宮稱中方同意重開霍爾木茲海峽 外交部回應

      白宮稱中方同意重開霍爾木茲海峽 外交部回應

      財聯社
      2026-05-15 15:40:12
      標價1980元三亞海景房僅需1分錢?酒店回應:預約成功淡季即可入住

      標價1980元三亞海景房僅需1分錢?酒店回應:預約成功淡季即可入住

      上游新聞
      2026-05-15 15:01:31
      女娃被鎖車里絕望喝光3瓶水,都沒有等到打麻將的父母想起她

      女娃被鎖車里絕望喝光3瓶水,都沒有等到打麻將的父母想起她

      第四思維
      2025-07-15 13:16:45
      名記:詹姆斯如果離開湖人,大概率只能簽全額中產或老將底薪

      名記:詹姆斯如果離開湖人,大概率只能簽全額中產或老將底薪

      懂球帝
      2026-05-15 14:15:07
      中紀委再次重拳出擊!這4個領域將被嚴查,這4種行為將被嚴肅處理

      中紀委再次重拳出擊!這4個領域將被嚴查,這4種行為將被嚴肅處理

      細說職場
      2026-05-15 14:01:05
      馬斯克兒子四個月婚姻破裂,兩年后產女并愛上男DJ

      馬斯克兒子四個月婚姻破裂,兩年后產女并愛上男DJ

      李橑在北漂
      2026-05-15 14:26:39
      央視1.1億美元拿下2026世界杯?王濤爆料:砸下5億美元簽了2-3屆

      央視1.1億美元拿下2026世界杯?王濤爆料:砸下5億美元簽了2-3屆

      風過鄉
      2026-05-15 16:46:19
      騎士晉級隱患!流感在隊內大面積爆發 主帥阿特金森也已經中招

      騎士晉級隱患!流感在隊內大面積爆發 主帥阿特金森也已經中招

      羅說NBA
      2026-05-15 07:07:29
      中國氣象局將重大氣象災害應急響應提升為Ⅲ級

      中國氣象局將重大氣象災害應急響應提升為Ⅲ級

      澎湃新聞
      2026-05-15 19:41:03
      女性的臀部和胸部,為何會對男性產生強烈的“性吸引力”?

      女性的臀部和胸部,為何會對男性產生強烈的“性吸引力”?

      宇宙時空
      2026-05-15 22:15:06
      馬斯克兒子“小X”為什么可以隨行?他為什么受馬斯克寵愛?

      馬斯克兒子“小X”為什么可以隨行?他為什么受馬斯克寵愛?

      楠楠自語
      2026-05-15 14:48:33
      豐田蘭德酷路澤FJ日本上市 約合19萬人民幣

      豐田蘭德酷路澤FJ日本上市 約合19萬人民幣

      車質網
      2026-05-15 09:09:13
      相戀僅7個月 !皇馬25歲巨星與網紅女友分手:姐弟戀告終

      相戀僅7個月 !皇馬25歲巨星與網紅女友分手:姐弟戀告終

      葉青足球世界
      2026-05-15 20:47:37
      特朗普走了,黃仁勛還留在北京當“吃播”

      特朗普走了,黃仁勛還留在北京當“吃播”

      三叔的裝備空間
      2026-05-15 22:35:14
      原來她是媽媽,難怪兒子如此惹人愛,孩子4個月大就與馬斯克分手

      原來她是媽媽,難怪兒子如此惹人愛,孩子4個月大就與馬斯克分手

      白面書誏
      2026-05-15 13:57:35
      突發:央視已獲世界杯版權,簽約價格揭曉!

      突發:央視已獲世界杯版權,簽約價格揭曉!

      仕道
      2026-05-15 15:59:40
      日本球迷不服了!集體要求取消林詩棟金牌,國際乒聯回應太解氣了

      日本球迷不服了!集體要求取消林詩棟金牌,國際乒聯回應太解氣了

      老黯談娛
      2026-05-14 21:29:31
      大牛市:下周一定要管住手!別亂動!接下來大概率這樣走了!

      大牛市:下周一定要管住手!別亂動!接下來大概率這樣走了!

      夜深愛雜談
      2026-05-15 20:53:14
      15號收評:三大指數集體下挫,所有人都注意,大盤下周或將這樣走

      15號收評:三大指數集體下挫,所有人都注意,大盤下周或將這樣走

      春江財富
      2026-05-15 15:22:23
      2026-05-16 00:20:49
      盒飯財經 incentive-icons
      盒飯財經
      約會最好的商業思想
      1321文章數 16880關注度
      往期回顧 全部

      財經要聞

      騰訊掉隊,馬化騰戳破真相

      頭條要聞

      特朗普稱中方同意購買200架波音飛機 外交部回應

      頭條要聞

      特朗普稱中方同意購買200架波音飛機 外交部回應

      體育要聞

      德約科維奇買的球隊,從第6級聯賽升入法甲

      娛樂要聞

      方媛為何要來《桃花塢6》沒苦硬吃?

      科技要聞

      直降千元起步!蘋果華為率先開啟618讓利

      汽車要聞

      高爾夫GTI刷新紐北紀錄 ID. Polo GTI迎全球首秀

      態度原創

      家居
      親子
      本地
      數碼
      公開課

      家居要聞

      110㎡淡而有致的生活表達

      親子要聞

      一起預防老年癡呆

      本地新聞

      用蘇繡的方式,打開江西婺源

      數碼要聞

      七彩虹2026款iGame M15/M16 Origo筆記本發售,11499元起

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 久久久精品国产亚洲AV日韩| 人成午夜免费大片| 亚洲av不卡电影在线网址最新| 精品人妻系列无码一区二区三区| 久久精品国产精品国产一区| 日韩国产成人精品视频| 日韩成人无码一区二区三区| 日本熟妇人妻中出| 亚洲天堂伊人久久a成人| 丝袜人妖av在线一区二区| 国产真人做爰毛片视频直播| 亚洲日韩日本中文在线| 亚洲中又文字幕精品av| 无码专区视频精品老司机| 精品无码一区二区三区电影| 国产大屁股视频免费区| 亚洲日韩中文字幕天堂不卡| 亚洲人精品亚洲人成在线| 国产精品久久久香蕉| 大屁股国产白浆一二区| 色吊a中文字幕一二三区| 亚洲手机在线播放| 欧美色逼| 久热爱精品视频在线◇| 69式精品视频免费观看| av在线亚洲国产精品| 石景山区| 欧美交a欧美精品喷水| 久草影视午夜福利| 国产色精品久久人妻| 久久亚洲国产成人亚| 福利导航视频| 久久成人 久久鬼色| 96视频在线观看国产| 亚在线观看免费视频入口| 中文字幕乱伦视频| 少妇高潮无套内谢麻豆传| 国产精品一区二区三区黄| 婷婷色在线视频中文字幕| 伊人成人电影| 久久人人做人人爽人人av|