<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek和華為的雙向奔赴

      0
      分享至


      上周,DeepSeek V4發布,朋友圈立刻刷屏。

      這次DeepSeek,依舊奔著把國產AI水平推一大截來的。據報道,它的推理性能,比肩Chatgpt和Gemini。編程任務,表現接近Opus 4.6。雖然有1.6萬億參數,但只動用了同行1/4GPU。

      厲害。但我覺得,這次DeepSeek發布,最值得注意的,或許不是上邊這些讓人眼花繚亂的模型能力,而是官宣文章配圖下的,一行小字:

      受限于高端算力,目前Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,Pro的價格會大幅下調。


      (位置大概在這里)

      意思就是:API貴,是因為芯片不夠。等下半年華為的芯片出貨,價格就能降下去了。

      這有什么?不就是沒辦法了嗎?拿不到高端芯片,只能等國產頂上唄。

      其實,不是的。早在兩個月前,路透社就有報道:

      DeepSeek,未向美國芯片廠商提供模型用于性能優化,而是優先向華為等本土廠商開放早期訪問權限。


      明明可以選擇現成的方案,但DeepSeek沒有。

      所以,這不是很多人以為的“不得不”,這更像是一次“主動押注”。

      這中間,發生了什么?


      01

      DeepSeek,是一個倒逼芯片互聯的模型

      這要從DeepSeek的技術路線說起。

      它的技術路線,是MoE(Mixture of Experts),專家混合。

      什么意思?我打個比方。

      你突發頭痛,去醫院看病。你當然希望看病的醫生,懂得越多越好。內科、外科、心血管、腦神經,全都精通。但問題是,要培養這樣的全科醫生,成本太高。每個醫生,可能要花30年才能畢業。

      問傳統大模型問題,就像向全能醫生問診。無論什么專業問題,它都調動全部參數回答。雖然省心強大,但也很貴。

      怎么辦?DeepSeek換了個思路。

      它沒有訓練一個什么都懂的全科醫生,而是訓練了多個??漆t生。外科只管外科,內科只管內科。然后,設一個導診臺。你問問題,導診臺把問題分配給負責的醫生,其他醫生待命。

      這就是:混合專家系統(MoE)。它雖然擁有巨大參數作為知識儲備,卻可以針對不同問題,激活部分參數干活。

      所以,DeepSeek官方介紹才會這么說:

      DeepSeek-V4-Pro總參數1.6T、激活參數49B,DeepSeek-V4-Flash總參數284B、激活參數13B。


      拿V4-Pro舉例,就是:參數總量1.6萬億,但每次問答激活490億。

      不過,MoE架構雖然神奇,但也有限制。比如:All-to-All通信。

      幾百個專科醫生,如果想要順利協作,就需要導診臺把病人快速分發到不同科室,再把結果匯總回來。用專業術語來說,就是All-to-All通信。每顆芯片,都要隨時跟其他芯片說話,稍有延遲,效率就會大幅降低。

      Moe的核心,是用通信換算力。通信跟不上,延遲就會成為瓶頸。

      那么,如何把芯片間的通信做好?


      02

      英偉達的NVL72,碰到了銅纜的物理極限

      英偉達說,芯片通信?我拿手啊。我還有套專門的技術:

      NVLink。

      NVLink,是英偉達的GPU連接協議。它能讓GPU和GPU之間的傳輸速度達TB級,半秒就能搬空你主力電腦里的所有資料。英偉達的主力產品NVL72,就是靠這種技術,才把72顆芯片連成一個計算單元的。

      那DeepSeek要不要用它提供算力呢?

      理論上或許行,但實際上并不容易。這種頂級算力設備,會受美國出口管制。而且,作為MoE架構模型,同時參與的芯片越多,DeepSeek跑得越好。面對海量用戶請求,72塊芯片,可能還不夠。

      但依靠之前的方案,英偉達很難增加并行芯片數量。因為:銅纜。

      如果你打開NVL72后蓋,你會看到一個由幾千根銅纜,編織而成的密網??傞L度數公里,是機柜重量超過一噸的重要來源。


      為什么這么麻煩?

      在每秒上TB的數據傳輸下,銅纜信號的有效傳輸距離,可能還不到1米。再加芯片,要么機柜塞不下,要么銅纜夠不著。靠普通網線,帶寬延遲又成了問題。換句話說,目前密密麻麻的銅纜,已經逼近了物理上限。

      怎么辦?華為想到一個辦法:光。


      03

      華為用光,把384顆芯片變成了一顆“超級芯片”

      比起銅纜,光纖至少有2個核心優勢。

      1、傳得遠。

      銅纜傳不遠,因為電信號傳輸越高速,損耗和干擾也會同步增加。但光子相對不受電阻電磁干擾,哪怕幾百米傳輸依然穩定,讓GPU跨機柜分布成為可能。

      2、帶寬高。

      但光纖,可以同時傳輸多個波長的光信號,相當于一條路上開多個車道,互不干擾。所以,光纖的帶寬,理論上能輕松達到幾Tb每秒,甚至更高。

      確實優勢很大??墒?,全世界的機房不都在用光纖嗎?我家的寬帶都是光纖的,華為用光有什么厲害的?

      區別就在于:用在哪。

      你家寬帶的光纖,是從小區到樓棟,偶爾斷幾秒你感覺不到。數據中心的光纖,是從一個機柜到另一個機柜,斷一下業務自動切換,你也沒感覺。

      但華為把光用在了芯片與芯片間的通信。這就要求,幾百顆芯片要在納秒級的時間內同步數據,任何芯片掉線、延遲,就會拖慢整體效率。這種場景叫:Scale-Up(縱向擴展),把多顆芯片變成一顆“超級芯片”。

      2025年7月,華為首次展出了CloudMatrix 384超節點。


      這個計算單元,通過6000多個光模塊,3000多根光纖,把384顆昇騰芯片連在了一起,就像一顆“超級芯片”。任何兩顆芯片之間通信,延遲極低,帶寬極高。

      本質上,它是一個兩層結構:

      機柜內,GPU之間依然用銅互連,先把一組GPU變成一個小單元。機柜間用光纖連接,擴展成384卡規模。

      這也是2025年9月,華為輪值董事長徐直軍在大會上,所強調的:

      超節點在物理上是多機柜、多個卡聯接成一個超節點,但是它們能夠像一臺計算機一樣工作、學習、思考、推理。

      這只是開始。預計今年年底,華為將推出支持8192張昇騰卡互聯的計算單元。未來,還會實現萬卡互聯。

      你相信光嗎?不管你信不信,華為先信為敬。


      04

      DeepSeek的反向適配,從去年就可以看到了

      講到這,你可能會問:

      那DeepSeek又做了什么呢?只是挑了個供應商嗎?

      不是的。早在2025年8月,DeepSeek發布V3.1,就有這樣一句話:

      DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的參數精度。

      UE8M0 FP8。啥意思?

      模型的參數,是它的肌肉記憶。用什么格式的存儲參數,幾乎決定了它在芯片上跑得多快。英偉達的芯片,習慣用E4M3等格式,而華為昇騰的芯片,原生支持UE8M0格式。

      這就像一個人本來的設備,都用Apple的Lightning接口。但現在,他把家里所有設備的充電口、數據線、轉接頭,全換成了Type-C。

      看著是個小動作,但卻意味著,對生態的徹底押注。

      所以,才有了DeepSeek官方,在文章下邊放出的一句話:


      今年4月,多家外媒同時報道:

      DeepSeek團隊拒絕了像英偉達等芯片公司,提前介入做優化的請求,只和華為等國產公司合作,進行底層架構的優化。

      這進一步說明,DeepSeek已經決意,把整個底層架構,從英偉達的CUDA,遷移到華為的昇騰芯片上。

      但繞開英偉達,確實不是一個輕松的選擇。

      要知道,英偉達不只提供算力,還提供一整套“把算力榨干”的方法。

      大多數AI模型,都運行在英偉達的芯片上。CUDA,則是英偉達配套的開發環境。他們倆,就像電腦主機和Windows操作系統。

      過去十幾年,全世界的AI科學家、開發者,都習慣在CUDA上,寫代碼、開發應用。一旦繞開CUDA,就意味著數百萬行代碼從頭開始,意味著大量過往的經驗不適配。甚至,工程能否進行下去,都是兩說。

      據透露,2025年年中,DeepSeek在用華為芯片訓練V4的過程中,遇到了大量中途崩潰、芯片間通信速度未達預期等問題。但他們沒有放棄。最終,DeepSeek-V4在昇騰上的推理速度,比遷移初期提升35倍。

      據傳言,梁文鋒還曾說:

      V4從英偉達生態搬到華為,相當于“在飛行中的飛機上更換引擎”。


      05

      這行小字,意味著中國的AI產業,正在邁過3道坎

      現在,我們終于能知道,為什么那行小字,那么重要了。

      因為它可能意味著,中國AI產業,正在邁過至少3道坎。

      比如,算力坎。

      過去幾年,AI算力的默認邏輯,可能是:單卡更強,更有優勢。

      但今天,打法換了。既然AI要解決并行計算問題,那當單卡性能足夠,我們能不能用系統把算力堆出來?超節點、光互連的本質,就是讓很多張卡,像一張卡一樣協同工作。

      1個燈泡不夠亮,10個燈泡放到一個燈盞里,亮度總是夠的。

      比如,生態坎。

      英偉達最可怕的,不只是GPU強,而是用CUDA,把開發者二十多年的習慣、訓練框架、調優經驗,綁在了一起。換國產芯片最難的一關,是原來那套工具和經驗,不能直接平移。

      但DeepSeek全面支持華為芯片,意味著從今往后,你部署DeepSeek,不必依賴CUDA。國產芯片,國產工具,也能跑頂級模型。

      甚至,是默認路徑的坎。

      未來,AI一定會逐漸走向東南亞、中東、非洲。這些地方的開發者,不會從零開始。哪個生態里的模型最多、最好用,他們就用哪個。

      一旦我們的模型+芯片生態,在海外生根發芽,全球的開發者,就會基于昇騰+DeepSeek寫教程、搭框架、做應用。生態,就會像滾雪球一樣越滾越大,默認的標準和路徑,就成了中國。

      當你定義接口和標準,你就定義了競爭的方式。

      今天,AI世界的權力游戲,正式進入下半場。

      上半場,是拼誰先把模型做大,拼誰先把GPU堆滿。下半場,是拼誰能用最低的成本、最自主的生態,把AI能力像水電煤一樣輸送出去。

      在這條路上,DeepSeek走出了最關鍵的一步。

      這一步,價值連城。

      參考資料:

      觀點/ 劉潤主筆/ 景九編輯/ 歌平版面/ 黃 靜

      這是劉潤公眾號第2925篇原創文章。未經授權,禁止任何機構或個人抓取本文內容,用于訓練AI大模型等用途

      PS:

      大家對這個話題的討論,是這次AI革命的集中縮影。

      在見證了這些年 大模型 能力的瘋狂內卷后,2026,正式來到了AI技術的落地之年。許多舊職業正在消失()。許多新行業正在興起()。而這幾

      所以,5月16日,我將在上海影城1000人的大劇場。與你分享【劉潤·年中大課】。今年的主題就是:

      不做現場直播。也不做事后回放。這樣,我可以更加放開地分享一些此前從未說過的內容。點擊下方購票鏈接,就可以了解到更加詳細的票務信息。

      現在搶先購買,或是帶著團隊一起來,還可以享受到“早鳥價”。

      5月16日,我們不見不散!




      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      一旦任務落到某部門頭上,部門第一反應不是“我怎么把它干好”,而是“我還能拉上誰”。

      一旦任務落到某部門頭上,部門第一反應不是“我怎么把它干好”,而是“我還能拉上誰”。

      碧翰烽
      2026-05-11 07:17:40
      孫穎莎王曼昱的教練還有這一面?馬琳在世乒賽“修行”:每一場都是新開始

      孫穎莎王曼昱的教練還有這一面?馬琳在世乒賽“修行”:每一場都是新開始

      上觀新聞
      2026-05-10 21:58:07
      職稱要倒查十年了

      職稱要倒查十年了

      新浪財經
      2026-05-10 14:14:04
      重慶車禍后續:女司機身份被扒,當地人曝技術差,挪車都要人指揮

      重慶車禍后續:女司機身份被扒,當地人曝技術差,挪車都要人指揮

      南城無雙
      2026-05-11 02:17:55
      澤連斯基警告:俄軍一旦恢復大規模空襲,烏軍遠程打擊將立刻重啟

      澤連斯基警告:俄軍一旦恢復大規模空襲,烏軍遠程打擊將立刻重啟

      桂系007
      2026-05-11 04:50:35
      張本美和丟冠并無沮喪!笑著解說男團決賽 擊敗王曼昱直言有收獲

      張本美和丟冠并無沮喪!笑著解說男團決賽 擊敗王曼昱直言有收獲

      顏小白的籃球夢
      2026-05-11 06:52:19
      別被孫穎莎的“大心臟”騙了!臺灣解說驚呼背后,藏著3大真相

      別被孫穎莎的“大心臟”騙了!臺灣解說驚呼背后,藏著3大真相

      格斗社
      2026-04-03 20:24:03
      特朗普拒絕中方要求,美媒連忙警告:別擺架子,中國不期待你訪華

      特朗普拒絕中方要求,美媒連忙警告:別擺架子,中國不期待你訪華

      影孖看世界
      2026-05-10 23:17:13
      德云社弟子大洗牌!3人自斷后路,岳云鵬邊緣,燒餅一哥地位穩了

      德云社弟子大洗牌!3人自斷后路,岳云鵬邊緣,燒餅一哥地位穩了

      白面書誏
      2026-05-08 15:52:08
      為了沖10%增長,越南賭場KTV全面松綁

      為了沖10%增長,越南賭場KTV全面松綁

      鳳眼論
      2026-05-10 22:14:23
      大伯出獄全家沒人接,我開車去接他,他偷偷塞我一張卡說有1200萬

      大伯出獄全家沒人接,我開車去接他,他偷偷塞我一張卡說有1200萬

      千秋文化
      2026-05-09 20:08:48
      打過科興疫苗的朋友,最近一定要提高警惕!千萬不要被騙!

      打過科興疫苗的朋友,最近一定要提高警惕!千萬不要被騙!

      網絡易不易
      2026-05-10 11:34:41
      FIFA以1.2億美元“賤賣”世界杯轉播權,CCTV該不該接?

      FIFA以1.2億美元“賤賣”世界杯轉播權,CCTV該不該接?

      新浪財經
      2026-05-10 18:02:01
      巴薩2-0皇馬 提前3輪奪冠

      巴薩2-0皇馬 提前3輪奪冠

      上游新聞
      2026-05-11 07:12:03
      尼克斯橫掃費城:唐斯與恩比德的命運與角色

      尼克斯橫掃費城:唐斯與恩比德的命運與角色

      張佳瑋寫字的地方
      2026-05-11 06:55:13
      她18歲為人母,25歲四登春晚,跟逃犯睡了6年卻不知對方身份?

      她18歲為人母,25歲四登春晚,跟逃犯睡了6年卻不知對方身份?

      白面書誏
      2026-05-09 14:59:44
      大S女兒開通社媒!只關注徐家人沒理睬爸爸,還點贊大S具俊曄合照

      大S女兒開通社媒!只關注徐家人沒理睬爸爸,還點贊大S具俊曄合照

      萌神木木
      2026-05-10 18:12:46
      贏球還道歉?梁靖崑賽后哽咽全程不敢看鏡頭,心里是憋了多大委屈

      贏球還道歉?梁靖崑賽后哽咽全程不敢看鏡頭,心里是憋了多大委屈

      樂悠悠娛樂
      2026-05-10 11:56:28
      胎壓2.5是謊言?干了十年汽修,我來告訴你真正的標準!

      胎壓2.5是謊言?干了十年汽修,我來告訴你真正的標準!

      娛樂圈的筆娛君
      2026-05-10 01:52:36
      普京表態引發關注,雙方啟動交換戰俘,俄烏沖突“正走向結束”?

      普京表態引發關注,雙方啟動交換戰俘,俄烏沖突“正走向結束”?

      環球網資訊
      2026-05-11 07:00:15
      2026-05-11 09:32:49
      劉潤 incentive-icons
      劉潤
      劉潤,潤米咨詢創始人,“5分鐘商學院”課程主理人,著名商業顧問
      4962文章數 24763關注度
      往期回顧 全部

      科技要聞

      股價一年暴漲160%!谷歌憑什么?

      頭條要聞

      男子將女鄰居手機號寫在公廁致其頻遭騷擾 一審獲緩刑

      頭條要聞

      男子將女鄰居手機號寫在公廁致其頻遭騷擾 一審獲緩刑

      體育要聞

      那個曾讓詹姆斯抱頭的兄弟,40歲從大學畢業了

      娛樂要聞

      趙露思老實人豁出去了 沒舞蹈天賦硬跳

      財經要聞

      "手搓汽車"曝光:偽造證件、電池以舊代新

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      健康
      親子
      時尚
      公開課
      軍事航空

      干細胞能讓人“返老還童”嗎

      親子要聞

      一天天操碎了心~

      輕松拿捏又甜又酷的造型,試試這些輕熟穿搭,溫柔有女人味兒

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      伊朗革命衛隊深夜警告

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 丁香综合| 亚洲国产一区在线播放| 午夜精品久久久久久久99老熟妇| 国产综合av一区二区三区| 国产va在线观看| 亚洲精品美女久久7777777| 波多野结衣一区| 国产av毛片精品一区二区三区| 亚洲性啪啪无码av天堂| 在线日韩日本国产亚洲| 国产精品男同| 久久se精品一区精品二区国产| 久久成人国产精品一区二区| 日韩成人免费无码不卡视频| 欧美老熟妇乱子伦牲交视频| 精品免费一区二区在线| 毛片无遮挡高清免费| 老湿机喷水福利国产在线| 优优人体大尺大尺无毒不卡| 99xxxx激情综合网| 无码精品国产va在线观看dvd| 成人片黄网站色大片免费观看| 欧美在线综合视频| 人妻熟妇女的欲乱系列| 99久久婷婷国产综合精品青草漫画| 国产性色播播毛片| 久久99久久99精品免视看动漫| 亚洲妇女无套内射精| 国产大片91精品免费看3| 亚洲综合激情五月丁香六月| 亚洲成人有码免费在线| 亚洲学生妹高清av| 日日干天天操| 午夜无码成人A片免费| 国产精品 无码专区| 久久国产热精品波多野结衣av| 日本19禁啪啪吃奶大尺度| 亚洲九九视频| 337p粉嫩大胆色噜噜噜| 人妻精品影视在线观看| 一本色道久久综合网|