<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      DeepSeek V4:一句"下半年上國產(chǎn)算力",比所有發(fā)布會都重要

      0
      分享至


      他來了,他來了,他帶著V4走來了。


      前兩天我們才聊過DeepSeek融資的事兒,今天V4就上新了,普天同慶了屬于是。

      上一次DeepSeek引發(fā)全球震動,是2025年初V3正式發(fā)布的時(shí)候。那一次,一個(gè)中國團(tuán)隊(duì)用據(jù)稱不到600萬美元的算力成本,訓(xùn)練出了一個(gè)可以和GPT-4正面競爭的模型,然后把它開源,整個(gè)硅谷集體失語了幾天,英偉達(dá)股票直接一波暴跌。

      之后的一年,AI圈的發(fā)布節(jié)奏快得令人眩暈。Anthropic發(fā)了Claude 4系列,Google推了Gemini-Pro-3.1,OpenAI在o系列上持續(xù)迭代,最近更是恐怖,一周時(shí)間里,我們相繼見證了image 2.0和GPT-5.5的發(fā)布,全球AI領(lǐng)域堪稱是“勃勃生機(jī),萬物競發(fā)”的境界。

      而DeepSeek那邊,只發(fā)了幾個(gè)不算引人注目的中間版本:V3.1、V3.2-Exp,每次跑分和前代差不多,看起來像是在原地踏步。

      關(guān)于V4什么時(shí)候發(fā)的傳言從2025年底就沒停過。有人說是和之前一樣在春節(jié)前,結(jié)果卻是一直等到了四月底。

      然后零幀起手,毫無預(yù)警,DeepSeek把V4放出來了。同步開源,同步上線官網(wǎng)和App,同步更新API。發(fā)布稿結(jié)尾引了一句荀子:「不誘于譽(yù),不恐于誹,率道而行,端然正己。」

      現(xiàn)在回頭看那些"沒什么亮點(diǎn)"的中間版本,才明白那是在鋪路。


      V4是什么


      這次V4一口氣發(fā)了兩個(gè)版本。

      DeepSeek-V4-Pro,總參數(shù)1.6萬億,每次推理激活49億。定位是對標(biāo)頂級閉源模型的旗艦版本。DeepSeek-V4-Flash,總參數(shù)2840億,激活130億,是更小更快的經(jīng)濟(jì)版本。

      理解這兩個(gè)數(shù)字需要先理解V4的架構(gòu)。

      V4采用的是MoE(混合專家)架構(gòu),模型內(nèi)部有大量"專家"子網(wǎng)絡(luò),每次處理一個(gè)token時(shí),由路由機(jī)制決定激活哪幾個(gè)專家參與計(jì)算。這意味著,V4-Pro雖然有1.6萬億參數(shù),但實(shí)際每次推理的計(jì)算量更接近一個(gè)490億參數(shù)的稠密模型。總參數(shù)決定知識容量,激活參數(shù)決定推理成本,這是MoE架構(gòu)最核心的商業(yè)邏輯。

      為什么這個(gè)原理很重要呢?

      因?yàn)?/strong>推理成本主要由激活參數(shù)量決定,不是總參數(shù)量。

      所以V4-Pro的實(shí)際推理開銷更接近一個(gè)49B的稠密模型,而不是1.6T。但它的"知識容量"理論上接近1.6T,因?yàn)椴煌瑃oken會激活不同的專家組合。

      打個(gè)簡單的比方就是:一家公司1600個(gè)員工,個(gè)個(gè)都身懷絕技,每個(gè)項(xiàng)目只調(diào)49人上陣,但可以按需組合不同專家。

      在能力評估上,DeepSeek的官方定位有幾個(gè)值得注意的地方。

      首先,他們沒有回避上限,這本身就是一種坦然和自信。發(fā)布稿明確寫道,V4-Pro的Agent能力優(yōu)于Sonnet 4.5,交付質(zhì)量接近Opus 4.6非思考模式,但仍與Opus 4.6思考模式存在一定差距。這種有上限有下限的寫法,在國內(nèi)AI發(fā)布稿里相對罕見,反而增加了可信度。

      其次,能力的分布是不均勻的。在數(shù)學(xué)、STEM、競賽型代碼等推理密集的任務(wù)上,V4-Pro聲稱超越所有開源模型,比肩頂級閉源。這和DeepSeek歷來的強(qiáng)項(xiàng)一致。但在世界知識方面——也就是對事實(shí)性信息的覆蓋廣度——V4-Pro僅稍遜于Gemini-Pro-3.1,大幅領(lǐng)先其他開源模型。世界知識這塊的差距來自數(shù)據(jù),Google有Search索引和更大規(guī)模網(wǎng)頁抓取的結(jié)構(gòu)性優(yōu)勢,這不是算法可以短期彌補(bǔ)的。

      V4-Flash的定位是明確的性價(jià)比選擇。推理能力接近Pro,世界知識稍遜,但因?yàn)榧せ顓?shù)只有13B,API價(jià)格更便宜,響應(yīng)更快。在Agent測評中,F(xiàn)lash在簡單任務(wù)上和Pro旗鼓相當(dāng),復(fù)雜任務(wù)上有明顯差距。對于大多數(shù)實(shí)際部署場景,F(xiàn)lash可能是更合理的默認(rèn)選擇。


      1M上下文:從王牌變成基本操作

      這是V4最值得認(rèn)真對待的變化,但理解它需要一點(diǎn)背景。

      一年前,百萬token的上下文窗口是Gemini的獨(dú)家特性,是Google用來區(qū)隔競爭對手的產(chǎn)品王牌。彼時(shí)其他所有主流模型,閉源的要么128K要么200K,開源的幾乎沒人能在這個(gè)量級上做到可用。1M上下文意味著可以把一整部長篇小說、一個(gè)大型代碼庫、幾十份研究報(bào)告同時(shí)塞進(jìn)模型的"工作記憶"里。這是一種質(zhì)變,不只是量變。

      今天,DeepSeek1M上下文定成了所有官方服務(wù)的標(biāo)配,并且開源。

      問題是:為什么現(xiàn)在可以做到了?

      傳統(tǒng)Transformer架構(gòu)有一個(gè)根本性的擴(kuò)展難題:注意力機(jī)制的計(jì)算量隨上下文長度平方級增長。上下文翻倍,計(jì)算量變四倍。這意味著把上下文從128K擴(kuò)展到1M,理論上計(jì)算量會增長約60倍。在這個(gè)約束下,1M上下文要么需要極大的算力投入,要么速度慢到不可用,要么兩者兼而有之。

      V4的回答是DSADeepSeek Sparse Attention,稀疏注意力機(jī)制。

      用大白話解釋一下就是:想象你在讀一本1000頁的書,你要回答的問題是"第500頁的觀點(diǎn)和哪些內(nèi)容有關(guān)"。笨辦法是把第500頁和其他999頁逐一比較,一共做999次比較。頁數(shù)翻倍,工作量變四倍——這就是平方增長的問題。

      聰明辦法分兩步:

      第一步(DSA):先粗略掃一眼,判斷哪些頁面可能相關(guān),只精讀那幾十頁,其他的直接跳過。大多數(shù)頁面和第500頁根本沒關(guān)系,不算也不會影響答案。

      第二步(token壓縮):就算是那幾十頁"相關(guān)頁面",也不需要一字不差地讀,可以先把每頁壓縮成一段摘要,用摘要來做比較。信息量再縮一輪。

      兩步疊加之后,書從1000頁變成2000頁,工作量不再是原來的四倍,而是大概兩倍多——增長曲線被壓平了。


      這就是V4能把1M上下文做得既長又不貴的核心原因。。

      這個(gè)架構(gòu)的種子早在V3.2-Exp就已經(jīng)種下。當(dāng)時(shí)外界幾乎沒有人注意到DSA的引入,因?yàn)榕芊肿兓淮螅雌饋硐袷且淮螣o聊的中間版本。現(xiàn)在回頭看,那是在用一個(gè)低調(diào)的版本驗(yàn)證新架構(gòu)在生產(chǎn)環(huán)境下的穩(wěn)定性。V3.2是V4的地基,不是一次失敗的嘗試。

      1M上下文變成開源標(biāo)配的意義,不在于數(shù)字本身,而在于成本曲線的改變這個(gè)技術(shù)壁壘一旦被打穿并且開源,任何團(tuán)隊(duì)都可以在這個(gè)架構(gòu)基礎(chǔ)上繼續(xù)迭代。長上下文從一個(gè)"有足夠算力才能玩"的高端功能,變成了任何人都能用的基礎(chǔ)能力。

      這對Agent應(yīng)用的影響尤其直接。

      Agent任務(wù)的一個(gè)核心約束一直是上下文管理:任務(wù)鏈越長,需要維護(hù)的狀態(tài)越多,有限的上下文窗口很快就成為瓶頸。1M窗口意味著Agent可以在一個(gè)更長的操作鏈里保持狀態(tài)連貫,處理更大規(guī)模的代碼庫,跨越更多文檔進(jìn)行推理。

      這也部分解釋了為什么V4在Agent評測上的提升幅度如此顯著——不只是模型變聰明了,底層條件也發(fā)生變化了。


      國產(chǎn)算力:一條不依賴英偉達(dá)的路

      發(fā)布稿里有一句話被很多人忽略了:下半年批量上國產(chǎn)算力。


      這句話的分量,需要放在過去兩年的地緣政治背景里才能看清楚。

      2023年以來,美國對華芯片出口管制持續(xù)升級,英偉達(dá)H100、H800、A100相繼被限制出口中國。這對中國AI公司的算力供給構(gòu)成了實(shí)質(zhì)性壓力。訓(xùn)練和部署大型語言模型需要大量高端GPU,而可以合法獲得的選項(xiàng)越來越少。

      DeepSeek此前的訓(xùn)練主要依賴英偉達(dá)算力,V3的訓(xùn)練用的是H800集群。但隨著出口管制收緊,這條路的可持續(xù)性越來越存疑。

      昇騰系列是目前國內(nèi)最成熟的替代方案。這次發(fā)布稿里,昇騰方面提供了相當(dāng)詳細(xì)的技術(shù)數(shù)據(jù)。昇騰950超節(jié)點(diǎn)上,V4-Pro的推理延遲可以達(dá)到TPOT 20毫秒,V4-Flash達(dá)到10毫秒。

      當(dāng)然,這些數(shù)字都是在離線推理模式下采集的,不包含實(shí)際服務(wù)調(diào)度的負(fù)載,現(xiàn)實(shí)部署中的數(shù)字會有折扣。但方向是明確的:昇騰已經(jīng)能夠支撐V4系列模型的量產(chǎn)部署,不再只是實(shí)驗(yàn)室里的備選方案。

      "下半年批量上國產(chǎn)算力"意味著什么?至少有兩個(gè)層面的含義。

      第一層是供給安全。如果DeepSeek能在昇騰上實(shí)現(xiàn)和英偉達(dá)相近的推理性能,那么算力供給就不再是一個(gè)單點(diǎn)風(fēng)險(xiǎn)。出口管制的影響會被部分對沖。

      第二層是生態(tài)信號。DeepSeek是中國最具影響力的開源模型之一,如果它正式在昇騰上規(guī)模部署,會帶動整個(gè)開源社區(qū)和下游應(yīng)用去適配昇騰生態(tài)。這對國產(chǎn)算力來說是一個(gè)遠(yuǎn)比單純硬件銷售更有價(jià)值的背書。

      不過,無論如何吧,DeepSeek和國產(chǎn)算力的深度綁定,是這次發(fā)布里最具長期戰(zhàn)略意義的一筆——算是從底子上開辟新格局,有自己的生態(tài)了

      雖然說現(xiàn)在還是有一定的遺憾,但能看出來,時(shí)期

      V4發(fā)布稿結(jié)尾引的那句荀子的話,放在整個(gè)故事的語境里有點(diǎn)意味深長:

      不誘于譽(yù),不恐于誹,

      率道而行,端然正己。

      走自己的路,讓他們說去吧!

      這個(gè)節(jié)奏本身,也許就是他們最想傳遞的信息。


      見證中國科技奔赴星辰大海

      專注產(chǎn)業(yè)鏈分析和案例寫作

      關(guān)注AI、互聯(lián)網(wǎng)、汽車、消費(fèi)電子

      半導(dǎo)體等前沿科技產(chǎn)業(yè)


      入駐媒體平臺

      36Kr/ 觀察者網(wǎng)風(fēng)聞社區(qū)/ 網(wǎng)易

      虎嗅/ 雪球/ 騰 訊新聞

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      《主角》主角差評如潮,出場十幾秒,網(wǎng)友評價(jià):雙眼無神像瞎子

      《主角》主角差評如潮,出場十幾秒,網(wǎng)友評價(jià):雙眼無神像瞎子

      劇芒芒
      2026-05-11 12:21:15
      肖華被架上火烤!聯(lián)盟三大壓力纏身,馬刺森林狼天王山陷公平爭議

      肖華被架上火烤!聯(lián)盟三大壓力纏身,馬刺森林狼天王山陷公平爭議

      田先生籃球
      2026-05-11 12:46:48
      難以置信!網(wǎng)傳大學(xué)教授點(diǎn)外賣被騎手教育,反懟其“提鞋都不配”

      難以置信!網(wǎng)傳大學(xué)教授點(diǎn)外賣被騎手教育,反懟其“提鞋都不配”

      火山詩話
      2026-05-11 16:17:16
      笑死!春秋航空迎來最嚴(yán)厲的父親?迪卡儂“巨型背包”刷屏!網(wǎng)友:出門撿瓶子,遲早能買房...

      笑死!春秋航空迎來最嚴(yán)厲的父親?迪卡儂“巨型背包”刷屏!網(wǎng)友:出門撿瓶子,遲早能買房...

      品牌新
      2026-05-11 16:30:28
      六臺:皇馬輸?shù)魢业卤群螅钒团逡恢贝诨蜀R基地

      六臺:皇馬輸?shù)魢业卤群螅钒团逡恢贝诨蜀R基地

      懂球帝
      2026-05-11 18:51:07
      “漢坦病毒”來襲,醫(yī)生提醒:寧可每天看電視,也不要出門做6事

      “漢坦病毒”來襲,醫(yī)生提醒:寧可每天看電視,也不要出門做6事

      路醫(yī)生健康科普
      2026-05-11 17:39:53
      上海金融女博士罕見發(fā)聲:A股如果迎來牛市,建議死啃2560戰(zhàn)法!

      上海金融女博士罕見發(fā)聲:A股如果迎來牛市,建議死啃2560戰(zhàn)法!

      股經(jīng)縱橫談
      2026-05-11 18:38:47
      公安局局長張安疆同志離世后,一個(gè)令人震驚的消息出現(xiàn)了!

      公安局局長張安疆同志離世后,一個(gè)令人震驚的消息出現(xiàn)了!

      李昕言溫度空間
      2026-05-11 21:53:03
      為什么一定要用傷病纏身的梁靖崑?日本攝影師一句話戳穿真相!

      為什么一定要用傷病纏身的梁靖崑?日本攝影師一句話戳穿真相!

      石辰搞笑日常
      2026-05-11 12:28:09
      為啥建議盡量用現(xiàn)金支付?3個(gè)現(xiàn)實(shí)原因,看完你也會揣現(xiàn)金出門

      為啥建議盡量用現(xiàn)金支付?3個(gè)現(xiàn)實(shí)原因,看完你也會揣現(xiàn)金出門

      老特有話說
      2026-05-10 21:01:02
      坑慘OPPO,驚壞華為大疆,武大母校痛心,余思月事后狡辯掉人心!

      坑慘OPPO,驚壞華為大疆,武大母校痛心,余思月事后狡辯掉人心!

      小兔子發(fā)現(xiàn)大事情
      2026-05-11 16:17:25
      摩洛哥姑娘嫁江蘇農(nóng)村小伙,婚禮全程開心大笑,攝影師感慨:拍了七年婚禮沒見過這樣的

      摩洛哥姑娘嫁江蘇農(nóng)村小伙,婚禮全程開心大笑,攝影師感慨:拍了七年婚禮沒見過這樣的

      可達(dá)鴨面面觀
      2026-05-10 13:46:52
      阿根廷公布世界杯55人大名單:迪巴拉無緣!上屆5位冠軍成員落選

      阿根廷公布世界杯55人大名單:迪巴拉無緣!上屆5位冠軍成員落選

      我愛英超
      2026-05-11 21:12:05
      舉報(bào)成風(fēng),正在壓垮教育!

      舉報(bào)成風(fēng),正在壓垮教育!

      行者殷濤
      2026-05-11 19:00:42
      難怪日本女乒敢沖金牌,原來主教練是他,是馬琳師兄卻落選國家隊(duì)

      難怪日本女乒敢沖金牌,原來主教練是他,是馬琳師兄卻落選國家隊(duì)

      以茶帶書
      2026-05-11 16:27:51
      保級懸念仍在!英超還剩最后兩輪,熱刺領(lǐng)先西漢姆聯(lián)2分

      保級懸念仍在!英超還剩最后兩輪,熱刺領(lǐng)先西漢姆聯(lián)2分

      懂球帝
      2026-05-12 05:10:18
      “到底是哪個(gè)天才想出的在北京種月季?”

      “到底是哪個(gè)天才想出的在北京種月季?”

      新浪財(cái)經(jīng)
      2026-05-11 17:55:50
      京滬高鐵宣布,漲價(jià)!

      京滬高鐵宣布,漲價(jià)!

      中國基金報(bào)
      2026-05-11 19:58:07
      俄閱兵活動簡化,普京保護(hù)措施加強(qiáng),有情報(bào)猜測可能與紹伊古有關(guān)

      俄閱兵活動簡化,普京保護(hù)措施加強(qiáng),有情報(bào)猜測可能與紹伊古有關(guān)

      麓谷隱士
      2026-05-11 14:01:34
      堅(jiān)決抵制!國際足聯(lián)天價(jià)轉(zhuǎn)播權(quán)被拒絕后,直接把中文從官網(wǎng)除名

      堅(jiān)決抵制!國際足聯(lián)天價(jià)轉(zhuǎn)播權(quán)被拒絕后,直接把中文從官網(wǎng)除名

      南方健哥
      2026-05-11 22:55:35
      2026-05-12 05:43:00
      星海情報(bào)局 incentive-icons
      星海情報(bào)局
      關(guān)注“中國制造”的星辰大海
      1255文章數(shù) 2023關(guān)注度
      往期回顧 全部

      科技要聞

      黃仁勛:你們趕上了一代人一次的大機(jī)會

      頭條要聞

      間諜引誘國企人員進(jìn)色情場所 拍艷照要挾對方加入

      頭條要聞

      間諜引誘國企人員進(jìn)色情場所 拍艷照要挾對方加入

      體育要聞

      梁靖崑:可能是最后一屆了,想讓大家記住這個(gè)我

      娛樂要聞

      “孕婦墜崖案”王暖暖稱被霸凌協(xié)商解約

      財(cái)經(jīng)要聞

      宗馥莉罷免銷售負(fù)責(zé)人 部分業(yè)務(wù)將外包

      汽車要聞

      吉利銀河“TT”申報(bào)圖曝光 電動尾翼+激光雷達(dá)

      態(tài)度原創(chuàng)

      藝術(shù)
      家居
      旅游
      房產(chǎn)
      軍事航空

      藝術(shù)要聞

      人民幣78歲了!你見沒見過的人民幣,都在這里!

      家居要聞

      多元生活 此處無聲

      旅游要聞

      打卡同色系風(fēng)景 帶火城市微旅行

      房產(chǎn)要聞

      產(chǎn)業(yè)賦能教育!翰林府與北師大的這場簽約,絕不那么簡單!

      軍事要聞

      特朗普:伊朗的回應(yīng)“完全不可接受”

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 亚洲欧洲av无码专区| 国产午夜福利大片免费看| 亚洲第一av网站| 亚洲熟妇丰满大屁股熟妇| 99视频精品全国免费品| 一级毛片在线观看免费 | 亚洲一区二区精品动漫| 日韩欧美一卡2卡3卡4卡无卡免费2020 | 制服国产欧美亚洲日韩| 欧美a视频在线观看| 99久久综合狠狠综合久久男同| 亚洲女人αV天堂在线| 色图4区| 亚洲精品九九| 午夜国产精品视频黄| 五月综合激情视频在线观看| 亚洲自偷自偷在线成人网站传媒| 欧美性大战久久久久久久| 西西人体大胆瓣开下部自慰| 亚洲二区av| 91在线播放真人| 丰满女邻居的嫩苞张开视频| 亚洲欧洲无码av电影在线观看| 久久精品AⅤ无码中文字字幕蜜桃| 18久久| 国产又爽又黄无码无遮挡在线观看 | 久久久毛片免费全部播放| 欧美黑人巨大精品videos一| 极品蜜臀黄色在线观看| 久99久热精品免费视频| 日韩人妻精品中文字幕| 久久精品第九区免费观看| 少妇高潮紧爽免费观看| 国产精品毛片久久久久久久| 亚洲中文字幕日韩| 亚洲va中文字幕无码久久不卡 | 亚洲乱亚洲乱妇在线| 中文国产成人精品久久不卡| 日日干夜夜操| 女女同性女同区二区国产| 亚洲国产成人久久精品软件|