<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      DeepSeek V4重磅發(fā)布,百萬上下文成標配,華為昇騰率先適配!

      0
      分享至

      4 月 24 日的 AI 技術(shù)圈再次因大模型的升級而沸騰。

      整理 | 屠敏

      出品 | CSDN(ID:CSDNnews)

      就在 OpenAI 于凌晨剛推出 版本之后的幾個小時,國產(chǎn)大模型也迎來了重磅時刻——DeepSeek-V4 預(yù)覽版官宣上線,并同步開源

      官方發(fā)布 58 頁完整技術(shù)報告,讓開源大模型邁入百萬 token 高效上下文時代,徹底重構(gòu)長文本大模型的效率與能力邊界。


      開源地址:

      • https://huggingface.co/collections/deepseek-ai/deepseek-v4

      • https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

      技術(shù)報告:

      • https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf


      雙模型齊發(fā):1.6T 旗艦與 284B 輕量版,均支持百萬字上下文

      最新發(fā)布的 DeepSeek-V4 系列一次性推出兩款全新的 MoE 架構(gòu)大模型,全部支持 百萬字超長上下文,按照模型大小來分:

      • DeepSeek-V4-Pro:總參數(shù)量為 1.6T、激活參數(shù)為 49B, 在知識、推理、代碼、智能體、長文檔理解上比肩頂級閉源模型;

      • DeepSeek?V4?Flash:總參數(shù) 284B,激活參數(shù)為 13B,以極小激活參數(shù)量實現(xiàn)逼近旗艦的推理性能。


      官方表示,兩款模型在 Agent 能力、世界知識和推理性能上均實現(xiàn)國內(nèi)與開源領(lǐng)域的領(lǐng)先。 即日起,登錄 DeepSeek 官網(wǎng) chat.deepseek.com 或官方App,就可以直接體驗最新的 DeepSeek-V4 能力。

      此外,API 服務(wù)已同步更新,通過修改 model_name 為 deepseek-v4-pro 或 deepseek-v4-flash 即可調(diào)用。



      架構(gòu)升級,關(guān)鍵技術(shù)創(chuàng)新大幅提高上下文效率

      從技術(shù)架構(gòu)層面來看,DeepSeek?V4 沒有停留在堆參數(shù)、擴數(shù)據(jù)的傳統(tǒng)路線,而是從注意力機制、殘差連接、優(yōu)化器三大底層維度,進行了技術(shù)升級。

      簡單來看,與 DeepSeek-V3 架構(gòu)相比,DeepSeek-V4 系列保留了 DeepSeekMoE 框架和多詞元預(yù)測(MTP)策略,同時在架構(gòu)和優(yōu)化方面引入了多項關(guān)鍵創(chuàng)新:

      • 采用混合注意力架構(gòu),將壓縮稀疏注意力(CSA)和重壓縮注意力(HCA)結(jié)合,用于提升長上下文處理效率。CSA 沿序列維度壓縮鍵值緩存,然后執(zhí)行 DeepSeek 稀疏注意力(DSA),而 HCA 對鍵值緩存應(yīng)用更激進的壓縮,但保持了密集注意力;

      • 為了增強建模能力,DeepSeek 也在架構(gòu)中引入了流形約束超連接(mHC),在傳統(tǒng)殘差連接基礎(chǔ)上進一步增強信息傳遞能力;

      • 以及 Muon 優(yōu)化器被引入了 DeepSeek-V4 系列的訓(xùn)練中,用于加快收斂速度并提升訓(xùn)練穩(wěn)定性。


      在訓(xùn)練維度,DeepSeek 在超過 32T 高質(zhì)量、多樣化的 token 上對兩個模型進行了預(yù)訓(xùn)練,并在此基礎(chǔ)上引入了一整套完整的后訓(xùn)練流程,進一步增強模型能力。

      同時,據(jù)技術(shù)報告顯示,DeepSeek-V4 系列在長上下文場景下也表現(xiàn)出極高的效率。在百萬 Token 的上下文設(shè)置下,DeepSeek-V4-Pro 僅需 DeepSeek-V3.2 的 27% 單 Token 推理 FLOP,KV cache 占用僅為 10%。

      正因此,DeepSeek 能夠?qū)ⅰ鞍偃f token 上下文”作為常規(guī)能力來支持,從而顯著提升長時序任務(wù)的可行性,并為測試階段的進一步擴展提供了空間。正如官方所說:“從現(xiàn)在開始,1M(一百萬)上下文將是 DeepSeek 所有官方服務(wù)的標配。



      性能比肩頂級閉源模型

      值得注意的是,DeepSeek-V4-ProMax 是 DeepSeek-V4-Pro 的最高推理模式,重新定義了開放模型的性能標準,在核心任務(wù)上超越了其前代產(chǎn)品。

      另外,DeepSeek-V4 系列的性能在多個維度都有了全面的提升:

      • 在廣義世界知識評估中,DeepSeek-V4-Pro 的最高推理模式 DeepSeek-V4-Pro-Max,在 SimpleQA 和 Chinese-SimpleQA 等基準測試上,顯著優(yōu)于主流開源模型。


      在教育類知識評估方面(包括 MMLU-Pro、HLE 和 GPQA),DeepSeek-V4-Pro-Max 相較開源模型仍保持小幅領(lǐng)先。同時,它與領(lǐng)先的閉源模型 Gemini-3.1-Pro 的差距已經(jīng)大幅縮小,但在這些知識類測試中仍略遜一籌。


      • 在推理維度,通過增加推理 token 的投入,DeepSeek-V4-Pro-Max 在標準推理基準上展現(xiàn)出優(yōu)于 GPT-5.2 和 Gemini-3.0-Pro 的表現(xiàn)。

        不過,其性能仍略低于 GPT-5.4 和 Gemini-3.1-Pro,這表明其整體發(fā)展水平大約落后最前沿模型 3 到 6 個月。

        此外,DeepSeek-V4-Flash-Max 在復(fù)雜推理任務(wù)中達到了接近 GPT-5.2 和 Gemini-3.0-Pro 的表現(xiàn),體現(xiàn)出較高的性價比。

      • Agent 能力上,在公開基準測試中,DeepSeek-V4-Pro-Max 與領(lǐng)先開源模型(如 Kimi-K2.6 和 GLM-5.1)表現(xiàn)相當,但略遜于頂級閉源模型。在內(nèi)部評測中,DeepSeek-V4-Pro-Max 超過了 Claude Sonnet 4.5,并接近 Claude Opus 4.5 的水平。

      • 在支持 100 萬 token 上下文窗口的情況下,DeepSeek-V4-Pro-Max 在合成任務(wù)和真實場景中均表現(xiàn)出色,甚至在學(xué)術(shù)基準測試中超過了 Gemini-3.1-Pro。


      相比 DeepSeek-V4-Pro-Max,DeepSeek-V4-Flash-Max 由于參數(shù)規(guī)模更小, 在知識類評估中的表現(xiàn)略低。但在給予更大思考預(yù)算時,其推理任務(wù)表現(xiàn)可以接近 DeepSeek-V4-Pro-Max。

      在 Agent 評測中,DeepSeek-V4-Flash-Max 在部分基準上能夠與 DeepSeek-V4-Pro-Max 持平,但在更復(fù)雜、高難度任務(wù)中仍存在差距。


      算力支持

      值得注意的是,對于行業(yè)最關(guān)注的國產(chǎn)算力落地,DeepSeek 在技術(shù)報告中指出,他們在 NVIDIA GPU 和華為 Ascend NPU 平臺上,對細粒度 EP(Expert Parallelism)方案進行了驗證。

      另一方面,華為昇騰超節(jié)點系列產(chǎn)品也宣布全面支持,本次通過雙方芯模技術(shù)緊密協(xié)同,實現(xiàn)異騰超節(jié)點全系列產(chǎn)品支持 DeepSeek V4 系列模型。



      API 同步開放:無縫兼容主流接口,一鍵接入最強開源長上下文

      時下 DeepSeek?V4 API 已同步上線,支持 OpenAI ChatCompletions 與 Anthropic 接口規(guī)范。

      訪問新模型時,base_url 不變, model 參數(shù)需要改為 deepseek-v4-pro 或 deepseek-v4-flash。


      另外,DeepSeek 官方還提到,舊有的 API 接口的兩個模型名 deepseek-chat 與deepseek-reasoner 將于三個月后(2026-07-24)停止使用。當前階段內(nèi),這兩個模型名分別指向 deepseek-v4-flash 的非思考模式與思考模式。

      普通用戶可直接登錄 DeepSeek 官網(wǎng)或官方 App,體驗 100 萬 Token 上下文帶來的震撼能力:一次性上傳整本書、整個項目代碼、整份合同文檔,實現(xiàn)真正的 “一次性讀懂、全程記憶、深度推理”。

      DeepSeek?V4 的到來,不只是一次模型升級,更是開源大模型進入 “百萬上下文高效時代” 的標志。它用架構(gòu)創(chuàng)新證明:超長上下文不必靠暴力算力,小激活參數(shù)也能擁有頂級推理。

      開源地址:

      • https://huggingface.co/collections/deepseek-ai/deepseek-v4

      • https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

      技術(shù)報告:

      • https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

      「粉絲專屬回饋:60+ 頂級大廠 AI 實戰(zhàn) PPT 限時領(lǐng)!」

      2026 奇點智能技術(shù)大會·上海站圓滿落幕!整整兩天,CSDN 與奇點智能研究院攜手,把“AI 正在如何重塑軟件開發(fā)”徹底攤開講透了。

      這不僅僅是一場會議,更是一份關(guān)于未來的答案。從 NVIDIA、微軟、Google 的全球視野,到華為、阿里、騰訊、京東、網(wǎng)易、快手、昆侖萬維的本土實踐;從月之暗面、階躍星辰、MiniMax 的獨角獸洞察,再到北大、智源、奇點智能研究院的前沿探索。

      Agent 正在成為新入口,軟件形態(tài)正在被重寫。

      錯過了現(xiàn)場?沒關(guān)系!為回饋粉絲,我們特將本次大會的高質(zhì)量演講 PPT 完整打包。

      領(lǐng)取方式: 在公眾號后臺私信發(fā)送 「奇點」 二字,即可一鍵獲取全套干貨。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      炸裂!熊孩子刮花6張PS5光盤 家長僅200元打發(fā)了事

      炸裂!熊孩子刮花6張PS5光盤 家長僅200元打發(fā)了事

      游民星空
      2026-05-10 17:44:13
      安徽巨星夜崩盤,窮到欠薪卻敢辦大型演唱會,粉絲淪為韭菜太扎心

      安徽巨星夜崩盤,窮到欠薪卻敢辦大型演唱會,粉絲淪為韭菜太扎心

      法老不說教
      2026-05-09 15:11:16
      心臟決定壽命?勸告中老年別太節(jié)儉,多吃這3樣,心臟越吃越年輕

      心臟決定壽命?勸告中老年別太節(jié)儉,多吃這3樣,心臟越吃越年輕

      芹姐說生活
      2026-05-11 13:29:00
      2-0領(lǐng)先遭拖入搶五拒逆轉(zhuǎn)!17歲張本美和破魔咒:王曼昱仰天長嘯

      2-0領(lǐng)先遭拖入搶五拒逆轉(zhuǎn)!17歲張本美和破魔咒:王曼昱仰天長嘯

      顏小白的籃球夢
      2026-05-10 19:01:48
      奪冠后,馬琳哭了!王曼昱哭了!陳熠也哭了!三人會各自續(xù)寫傳奇

      奪冠后,馬琳哭了!王曼昱哭了!陳熠也哭了!三人會各自續(xù)寫傳奇

      老糿尾聲體育解說
      2026-05-11 14:01:27
      年報臨時改、突然戴*ST!12.5萬散戶被悶殺,連吃6跌停

      年報臨時改、突然戴*ST!12.5萬散戶被悶殺,連吃6跌停

      財經(jīng)智多星
      2026-05-11 12:05:34
      香港拿下世界杯轉(zhuǎn)播僅1天,炸出一堆牛鬼蛇神,李嘉誠恐進退兩難

      香港拿下世界杯轉(zhuǎn)播僅1天,炸出一堆牛鬼蛇神,李嘉誠恐進退兩難

      混沌錄
      2026-05-10 19:42:39
      心理學(xué)有個發(fā)現(xiàn):下等的挽回,是糾纏;中等的挽回,是斷聯(lián);頂級的挽回,是讓對方做這兩件事

      心理學(xué)有個發(fā)現(xiàn):下等的挽回,是糾纏;中等的挽回,是斷聯(lián);頂級的挽回,是讓對方做這兩件事

      心理觀察局
      2026-05-11 09:07:16
      炸鍋!穆里尼奧回歸皇馬條件曝光,5 大球星要被掃地出門

      炸鍋!穆里尼奧回歸皇馬條件曝光,5 大球星要被掃地出門

      奶蓋熊本熊
      2026-05-11 00:35:03
      第1現(xiàn)場|俄烏對峙下的紅場閱兵:36年來首次未見坦克

      第1現(xiàn)場|俄烏對峙下的紅場閱兵:36年來首次未見坦克

      澎湃新聞
      2026-05-09 21:40:28
      春節(jié)草原自駕游,一老牧民開口:遠離年輕的寡婦,她住金色蒙古包

      春節(jié)草原自駕游,一老牧民開口:遠離年輕的寡婦,她住金色蒙古包

      小月故事
      2026-02-27 16:24:24
      9500萬歐蒸發(fā)!憤怒拉滿,利物浦億元強援為何集體失靈

      9500萬歐蒸發(fā)!憤怒拉滿,利物浦億元強援為何集體失靈

      姜來不加鹽
      2026-05-11 15:57:21
      軍事 | 俄烏沖突當真要結(jié)束?普京對澤連斯基之語有點“情調(diào)”?

      軍事 | 俄烏沖突當真要結(jié)束?普京對澤連斯基之語有點“情調(diào)”?

      新民周刊
      2026-05-11 09:08:54
      蔣介石晚年坦言:敗退臺灣無悔,此生最大不甘就是聽了斯大林此言

      蔣介石晚年坦言:敗退臺灣無悔,此生最大不甘就是聽了斯大林此言

      芳芳歷史燴
      2026-05-04 01:43:43
      西安分水嶺車禍!逆行肇事者豎手指,目擊者再曝細節(jié),對方太不值

      西安分水嶺車禍!逆行肇事者豎手指,目擊者再曝細節(jié),對方太不值

      千言娛樂記
      2026-05-11 14:49:45
      官宣了,特朗普即將訪問中國,訪問時間加長!

      官宣了,特朗普即將訪問中國,訪問時間加長!

      阿龍聊軍事
      2026-05-11 10:48:35
      劉翔的終身合同有多牛?退役 10 年不上班,照樣環(huán)游世界

      劉翔的終身合同有多牛?退役 10 年不上班,照樣環(huán)游世界

      橙星文娛
      2026-05-10 11:55:24
      舒馬赫妻子科琳娜,照顧丈夫12年,花費超20億,如今終于等到奇跡

      舒馬赫妻子科琳娜,照顧丈夫12年,花費超20億,如今終于等到奇跡

      寒士之言本尊
      2026-01-28 16:12:08
      菲副總統(tǒng)彈劾案全票通過!杜特爾特已備好后手,馬科斯算盤恐落空

      菲副總統(tǒng)彈劾案全票通過!杜特爾特已備好后手,馬科斯算盤恐落空

      透視到底
      2026-05-11 00:38:00
      趙麗穎在上海某高檔餐廳被偶遇,瘦是真的瘦,但素顏卻沒有那么美

      趙麗穎在上海某高檔餐廳被偶遇,瘦是真的瘦,但素顏卻沒有那么美

      阿廢冷眼觀察所
      2026-05-11 00:49:20
      2026-05-11 16:31:00
      CSDN incentive-icons
      CSDN
      成就一億技術(shù)人
      26524文章數(shù) 242284關(guān)注度
      往期回顧 全部

      科技要聞

      黃仁勛:你們趕上了一代人一次的大機會

      頭條要聞

      媒體:中美元首即將北京會晤 美方一細節(jié)耐人尋味

      頭條要聞

      媒體:中美元首即將北京會晤 美方一細節(jié)耐人尋味

      體育要聞

      那個曾讓詹姆斯抱頭的兄弟,40歲從大學(xué)畢業(yè)了

      娛樂要聞

      “孕婦墜崖案”王暖暖稱被霸凌協(xié)商解約

      財經(jīng)要聞

      "手搓汽車"曝光:偽造證件、電池以舊代新

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態(tài)度原創(chuàng)

      本地
      數(shù)碼
      時尚
      教育
      公開課

      本地新聞

      用蘇繡的方式,打開江西婺源

      數(shù)碼要聞

      努比亞推出GT Buds耳機:支持35dB降噪,269元

      襯衫四季都能穿!簡約大方適合日常穿搭,配褲子、裙子都好看

      教育要聞

      雞娃放養(yǎng),都不如養(yǎng)個“晨型人格”的孩子,他會自信又自律

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 亚洲精品欧美综合四区| 性感美女久久久| 2020国产精品香蕉在线观看| 亚洲av无码之国产精品网址蜜芽| 国产熟女在线播放| 亚洲精品无码专区在线| 欧美精品亚洲精品日韩专区va| 538国产视频| 亚洲爽图| 成人av中字手机在线播放| 国产青榴视频在线观看| 一区二区日韩国产精久久| 国产午夜精品福利| 浴室人妻的情欲hd三级国产| 亚洲综合色婷婷在线观看| 欧美激情一区二区三区aa片| 果冻传媒一区| 亚洲综合中文字幕国产精品欧美| 无码精品人妻一区二区三区98| 亚洲熟女一区二区av| 3p视频在线观看免费| 精品三级国产三级在钱专区| 亚洲国产韩国一区二区| 日韩一区二区三区无码a片| 国产av夜夜欢一区二区三区 | 亚洲欧美另类在线| 日本久久高清一区二区三区毛片| 亚洲激情综合| 污视频网站免费在线观看| 精品一区二区三区国产在线观看 | 亚洲国产精品美女| 国内精品视频一区二区三区 | 老湿机午夜福利| 日韩无码真实干出血视频| 日韩乱码卡一卡2卡三卡四| 色翁荡媳又硬又粗又长视频| 國產尤物AV尤物在線觀看| 尹人香蕉久久99天天拍| 日韩久久久久久久久久免费| 亚洲色在线无码国产精品| 精品国产免费观看一区|