<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek-V4實測:超高效上下文,更像是token價格戰的序章

      0
      分享至


      準備好做Agent基模,價格戰可能下半年到來。

      文|陳梅希

      編|園長

      沒有開聲勢浩大的全球發布會,沒有安排老板錄制一檔視頻博客,DeepSeek-V4預覽版就這么默默更新了,一如它過去所做的那樣。時間選在了周五上午,作為自媒體從業者也萬分感謝,沒有讓我們在周末的北影節觀影現場突然離場去研究一個大模型的全新版本。



      公告里說的和沒說的

      更新通知發布在DeepSeek的官方公眾號,全文只有1087個字。同步公開的,DeepSeek-V4 模型的開源鏈接和技術報告。縱覽這些公開信息,有以下幾件事值得關注:

      1.官網、App、API調用全部上線新模型,分為DeepSeek-v4-pro和DeepSeek-v4-flash兩種,可自行切換調用。兩種模型均為開源模型。

      性能上,開源的DeepSeek-V4-Pro能比肩頂級閉源模型。Agent能力大幅提高,其中Coding能力在其公司內部的評測體驗中“優于 Sonnet 4.5,交付質量接近 Opus 4.6 非思考模式,但仍與 Opus 4.6 思考模式存在一定差距”;文檔和PPT生成能力均大幅提升。(第二部分我們將對其代碼能力和PPT生成能力進行橫向測評。)

      DeepSeek內部已將員工使用的Agentic Coding 模型切換為DeepSeek-V4,證明其在實際研發場景中已具備生產力價值。

      2.技術革新方面,這個版本在上下文問題上最值得關注的是超高的上下文效率,而非上下文規模。

      DeepSeek-V4通過全新的混合注意力機制,在實現超長上下文能力的同時,降低了對計算和顯存的需求,根據官方文檔:“從現在開始,1M(一百萬)上下文將是 DeepSeek 所有官方服務的標配?!?/p>

      閱讀其技術文檔可以發現,全新的注意力機制結合了CSA (Compressed Sparse Attention,壓縮稀疏注意力)和HCA (Heavily Compressed Attention,重度壓縮注意力),其中CSA搭配DeepSeek自研的稀疏注意力算法,而HCA對鍵值緩存采用更高的壓縮倍率,但保留了Transformer架構里的稠密注意力算法。粗淺理解一下,就是壓縮得少的跳著看,已經被猛猛壓縮過的那就每個都看。

      To enhance long-context efficiency, we design a hybrid attention mechanism combining Compressed Sparse Attention (CSA) and Heavily Compressed Attention (HCA). CSA compresses the KV caches along the sequence dimension and then performs DeepSeek Sparse Attention (DSA) (DeepSeek-AI, 2025), whereas HCA applies more aggressive compression to the KV caches but keeps dense attention.

      這種混合注意力機制的核心理念,是在超長上下文中,并不是所有鍵值都需要全注意力和稠密計算。其實帶入人類自己的閱讀體驗也是如此,我們看論文時總是聚精會神地先看摘要、導語和結論,而在文獻綜述環節意識模糊。本科選修網絡文學課,老師在第一節課就告訴我們這學期要至少讀完兩千萬字的網文,并介紹了一種“掃文”方式:對角線閱讀法,每頁書只看左上角、正中間、右下角,現在想想,這何嘗不是一種稀疏注意力算法。

      注意力的壓縮,是為了減少計算量,最終目標是提升超長上下文的效率。根據技術報告,“在一百萬tokens上下文中,V4-Pro的推理計算量僅需V3.2的27%,KV緩存占用僅為10%。”

      In the one-million-token context setting, DeepSeek-V4-Pro requires only 27% of single-token inference FLOPs and 10% of KV cache compared with DeepSeek-V3.2.


      3.按理說,token壓縮結合稀疏注意力機制提高計算效率后,廠商的計算成本和顯存成本(同等token規模下)都會大幅減少,最終會反映到token定價上。DeepSeek-V4在今天也公布了定價,每百萬tokens的定價如下:


      這個價格,和海外頭部大模型相比,有很大的優勢。以DeepSeek-V4自稱交付質量接近的Opus 4.6 非思考模型為例,命中緩存的輸入單價為0.5美元/百萬token,未命中緩存的輸入單價為5美元/百萬token,輸出單價為25美元/百萬token。按4月24日當日匯率計算,DeepSeek-V4-pro的三項單價,分別是Opus 4.6的24%、35%和14%。


      海外頭部大模型API調用計價(截至2026.4.24),刺猬公社手動統計,僅供參考;數據來源:各平臺官網

      但和國內競品相比,DeepSeek-V4暫時還沒有對著價格大砍一刀的架勢。

      國內模型中同樣有百萬上下文能力的是阿里在本月初發布的Qwen3.6-plus,對單次輸入的token數進行分層計價,當單次輸入小于256K時,Qwen3.6-plus的輸入和輸出單價均介于DeepSeek-V4-Flash和DeepSeek-V4-Pro之間。


      國內頭部大模型API調用計價(截至2026.4.24),刺猬公社手動統計,僅供參考;數據來源:各平臺官網、公告

      4.準備好做Agent基模,價格戰可能下半年到來

      華為昇騰芯片在DeepSeek 官方公告中被提及,雖然只是以出現在圖片注釋中的低調形式。在更新公告的定價說明截圖下,有一行注釋小字:“受限于高端算力,目前Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,Pro的價格會大幅下調。”

      這條注釋,也許在宣告一種可能性:在DeepSeek-V4 使用大幅降低計算成本的新注意力機制后,V4-Pro沒有大幅降價,是因為高端算力稀缺,而不是成本不允許降價。換言之,一旦國產高端算力在下半年順利接棒,DeepSeek就有空間大幅下調token定價。

      DeepSeek也做好了充足的、充當Agent 基模的準備,畢竟在更新公告里特意寫道自己“針對 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 產品進行了適配和優化”。除了三位耳熟能詳的Agent選手,CodeBuddy是騰訊云開發的代碼助手。

      超高效上下文,更像是token價格戰的一頁序章。也有從業者提供了另一種視角:當DeepSeek已經公開宣布下半年會大幅下調V4-Pro價格后,DeepSeek的模型能力線和價格線,將成為閉源模型的“斬殺線”。


      實測DeepSeek-V4-Pro

      因為更新公告里重點提及了代碼能力、PPT生成能力,刺猬公社基于這兩個領域,對DeepSeek-V4預覽版進行了簡單的橫向測試,對照的是近期發布/更新的,分別以這兩項能力為賣點的產品。

      1.代碼能力VS阿里秒悟

      秒悟是阿里巴巴ATH事業群于將近10天前發布的AI開發平臺,讓0代碼能力的用戶能使用自然語言完成自己的產品開發。剛上線時,我讓秒悟做了一個《作家推薦器》,通過給用戶做8道選擇題判斷TA可能喜歡的作家,題庫一共30道,覆蓋100位作家。經過大概1個小時的調試后,這個測試小網頁上線了:


      雖然不知道為什么秒悟在配色上唯愛清華紫,而且在出文本選擇題的時候像吃了50噸張嘉佳(然而它自己建構的作家庫里沒有張嘉佳),但作為和朋友自娛自樂的小玩具,可用度還是非常高的。我自己做了測試,竟然真的測出了我喜歡的作家。


      DeepSeek-V4-Pro正式上線后,我用同樣的提示詞,測試它做網頁的能力。大概5分鐘后,測試網頁完成了。


      第一次生成,點擊跳轉邏輯并未生效,DeepSeek選擇重寫數千行代碼,先提供了一個只包含10個作家的簡化版。等簡化版運行成功,它確認自己代碼結構沒有問題后,我讓它把作家庫恢復到100個,它依然選擇了把代碼全部重寫,而不是讓我替換若干個代碼模塊。

      DeepSeek給出的解決方式,讓我恍惚覺得自己擁有無限的token火力,在對這個小小的網頁需求進行過飽和攻擊,而在此過程中,我其實完全沒有付費。


      橫向測評之后,秒悟的優勢在于0操作門檻,最終的交付結果是一個用戶可以打開的網頁,用戶可以直接分享給朋友或是互聯網上的任何人。劣勢在于價格,做一個作家推薦器大概花掉了40000積分,按照積分的零售價格是40塊,如果不想花錢,按每天登錄贈送2000積分的速度,大概連續登錄20天可以做一個玩具網頁。最終我斥39元巨資訂購了每月100000積分的套餐。

      DeepSeek-V4-Pro的最大優勢當然是免費,幾千行代碼說寫就寫;另一個優勢是快速,雖然沒有左拉一個助手,右拉一個設計師,建構若干項蜂群工程,但不到10分鐘就做完了。劣勢則是只能生成一份代碼,讓我打包成html格式再去瀏覽器打開,如果想直接分享到線上,還需要自己完成部署。另外,如果說使用qwen的秒悟像吃了五十噸張嘉佳老師,那么DeepSeek做出來的作家推薦器就像是吃了五十噸DeepSeek。


      2.PPT生成能力VS MaxHermes

      測試PPT生成能力時,我直接選擇了使用DeepSeek-V4的技術文檔,共59頁pdf,要求是生成一個給大學生做講座用的PPT。

      MaxHermes很快完成了一個可以直接下載的PPT文件,結構和美化都做得不錯。劣勢是要花錢,為了使用MaxHermes,我需要花39元買一個基礎版會員,再花49元訂購一個token plan包月。


      DeepSeek則生成了代碼,需要在本地用Python運行,沒有那些Agent方便,而且樣式有些過于樸素了。最大優點依然是完全免費,留了圖片的占位符,需要用戶自己做一些圖片替換工作。題外話,為什么不管寫網站還是做PPT,大模型們都不約而同地默認選擇了紫色系?


      如果用Claude Code 、OpenClaw等Agent產品搭配DeepSeek 4.0的API,應該能獲得更便捷的體驗,但就要走DeepSeek的API計費邏輯了,無法像現在這樣完全免費。

      更何況,現在是周五晚上9點半國產大模型的更新固然重要使我從早到晚坐在電腦前興奮地敲了一天字但是周五晚上跟朋友約好去五道營喝酒聽歌同樣重要我將在關注AI進展的同時保衛我的線下生活那正是我在開頭就感謝DeepSeek 在周五上午發布更新的原因。




      媒介合作聯系微信號|ciweimeijiejun

      如需和我們交流可后臺回復“進群”加社群

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      江浙滬對后代的托舉能到什么程度?浙江網友:這輩子沒為錢發過愁

      江浙滬對后代的托舉能到什么程度?浙江網友:這輩子沒為錢發過愁

      近史談
      2026-03-17 19:09:21
      人類肉嫩毛少,容易追擊捕食,可為啥大部分食肉野獸都不咋吃人?

      人類肉嫩毛少,容易追擊捕食,可為啥大部分食肉野獸都不咋吃人?

      向航說
      2026-04-28 00:25:03
      視頻 | 美國母親節鮮花成本上漲 美伊沖突和關稅政策為主因

      視頻 | 美國母親節鮮花成本上漲 美伊沖突和關稅政策為主因

      國際在線
      2026-05-10 08:09:42
      愛情沒有神話:趙蘭心打胎釀苦果,周媚貝文祺分手,林展翹成贏家

      愛情沒有神話:趙蘭心打胎釀苦果,周媚貝文祺分手,林展翹成贏家

      樓蘭娛姐
      2026-05-10 13:38:39
      蔣介石在他的日記里坦言:重慶談判時放走毛澤東,全是因為這2點

      蔣介石在他的日記里坦言:重慶談判時放走毛澤東,全是因為這2點

      倫倫媽愛歷史
      2026-05-02 10:01:48
      萊溫斯基:1995年,我的藍裙子被總統克林頓脫下,就在白宮辦公室

      萊溫斯基:1995年,我的藍裙子被總統克林頓脫下,就在白宮辦公室

      史不語
      2026-05-06 08:50:06
      放棄阿隆索!利物浦鎖定世界級名帥,斯洛特帥位岌岌可危

      放棄阿隆索!利物浦鎖定世界級名帥,斯洛特帥位岌岌可危

      瀾歸序
      2026-05-10 01:49:10
      騙了我們600年!鄭和下西洋的真實目的,根本不是找建文帝

      騙了我們600年!鄭和下西洋的真實目的,根本不是找建文帝

      老達子
      2026-05-10 06:25:03
      布拉德利?庫珀雨天攜女出街 父愛滿滿

      布拉德利?庫珀雨天攜女出街 父愛滿滿

      述家娛記
      2026-05-09 10:48:03
      兩名中國公民被烏克蘭關押一年,俄不收中方不接,處境太難了

      兩名中國公民被烏克蘭關押一年,俄不收中方不接,處境太難了

      Ck的蜜糖
      2026-05-10 10:05:58
      為什么發達國家對中國都不友好?

      為什么發達國家對中國都不友好?

      新浪財經
      2026-05-04 07:26:54
      77歲曹查理自曝在東莞養老,住35平米房月租1300元,在香港沒房產

      77歲曹查理自曝在東莞養老,住35平米房月租1300元,在香港沒房產

      阿庫財經
      2026-05-09 23:51:46
      一個平臺打包ChatGPT和Gemini,終身版75美元

      一個平臺打包ChatGPT和Gemini,終身版75美元

      報錯免疫體
      2026-05-10 18:02:51
      生死局!父女雙雙遭清算,中方關鍵時刻出手,杜特爾特絕處逢生

      生死局!父女雙雙遭清算,中方關鍵時刻出手,杜特爾特絕處逢生

      誮惜顏a
      2026-05-09 14:55:38
      歷史老師跌入“無人區”:某高中20人教研組,近一半無學生可教

      歷史老師跌入“無人區”:某高中20人教研組,近一半無學生可教

      聽心堂
      2026-03-31 15:52:04
      韓日政府砸錢上百萬億,仍人口斷崖:冷的不是出生率,是男女關系

      韓日政府砸錢上百萬億,仍人口斷崖:冷的不是出生率,是男女關系

      日新現場
      2026-05-10 17:23:41
      熱搜!“安慕希百萬撤離” 網友:奔跑吧,王老吉!

      熱搜!“安慕希百萬撤離” 網友:奔跑吧,王老吉!

      LOGO研究所
      2026-05-10 16:56:56
      成語“合巹之歡”中,巹字怎么讀,是什么意思,有什么典故?

      成語“合巹之歡”中,巹字怎么讀,是什么意思,有什么典故?

      長風文史
      2026-05-09 18:02:39
      法國人講述如何一眼區分“中國人”“日本人”“韓國人”的?

      法國人講述如何一眼區分“中國人”“日本人”“韓國人”的?

      日本物語
      2026-03-15 20:34:37
      當年23個70后一把手,團干14人,費高云是機關內逐級晉升者

      當年23個70后一把手,團干14人,費高云是機關內逐級晉升者

      江南江南
      2026-05-10 11:02:41
      2026-05-10 18:52:49
      刺猬公社 incentive-icons
      刺猬公社
      聽記者講幕后,聽新聞前輩講古
      10061文章數 172587關注度
      往期回顧 全部

      科技要聞

      DeepSeek融資,改寫所有人的估值

      頭條要聞

      面對中方強硬態度 世界杯中國轉播費從3億美元腰斬

      頭條要聞

      面對中方強硬態度 世界杯中國轉播費從3億美元腰斬

      體育要聞

      那個曾讓詹姆斯抱頭的兄弟,40歲從大學畢業了

      娛樂要聞

      大S女兒玥兒開通賬號,用煙花緬懷母親

      財經要聞

      白酒大逃殺

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      教育
      游戲
      旅游
      房產
      軍事航空

      教育要聞

      小升初必考!梯形面積的計算技巧!

      炸裂!熊孩子刮花6張PS5光盤 家長僅200元打發了事

      旅游要聞

      519中國旅游日 | “博學知行”惠民開啟!

      房產要聞

      低價甩賣!??谶@個地標商業,無人接盤!

      軍事要聞

      伊朗革命衛隊深夜警告

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲日韩精品A∨片无码加勒比| 五月丁香影院| 国产成人久久综合一区| 国产麻豆va精品视频| 国产亚洲欧美在线观看| 国产偷2018在线观看午夜| 91午夜福利一区二区三区| 少妇性色午夜淫片aaa播放5| 四虎国产精品永久在线网址 | av中文字幕国产精品| 日本被黑人强伦姧人妻完整版| 99在线精品视频观看免费| 偷拍av网| 先锋成人影音| 国产精品热久久毛片| 亚洲色自偷自拍另类小说| 日韩天天操| 性欧美暴力猛交69hd| 亚洲精品乱码久久久久久麻豆不卡| 人妻 偷拍 无码 中文字幕| 玖玖精品视频| 成人区人妻精品一区二蜜臀| 91福利国产在线观看一区二区| 精品亚洲香蕉久久综合网| 中文字幕一区二区三区精华液| 亚洲精品国产精品国自产观看| 亚洲一区av无码少妇电影玲奈| 亚洲综合无码明星蕉在线视频| 亚洲国产精品久久久久婷婷图片| 久久亚洲视频| 欧美日韩在线不卡| 爱爱综合网| 久久久无码精品亚洲a片0000| 国产午精品午夜福利757视频播放| 岛国AV无码| 日韩成人福利视频在线观看| 久久中文字幕人妻| 亚洲成a人v在线蜜臀| 免费一级毛片完整版在线看| 久9re热视频这里只有精品| 国产午夜福利视频第三区|