網易首頁 > 網易號 > 正文申請入駐

兩天兩降價，Token打骨折！DeepSeek的價格戰目標究竟是誰？

2026-04-29 18:12:35　來源: 速途網

北京舉報

分享至

DeepSeek-V4發布僅四天，就連出三記重拳：

4月25日，DeepSeek-V4-Pro宣布限時2.5折，原活動持續至5月5日。
4月26日，全系API輸入緩存命中價格直接降至首發價的1/10。
4月28日，官網“悄悄”更新API文檔，將V4-Pro的2.5折限時優惠由原定的5月5日延長至5月31日。

疊加限時折扣后，V4-Pro的緩存輸入直降40倍，低至每百萬token僅 0.025元，V4-Flash則降至每百萬token 0.02元，創下全球大模型價格新低。

這個價格已經打到對手的零頭。同樣處理100萬token緩存輸入，才剛上線不久的GPT-5.5 Pro要花約217元，用DeepSeek-V4-Pro只要0.025元，價差近8700倍。

事實上，速途網認為，這遠非表面的“價格戰”這么簡單，背后是深度求索的一場長期戰役。

一、從“追趕者”到“規則定義者”

要理解這輪降價的深意，必須先看清DeepSeek在行業中的真實位置。

過去一年，DeepSeek改變了中國大模型行業的定價方式。V3和R1發布后，國內外模型廠商被迫重新計算API價格、訓練成本和商業化路徑。而跑分領先從來不是DeepSeek的核心追求，反而在精益求精地“把高性能模型的使用門檻繼續往下壓”。

但從V4開始，DeepSeek的角色正在發生質變——它不再只是“價格屠夫”，而是開始定義AI基礎設施的成本錨點。高盛Ronald Keung團隊在最新研報中評價：“V4的核心意義在于以更低成本支持更復雜的智能體應用落地，從而打開AI應用規模化的新空間。”

更關鍵的是，DeepSeek V4是全球關注的焦點，中國AI的代表之一。

這從OpenClaw對V4的迅速反應就可以看出。在OpenClaw發布的4.24版本中，已正式將DeepSeek-V4-Flash設為系統默認推理模型，V4-Pro同步上線模型庫，可以說牌面很足了。

這似乎是一場互利共贏的雙向奔赴：OpenClaw獲得了更強、更便宜的中文推理能力，DeepSeek獲得了千萬級開發者流量的黃金入口。

事實上，這同時代表了最強Agent對于中國大模型超高性價比的持續肯定，讓開發者覺得“夠用且便宜”是最重要的，這相比此前的唯性能論，是完全不同的邏輯。要知道，DeepSeek調用成本僅為OpenAI的1/50至1/70。

二、降價底氣是？源于技術的三重突破

那么，梁文鋒的真正用意是什么？在此之前，我們先看下DeepSeek為什么總能在成本端搞事情？

第一重：記憶的工業化

在百萬token上下文下，V4的KV Cache占用僅為前代V3.2的10%。這其中涉及兩項創新：壓縮稀疏注意力（CSA）將緩存體積縮減75%；重度壓縮注意力（HCA）壓縮率達128倍，一整頁內容濃縮成幾個關鍵詞。

緩存壓縮90%后，V4可將這些條目直接存入廉價固態硬盤，用戶發起請求時從硬盤拉取，跳過了昂貴的GPU預填充計算。這是“白菜價”的真正秘密。

第二重：算力的結構性瘦身

在1M長上下文下，V4 Pro的單token推理算力僅為前代的27%，V4-Flash降至10%。這其中核心是一套動態稀疏選擇機制：每次生成token時只檢索得分最高的1024個壓縮KV條目，將傳統線性增長的計算復雜度強制截斷為常數級。同時，V4將專家權重量化為FP4精度，吞吐量是FP8的兩倍，且維持99.7%的檢索召回率。

第三重：國產算力開辟成本第二曲線

V4定價說明中還藏著一行關鍵信息：“預計下半年昇騰950超節點批量上市后，Pro版價格將大幅下調。”這說明DeepSeek的低價邏輯正從“模型優化驅動”轉向“模型+算力體系驅動”。V4已在英偉達GPU和華為昇騰NPU兩套體系上完成驗證，實現1.5-1.73倍加速。V4發布當日，華為昇騰等8家國產AI芯片品牌集體宣布Day-0適配。

三、降價背后真正目標：將Agent時代的定價權帶入中國節奏

回到那個問題，DeepSeek降價的真正目的是什么？

市場普遍將此解讀為針對 OpenAI、Anthropic 等巨頭的價格戰，但深入分析會發現，DeepSeek的真正目標并非某一個特定對手，而是要在大模型產業從 "對話時代" 向 "Agent 時代" 躍遷的歷史關口，將全球 AI 基礎設施的定價權從硅谷手中奪過來，帶入中國節奏。

定價權從來不是簡單的價格高低，而是定義一個時代商業規則的權力。在對話式 AI時代，OpenAI憑借先發優勢在早期建立了 "按能力定價" 的行業標準：GPT-4級別的模型就應該賣10美元/百萬Token以上，Claude Opus甚至可以賣到20美元以上。這種定價體系建立在 "模型能力是稀缺資源" 的前提之上，讓硅谷巨頭能夠賺取超額利潤，同時將絕大多數開發者擋在規模化應用的門外。

但 Agent 時代徹底改變了游戲規則。智能體執行任務時，Token消耗不再是線性的，而是呈指數級增長。一個簡單的代碼編寫任務可能需要數萬Token的自我糾錯和工具調用，一個復雜的企業級工作流甚至會消耗上億Token。在這種場景下，硅谷的高溢價定價體系直接宣判了Agent商業化的死刑 —— 哪怕是最有前景的應用，也會可能被高昂的推理成本拖垮。

速途網認為，梁文鋒正是看到了這一點，才主動出手擊穿價格底線。他將V4-Flash的緩存輸入價格壓至0.02元/ 百萬Token，V4-Pro限時優惠后僅0.025元，這個價格不到 GPT-5.5 Pro 的1/8000，不到Claude Opus 4.7 的1/1400。

更關鍵的是，這個價格不是燒錢補貼的結果，而是建立在真實成本優勢之上的。梁文鋒曾經坦言他們的定價原則："我們的原則是不貼錢，也不賺取暴利。這個價格也是在成本之上稍微有點利潤。"

"搶用戶并不是我們的主要目的。我們降價一方面是因為我們在探索下一代模型的結構中，成本先降下來了；另一方面也覺得無論是API還是AI都應該是普惠的，人人可以用得起的東西"，梁文鋒曾在采訪中表示。

當然，這種成本自信不是偶然的，而是中國 AI 產業全產業鏈協同的必然結果。從西部綠電，到華為昇騰、寒武紀的國產AI芯片，再到PUE逼近1.1的液冷數據中心，中國已經構建了全球最具競爭力的 "能源 - 算力 - 模型" 價值鏈。這種結構性的成本差異，決定了Agent時代的定價權必然會向中國轉移。

市場已經用腳投票給出了答案。OpenRouter 數據顯示，截至 2026 年 4 月中旬，中國模型在 OpenRouter 平臺的周調用量已是美國的 4.3 倍。降價首日，DeepSeek V4-Pro的調用量就飆升近四倍，想必其中很多新增用戶來自原OpenAI和Anthropic的客戶。當越來越多的Agent應用基于DeepSeek 的價格體系構建時，它就會成為事實上的行業標準，迫使所有廠商要么跟進降價，要么被邊緣化。

同時，我們也要清醒地看到，定價權的爭奪是一場長期戰役。硅谷巨頭仍然掌握著頂尖模型的技術優勢，OpenAI在DeepSeek降價前發布GPT-5.5，試圖用技術代差來維持高溢價。DeepSeek等中國AI新貴們要真正掌握定價權，還需要在模型穩定性、工具調用能力和生態建設上持續投入。

速途網始終認為，AI最終是普惠的全球基礎設施，而不是某幾家巨頭的盈利工具。當Agent時代的全球定價權進入中國節奏，受益的將是全世界的開發者和企業，整個AI產業的創新速度也將因此大大提速。

（文/言飛）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.