![]()
DeepSeek-V4發布僅四天,就連出三記重拳:
4月25日,DeepSeek-V4-Pro宣布限時2.5折,原活動持續至5月5日。
4月26日,全系API輸入緩存命中價格直接降至首發價的1/10。
4月28日,官網“悄悄”更新API文檔,將V4-Pro的2.5折限時優惠由原定的5月5日延長至5月31日。
![]()
疊加限時折扣后,V4-Pro的緩存輸入直降40倍,低至每百萬token僅 0.025元,V4-Flash則降至每百萬token 0.02元,創下全球大模型價格新低。
這個價格已經打到對手的零頭。同樣處理100萬token緩存輸入,才剛上線不久的GPT-5.5 Pro要花約217元,用DeepSeek-V4-Pro只要0.025元,價差近8700倍。
事實上,速途網認為,這遠非表面的“價格戰”這么簡單,背后是深度求索的一場長期戰役。
一、從“追趕者”到“規則定義者”
要理解這輪降價的深意,必須先看清DeepSeek在行業中的真實位置。
過去一年,DeepSeek改變了中國大模型行業的定價方式。V3和R1發布后,國內外模型廠商被迫重新計算API價格、訓練成本和商業化路徑。而跑分領先從來不是DeepSeek的核心追求,反而在精益求精地“把高性能模型的使用門檻繼續往下壓”。
但從V4開始,DeepSeek的角色正在發生質變——它不再只是“價格屠夫”,而是開始定義AI基礎設施的成本錨點。高盛Ronald Keung團隊在最新研報中評價:“V4的核心意義在于以更低成本支持更復雜的智能體應用落地,從而打開AI應用規模化的新空間。”
![]()
更關鍵的是,DeepSeek V4是全球關注的焦點,中國AI的代表之一。
這從OpenClaw對V4的迅速反應就可以看出。在OpenClaw發布的4.24版本中,已正式將DeepSeek-V4-Flash設為系統默認推理模型,V4-Pro同步上線模型庫,可以說牌面很足了。
這似乎是一場互利共贏的雙向奔赴:OpenClaw獲得了更強、更便宜的中文推理能力,DeepSeek獲得了千萬級開發者流量的黃金入口。
事實上,這同時代表了最強Agent對于中國大模型超高性價比的持續肯定,讓開發者覺得“夠用且便宜”是最重要的,這相比此前的唯性能論,是完全不同的邏輯。要知道,DeepSeek調用成本僅為OpenAI的1/50至1/70。
二、降價底氣是?源于技術的三重突破
那么,梁文鋒的真正用意是什么?在此之前,我們先看下DeepSeek為什么總能在成本端搞事情?
第一重:記憶的工業化
在百萬token上下文下,V4的KV Cache占用僅為前代V3.2的10%。這其中涉及兩項創新:壓縮稀疏注意力(CSA)將緩存體積縮減75%;重度壓縮注意力(HCA)壓縮率達128倍,一整頁內容濃縮成幾個關鍵詞。
緩存壓縮90%后,V4可將這些條目直接存入廉價固態硬盤,用戶發起請求時從硬盤拉取,跳過了昂貴的GPU預填充計算。這是“白菜價”的真正秘密。
![]()
第二重:算力的結構性瘦身
在1M長上下文下,V4 Pro的單token推理算力僅為前代的27%,V4-Flash降至10%。這其中核心是一套動態稀疏選擇機制:每次生成token時只檢索得分最高的1024個壓縮KV條目,將傳統線性增長的計算復雜度強制截斷為常數級。同時,V4將專家權重量化為FP4精度,吞吐量是FP8的兩倍,且維持99.7%的檢索召回率。
第三重:國產算力開辟成本第二曲線
V4定價說明中還藏著一行關鍵信息:“預計下半年昇騰950超節點批量上市后,Pro版價格將大幅下調。”這說明DeepSeek的低價邏輯正從“模型優化驅動”轉向“模型+算力體系驅動”。V4已在英偉達GPU和華為昇騰NPU兩套體系上完成驗證,實現1.5-1.73倍加速。V4發布當日,華為昇騰等8家國產AI芯片品牌集體宣布Day-0適配。
三、降價背后真正目標:將Agent時代的定價權帶入中國節奏
回到那個問題,DeepSeek降價的真正目的是什么?
市場普遍將此解讀為針對 OpenAI、Anthropic 等巨頭的價格戰,但深入分析會發現,DeepSeek的真正目標并非某一個特定對手,而是要在大模型產業從 "對話時代" 向 "Agent 時代" 躍遷的歷史關口,將全球 AI 基礎設施的定價權從硅谷手中奪過來,帶入中國節奏。
定價權從來不是簡單的價格高低,而是定義一個時代商業規則的權力。在對話式 AI時代,OpenAI憑借先發優勢在早期建立了 "按能力定價" 的行業標準:GPT-4級別的模型就應該賣10美元/百萬Token以上,Claude Opus甚至可以賣到20美元以上。這種定價體系建立在 "模型能力是稀缺資源" 的前提之上,讓硅谷巨頭能夠賺取超額利潤,同時將絕大多數開發者擋在規模化應用的門外。
但 Agent 時代徹底改變了游戲規則。智能體執行任務時,Token消耗不再是線性的,而是呈指數級增長。一個簡單的代碼編寫任務可能需要數萬Token的自我糾錯和工具調用,一個復雜的企業級工作流甚至會消耗上億Token。在這種場景下,硅谷的高溢價定價體系直接宣判了Agent商業化的死刑 —— 哪怕是最有前景的應用,也會可能被高昂的推理成本拖垮。
![]()
速途網認為,梁文鋒正是看到了這一點,才主動出手擊穿價格底線。他將V4-Flash的緩存輸入價格壓至0.02元/ 百萬Token,V4-Pro限時優惠后僅0.025元,這個價格不到 GPT-5.5 Pro 的1/8000,不到Claude Opus 4.7 的1/1400。
更關鍵的是,這個價格不是燒錢補貼的結果,而是建立在真實成本優勢之上的。梁文鋒曾經坦言他們的定價原則:"我們的原則是不貼錢,也不賺取暴利。這個價格也是在成本之上稍微有點利潤。"
"搶用戶并不是我們的主要目的。我們降價一方面是因為我們在探索下一代模型的結構中,成本先降下來了;另一方面也覺得無論是API還是AI都應該是普惠的,人人可以用得起的東西",梁文鋒曾在采訪中表示。
當然,這種成本自信不是偶然的,而是中國 AI 產業全產業鏈協同的必然結果。從西部綠電,到華為昇騰、寒武紀的國產AI芯片,再到PUE逼近1.1的液冷數據中心,中國已經構建了全球最具競爭力的 "能源 - 算力 - 模型" 價值鏈。這種結構性的成本差異,決定了Agent時代的定價權必然會向中國轉移。
市場已經用腳投票給出了答案。OpenRouter 數據顯示,截至 2026 年 4 月中旬,中國模型在 OpenRouter 平臺的周調用量已是美國的 4.3 倍。降價首日,DeepSeek V4-Pro的調用量就飆升近四倍,想必其中很多新增用戶來自原OpenAI和Anthropic的客戶。當越來越多的Agent應用基于DeepSeek 的價格體系構建時,它就會成為事實上的行業標準,迫使所有廠商要么跟進降價,要么被邊緣化。
同時,我們也要清醒地看到,定價權的爭奪是一場長期戰役。硅谷巨頭仍然掌握著頂尖模型的技術優勢,OpenAI在DeepSeek降價前發布GPT-5.5,試圖用技術代差來維持高溢價。DeepSeek等中國AI新貴們要真正掌握定價權,還需要在模型穩定性、工具調用能力和生態建設上持續投入。
速途網始終認為,AI最終是普惠的全球基礎設施,而不是某幾家巨頭的盈利工具。當Agent時代的全球定價權進入中國節奏,受益的將是全世界的開發者和企業,整個AI產業的創新速度也將因此大大提速。
(文/言飛)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.