本期要點:彎道超車,真有機會
你好,我是王煜全,這里是王煜全要聞評論。
4月24日,大家翹首期盼的DeepSeek V4發布了。幾乎在同一時間,也有消息稱,DeepSeek終于開始外部融資了,騰訊和阿里巴巴正在洽談投資,估值可能超過200億美元。
![]()
很多人第一反應是,DeepSeek V4有沒有超過GPT或Claude的最新模型。
那么,有關DeepSeek V4的性能和參數規模,我們周六的文章已經做了介紹,今天不再贅述。
但如果只盯模型能力,很可能就看錯了重點。真正值得關注的是,DeepSeek V4把Agent調用成本又往下打了一大截,并會改變AI的使用方式。
過去,長上下文和低成本,往往是兩個難以兼得的目標。
Agent調用,往往追求長上下文,也就是模型的記性要好。但這也導致,它在生成每一個字時,都會參考前面幾十萬甚至上百萬token的背景信息,帶來高昂的成本和緩慢的響應速度。
可是,追求低成本,用更少的計算資源完成任務,后果就是模型很難長期保留復雜背景,也不適合承擔長鏈路任務。
DeepSeek V4將兩者結合在了一起,這背后既有模型架構和推理工程的優化,也一定程度上源于DeepSeek與華為昇騰的深度適配。
因此,DeepSeek V4的價格被壓到了底。
比如V4-Flash版本,輸入每百萬token最低只要0.2元,輸出約為2元。如果只看輸出價格,它大約只有GPT-5.5輸出價格的百分之一左右,甚至相比其他中國大模型也有明顯價格優勢。
為什么價格這么重要?
因為AI一旦從聊天工具變成執行工具,競爭邏輯就變了。開發者也開始算賬了,誰能最低成本地完成真實的任務,誰就會受到青睞。
所以,在Agent時代,大模型競爭的核心,很可能不再是參數量了。我們真正要看的,是模型的調用量和隨之帶來的迭代速度。
價格優勢
首先,我們要注意,當調用大模型的主力從人變成Agent,貴就是不容忽視的劣勢。
在ChatGPT時代,用戶問一個問題,模型回答一次,哪怕是重度用戶,也不會產生多大的調用量。價格高一點,大家也都能接受。
于是過去三年,大家追求的是模型的性能,哪個模型分數高,回答更聰明,就先用哪個。
![]()
但隨著年初OpenClaw的爆火,Agent成了大模型的主要調用方。而Agent處理的是任務,比如自動生成報告、修改代碼、處理客戶需求,不再只是問答。
就像自動生成報告,它需要先拆解任務,再搜集資料、核實信息、調用框架進行分析、生成報告、檢查結果,最后再修改完善。這一套流程下來,背后可能是幾十次甚至上百次的模型調用。
那么粗略算一下,假設一個企業每天處理100次的報告任務,就要調用上萬次模型。哪怕每次只產生1000個輸出token,累計下來也是千萬級的token消耗。
如果使用的是GPT-5.5這樣的高價模型,單日輸出成本就可能高達數百美元。但如果換成DeepSeek V4,完成同樣的工作,只要幾美元。
要知道,這個差距還會隨著調用頻率的提升而不斷拉大,這時價格就會是個重要的因素,會決定企業敢不敢把AI放進業務流程里。
所以,我們想指出的是,這正是中國模型的機會所在。我們不一定要在每個任務中都比GPT或Claude強,甚至只要足夠便宜,就會吸引企業和開發者們來嘗試。
更重要的是,中國大模型都在讓AI和Agent更加適配,從而能進入真實流程。
同樣在這個月,Kimi發布并開源了K2.6,不僅價格比美國閉源模型便宜,而且可以調度多達300個子智能體,并行處理復雜任務。MiniMax的M2.7則針對復雜技能場景進行了優化,可以處理長鏈路的工作流。
麻煩花十秒點下,一起看看Agent時代的真相
新的進化飛輪
那么,是不是便宜、然后用得多,中國模型就能實現反超?也沒有這么簡單。
調用量大不等于進步快,也不等于能干活。一個每天被調用一百萬次來閑聊的模型,也學不會自動處理企業的財報。
我們認為,真正推動AI進化的,是在真實任務中、特別是Agent調用中產生的反饋,尤其是那些失敗的嘗試。
在Agent的工作流里,往往失敗的情況會千奇百怪。
比如生成的代碼看起來沒問題,一運行就崩潰;面對一個復雜需求,任務拆解不合理,導致后面越跑越錯;明明Agent應該去驗證結果,卻把不少明顯的錯誤都放過了等等。
這些失敗的瞬間,其實蘊含著巨大且寶貴的信息,它們都指出了當前AI大模型的薄弱環節。這些錯誤背后,可能是知識盲區、是推理能力不足,也可能是工具調用、結果驗證和幻覺控制的問題。
這就像特斯拉訓練FSD所用的“影子模式”。當系統發現駕駛員的實際操作與AI的預測不一致時,司機的每一次接管,都是在精準地告訴AI:看好了,這時候要這樣做。
如果AI永遠停留在聊天窗口里,模型能獲得的反饋就很有限。只有融入AI Agent的規模化調用,它才能獲得這些真實任務中產生的反饋。
同樣任務的反復調用,用戶的打斷和糾正,工具返回的錯誤信息,代碼測試的失敗結果,都是清晰的信號,標注出系統當前的能力邊界和優化方向。
誰更快地把這些反饋用于模型地優化,誰就能在下一輪任務中表現得更好,就有可能被用戶更多地調用,產生更多反饋。一旦這個正向循環啟動,模型的成長曲線就會變得更陡,哪怕是后起之秀,也有可能在未來的某個時間點實現超越。
目前,中國大模型的調用量在顯著上漲。最開始,這個上漲可能是由便宜帶來的,也會伴隨很多用戶的吐槽,比如輸出質量不行、或是有點笨。
但這恰恰是一個好的起點。
便宜帶來真實的調用,調用帶來失敗反饋,如果這些反饋能夠被系統性吸收,中國模型就有可能從只是便宜,變成更懂用戶的、更能融入工作流。
DeepSeek V4的發布也在提醒我們,AI正在從模型競賽進入應用競賽。接下來真正重要的,是誰能把AI Agent變成真正的服務。
所以,你準備開始加入Agent浪潮了嗎?又準備如何參與呢?歡迎在評論區留下你的看法。
以上就是今天的內容,更多的科技產業新趨勢和底層規律,歡迎加入學習,和我一起,先人一步,領先一路!
也在這向你推薦前哨AI小課,用一頓火鍋的錢,帶你跟上Agent浪潮,絕對物超所值!
王煜全要聞評論,我們明天見。
↓長按圖片掃碼報名,先人一步,領先一路
最后, 鑒于公眾 號推送機制的改變,你未來刷 到要聞評論的機會可能沒那么多了,建議你加入粉絲群,第一時間 得到我的獨家前沿分析,而且我們還會每天在粉絲群里發布獨家資料 ,快快掃碼加入吧!
此外,我們還為您準備了一個思維導圖,掃描加群即可領取
“Agent時代的三大浪潮”
↓點擊學習王煜全老師最新大師課,掌握馬斯克的賺錢底層邏輯!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.