夢晨 發(fā)自 凹非寺量子位 | 公眾號 QbitAI
DeepSeek兩天連續(xù)兩次降價!
輸入輸出2.5折的基礎(chǔ)上,命中緩存的輸入折上折再打1折。
![]()
劃重點了,輸入緩存的折扣沒有規(guī)定時限哦~
DeepSeek研究員陳德里也確認,輸入緩存是永久降價,還打上了AGIforEveryone標(biāo)簽。
![]()
有學(xué)者表示,這將徹底改變?nèi)藗兲幚鞟I記憶的方式。
![]()
原來發(fā)布時候的“邁入百萬上下文普惠時代”是這個意思啊?
![]()
那么打折后到底省了多少錢?
只能說,比表面看起來還要更多。
實測編程整體節(jié)省83%
首先,Agent編程任務(wù)場景下,輸入的比例遠高于輸出。
而且DeepSeek的緩存優(yōu)化本來就做得好,V4-Pro的輸入緩存命中率約95%,V4-Flash約91%。
也就是說,真實花費的絕大部分token,都是按輸入(命中緩存)計算的。
在這一點上,V4-Pro每百萬token只比V4-Flash貴了0.5分錢。
![]()
![]()
此前量子位測試消耗約3500萬token,花費31.73元。
![]()
把數(shù)據(jù)發(fā)給DeepSeek,讓他計算一遍,與真實花費相差無幾。
但是!
按照打折后的新價格計算,只需要花5.34元了。
整體節(jié)省約83%,只花打折前17%的成本,就能獲得同樣的產(chǎn)出。
![]()
實際測試打折后消耗了1300萬的V4-Pro token。
緩存命中率稍有提升到了約96%,輸出token的占比與打折前測試的也差不多。
![]()
實際使用1300萬token,花費2.36元,也基本符合計算結(jié)果。
![]()
價格屠夫回來了
降價引發(fā)行業(yè)震動,DeepSeek不是第一次干了。
這種商業(yè)策略與他們的技術(shù)理念高度一致,通過底層架構(gòu)和算法的持續(xù)創(chuàng)新來壓低模型推理成本,并將這些成本優(yōu)勢迅速轉(zhuǎn)化為市場競爭力
早在2024年8月,DeepSeek就給V3降價,引發(fā)阿里云、字節(jié)等大廠更近,引發(fā)第一輪token價格戰(zhàn)。
R1發(fā)布后,更是通過夜間空閑時段額外打折的方法,讓價格戰(zhàn)進一步升溫。
這一次V4在開啟價格戰(zhàn),對海外用戶的心理沖擊力還要更大。
如果按美元標(biāo)價,小數(shù)點后有幾位都快數(shù)不清楚了。
![]()
有網(wǎng)友總結(jié),學(xué)生和AI初學(xué)者、小型企業(yè)都將受益匪淺。
![]()
最后,別忘了那行小字。
![]()
期待下半年,DeepSeek大規(guī)模部署華為算力后,價格還能給大家什么驚喜。
[1]https://x.com/deepseek_ai/status/2048440764368347611?s=20
[2]https://x.com/victor207755822/status/2048442362800804159
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.