剛被GPT5.5刷屏幾小時,國產(chǎn)大模型就扔出王炸?
近日,DeepSeek憋了15個月的大更新終于來了,DeepSeek-V4系列正式上線,還同步開源!海外網(wǎng)友直接炸鍋,評論區(qū)滿屏“鯨魚回來了”“便宜又強大”,連OpenAI的熱度都被分走不少。
這次更新不僅是模型迭代,更是給整個行業(yè)扔下了一顆“價格+性能”的雙響炮。
這意味著你可以直接扔進去一本小說、一份超長合同,模型都能完整理解。
![]()
參數(shù)方面,Pro是1.6萬億總參數(shù),F(xiàn)lash是2840億總參數(shù),預訓練數(shù)據(jù)都超過32萬億。
價格更是延續(xù)了DeepSeek的“卷王”風格:Pro每百萬tokens輸入1元、輸出12元;Flash輸入0.2元、輸出2元。網(wǎng)友直接感慨:“還是那個DeepSeek,太普惠了!”
這次更新最受關注的,是DeepSeek終于用上了國產(chǎn)算力!官方小字透露,V4系列和華為昇騰合作,但受限于高端算力,Pro版本的服務吞吐目前很有限。
不過別急,下半年昇騰950超節(jié)點批量上市后,Pro的價格還會大幅下調(diào)。這波操作不僅打破了國外算力壟斷的焦慮,更讓國產(chǎn)大模型的未來多了幾分底氣。
DeepSeek-V4的性能到底有多強?官方給出的評測數(shù)據(jù)相當能打:
Pro版本:Agent能力直接干到開源模型天花板,內(nèi)部員工用它寫代碼的體驗比Anthropic的Sonnet 4.5還好,交付質(zhì)量接近Opus 4.6非思考模式。
世界知識測評大幅領先其他開源模型,僅略遜于Gemini-Pro-3.1;數(shù)學、STEM、競賽代碼方面,超越所有公開開源模型,比肩頂級閉源。
Flash版本:雖然世界知識稍弱,但推理能力接近Pro,而且更快更便宜。簡單任務和Pro旗鼓相當,高難度任務略有差距,適合日常快速使用。
更牛的是,Pro-Max模式在標準推理基準上,竟然優(yōu)于GPT5.2和Gemini3.0-Pro,只比GPT5.4和Gemini3.1-Pro差一點。這在開源模型里,絕對是斷層領先的存在。
就在說-to-AGI的目標不斷靠近”。技術突破與遺憾,未來還要補哪些課?
![]()
未來DeepSeek計劃精簡架構(gòu)、研究訓練穩(wěn)定性理論、探索更稀疏的嵌入技術,還要加入多模態(tài)能力。
不過這次V4沒發(fā)布多模態(tài)版本,有猜測是算力和資金不足。畢竟多模態(tài)已是行業(yè)標配,DeepSeek至今沒切入,融資確實迫在眉睫。
評論區(qū)聊聊你的看法,覺得有用的話別忘了點贊收藏,讓更多人知道這個國產(chǎn)卷王!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.