C114訊 4月24日下午消息(蔣均牧)中國人工智能領(lǐng)域的明星企業(yè)深度求索(DeepSeek)正式上線全新系列模型DeepSeek-V4預(yù)覽版并同步向全球開源,宣告時隔一年有余的重磅回歸。該系列模型以百萬超長上下文為核心亮點,同時大幅降低了對計算和顯存的需求,在智能體能力、通用世界知識與復(fù)雜推理性能三大維度均實現(xiàn)國內(nèi)與開源領(lǐng)域領(lǐng)先。
而幾乎在發(fā)布的第一時間,華為即宣告昇騰超節(jié)點全系列產(chǎn)品及華為云已完成對DeepSeek-V4的全面支持。這一在業(yè)界預(yù)期之中卻又不免令人心頭一震的聯(lián)動,不僅讓英偉達(dá)掌門人黃仁勛前不久的警告一語成讖,更標(biāo)志著中國AI產(chǎn)業(yè)在擺脫對CUDA生態(tài)依賴一事上再下一城。
重磅回歸:開源模型再次比肩世界頂級閉源
今年1月中旬,The Information率先曝料稱,DeepSeek計劃在2月發(fā)布下一代模型,并聲稱其在編程能力方面已趕超Claude與GPT系列等頂尖閉源競品。然而整個2月,DeepSeek官方始終保持靜默,外界一度對發(fā)布節(jié)奏產(chǎn)生疑慮。而今日的種種動作表明,這份等待非常值得。
此次發(fā)布的DeepSeek-V4系列包含兩個MoE架構(gòu)版本——面向高性能場景的V4-Pro和面向經(jīng)濟(jì)部署的V4-Flash。Pro版總參數(shù)達(dá)到1.6萬億,激活參數(shù)490億;Flash版總參數(shù)2840億,激活參數(shù)130億。 兩款模型均支持1M上下文,且成為DeepSeek所有官方服務(wù)的標(biāo)配。
性能方面,V4-Pro在Agentic Coding評測中達(dá)到當(dāng)前開源模型最佳水平,且已成為DeepSeek內(nèi)部主力Agentic Coding工具,使用體驗優(yōu)于Sonnet 4.5,交付質(zhì)量接近Opus 4.6非思考模式;在世界知識測評中,大幅領(lǐng)先其他開源模型,僅稍遜于頂尖閉源模型Gemini-Pro-3.1;在數(shù)學(xué)、STEM、競賽型代碼等推理任務(wù)中,超越所有已公開評測的開源模型,取得了比肩世界頂級閉源模型的優(yōu)異成績。V4-Flash則在保持強勁推理性能的同時優(yōu)化了模型結(jié)構(gòu)與激活規(guī)模,能夠提供更加快捷、經(jīng)濟(jì)的API服務(wù)。
技術(shù)層面不可不提的是,DeepSeek-V4創(chuàng)新性地引入了一種基于token維度的動態(tài)壓縮注意力機(jī)制,并與自主研發(fā)的DSA稀疏注意力技術(shù)緊密結(jié)合,在同等上下文長度下單次推理的計算開銷與顯存占用較前代方案大幅下降。這項突破使得百萬級上下文支持從宣傳亮點真正走向工程實踐,為長文檔處理、復(fù)雜邏輯推演等場景的規(guī)模化落地掃清了關(guān)鍵障礙。
定價方面,DeepSeek延續(xù)了其一貫務(wù)實的市場策略。以每百萬tokens計,F(xiàn)lash版輸入(緩存命中)0.2元,輸入(緩存未命中)1元,輸出2元;Pro版依次為1元、12元、24元,官網(wǎng)聊天與App端保持免費。這一價格體系,依然是DeepSeek撬動開發(fā)者生態(tài)、搶占市場份額的有力武器。
華為首發(fā)適配:芯模協(xié)同從“能用”邁向“好用”
一款大模型的發(fā)布固然值得關(guān)注,但真正決定其生態(tài)影響力的,是潛在的應(yīng)用場景與背后的硬件支撐。而DeepSeek-V4發(fā)布當(dāng)日最值得解讀的信號,無疑指向華為昇騰平臺的同步適配。
據(jù)華為云官方消息,DeepSeek-V4模型正式發(fā)布并開源后,華為云第一時間實現(xiàn)了首發(fā)適配。基于昇騰CANN架構(gòu),華為云針對V4獨創(chuàng)的注意力機(jī)制優(yōu)化了分層注意力壓縮方案,實現(xiàn)了V4注意力機(jī)制下KVCache的高效分配管理,提供了TopK、SWA、CFA等十多種昇騰高性能融合算子,搭配框架異步調(diào)度與MTP多步投機(jī)等框架技術(shù),完整支持原生1M長上下文的高性能推理。
同時,華為計算宣布昇騰超節(jié)點全系列產(chǎn)品全面支持DeepSeek-V4系列模型,雙方通過芯模技術(shù)緊密協(xié)同完成了這項部署。昇騰950通過融合kernel和多流并行技術(shù)降低Attention計算和訪存開銷,大幅提升推理性能,結(jié)合多種量化算法,實現(xiàn)了高吞吐、低時延的DeepSeek V4模型推理部署。昇騰A3超節(jié)點系列產(chǎn)品也全面適配,同時為便于用戶快速微調(diào),提供了基于昇騰A3超節(jié)點的訓(xùn)練參考實現(xiàn)。
通過提供更低的延遲、更高的吞吐,昇騰950超節(jié)點重新定義了長文本推理的性能天花板,讓V4-Pro這樣能力頂尖的開源模型從“能用”邁向“好用”。華為計算指出,基于V4-Pro模型,在8K輸入場景,昇騰950超節(jié)點可實現(xiàn)TPOT約20ms時單卡Decode吞吐4700TPS。V4-Flash模型,8K長序列輸入場景下可實現(xiàn)TPOT約10ms時單卡Decode吞吐1600TPS。
DeepSeek官方文檔亦顯示,V4的細(xì)粒度專家并行方案已同時在英偉達(dá)GPU和華為昇騰NPU兩個平臺上完成驗證,這意味著DeepSeek-V4在設(shè)計之初便已將多平臺、多硬件體系的兼容性納入技術(shù)規(guī)劃,而非事后倉促適配。更值得留意的是,DeepSeek在披露價格的同時,還在價格欄下方的小字中提到,“受限于高端算力,目前V4-Pro的服務(wù)吞吐十分有限,預(yù)計下半年昇騰950超節(jié)點批量上市后,Pro的價格會大幅下調(diào)”,這句話的潛臺詞很清晰——V4-Pro的規(guī)模化部署,錨定的是昇騰950的產(chǎn)能爬坡。
黃仁勛的預(yù)言:“災(zāi)難”正在成為現(xiàn)實
英偉達(dá)CEO黃仁勛在一檔播客訪談中說出一番分量不輕的判斷。他指出,中國擁有豐富的能源、巨量的芯片以及絕大多數(shù)的人工智能研究人員,把中國變成敵人并非明智之舉。在談及DeepSeek時,他直言不諱地強調(diào):“如果DeepSeek先在華為平臺上發(fā)布,那對我們國家來說將是災(zāi)難性的。”
從當(dāng)下的現(xiàn)實來看,這番警告甚至頗為及時。在黃仁勛的判斷中,美國的出口管制政策正在產(chǎn)生深刻的逆向效應(yīng)——它非但沒有遏制中國AI產(chǎn)業(yè),反而加速了其內(nèi)部整合。當(dāng)DeepSeek這樣具備頂尖軟件能力的公司發(fā)現(xiàn)無法獲取英偉達(dá)最強芯片時,選擇與華為昇騰深度耦合,從底層將每一分硬件性能推到極致,幾乎是邏輯上的必然。
他清醒地認(rèn)識到,一旦中國在7nm節(jié)點上通過極致的軟件優(yōu)化實現(xiàn)了與美國3nm乃至更先進(jìn)制程同等甚至更強的AI推理表現(xiàn),美國在硬體節(jié)點上的代際優(yōu)勢將被悉數(shù)抹平。而DeepSeek-V4推出伊始即與華為深度適配,正是這一判斷從理論推演走向現(xiàn)實圖景的轉(zhuǎn)折點。
從產(chǎn)業(yè)層面觀察,DeepSeek-V4與昇騰的深度適配,標(biāo)志著中國AI產(chǎn)業(yè)在“去CUDA化”進(jìn)程中邁出了里程碑式的一步。早在本月初已有公開報道顯示,V4已首次實現(xiàn)與華為昇騰等國產(chǎn)芯片的深度適配,意味著中國AI產(chǎn)業(yè)在擺脫對外國技術(shù)生態(tài)依賴的進(jìn)程中取得了實質(zhì)性突破。
從CUDA到CANN的遷移不是簡單的代碼移植,而是底層算子重寫、精度對齊、通信協(xié)議重構(gòu)的全棧工程。 據(jù)接近項目的人士透露,適配過程中最耗時的并非算子重寫,而是精度對齊——同樣的模型在英偉達(dá)和昇騰上跑出一致結(jié)果,需要反復(fù)調(diào)試。昇騰950芯片在低精度數(shù)據(jù)格式、向量算力與自研HBM等方面的多項突破,則為V4的規(guī)模化部署提供了日益充沛的硬件底盤與算力底座。
資本市場對這一動向的反應(yīng)同樣異常激烈。今日上午DeepSeek-V4發(fā)布之后,GPU指數(shù)盤中直線拉升,海光信息漲幅超9%,中芯國際、龍芯中科、寒武紀(jì)、摩爾線程等國產(chǎn)芯片標(biāo)的紛紛跟漲。國產(chǎn)芯片概念股的普遍強勢表現(xiàn),反映了市場對中國AI算力“國產(chǎn)化替代”趨勢的積極預(yù)期。
今日的連番發(fā)布,意義不止于DeepSeek發(fā)布了一款極具競爭力的AI模型,展示了中國AI團(tuán)隊從算法層面不斷逼近乃至超越國際領(lǐng)先水平的能力,更在于華為昇騰與V4的深度適配,進(jìn)一步驗證了脫離CUDA、構(gòu)建自主算力生態(tài)的可行性。兩個方向的交匯點上的融合,或許正是黃仁勛眼中那只“房間里的大象”——一個圍繞中國本土技術(shù)與供應(yīng)鏈構(gòu)建的全新AI生態(tài)體系正在悄然成形,這在西方的戰(zhàn)略思考中,至今似乎仍未找到行之有效的應(yīng)對方案。
![]()
注:本圖由AI生成
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.