![]()
不誘于譽(yù),不恐于誹,率道而行,端然正己。
簡(jiǎn)單邏輯看復(fù)雜世界 YU YUAN TAN TIAN
帶著十六個(gè)字,DeepSeek新版本,姍姍來(lái)遲。
距離上一次更新的V3.2版本,已經(jīng)過(guò)去近5個(gè)月。
這期間,安索皮克(Anthropic)的克勞德神話(Claude Mythos)模型在網(wǎng)絡(luò)攻擊上展現(xiàn)出前所未有的能力,有機(jī)構(gòu)稱其將網(wǎng)絡(luò)攻擊的時(shí)代從“手工化”帶到了“工業(yè)化”;GPT-Image-2也讓網(wǎng)友驚呼“有圖有真相”的時(shí)代已經(jīng)過(guò)去……
![]()
在這個(gè)國(guó)外主流大模型平均91.4天就迭代一個(gè)版本的時(shí)代,DeepSeek的“靜默”,在很多人眼里幾乎等同于落后,甚至掉隊(duì)。
沉默的DeepSeek,讓人很不習(xí)慣——2025年初的橫空出世、用更少的算力實(shí)現(xiàn)更優(yōu)的性能、打破美西方營(yíng)造的“算力焦慮”。這些標(biāo)簽,讓它的意義不止于一個(gè)公司的一款產(chǎn)品。
因此,幾個(gè)月里,關(guān)于DeepSeek-V4的市場(chǎng)傳聞就沒(méi)斷過(guò)。
當(dāng)時(shí),國(guó)外科技媒體稱V4模型將在今年春節(jié)發(fā)布,具有強(qiáng)大的編碼能力。
當(dāng)一家公司最核心產(chǎn)品的動(dòng)態(tài)被匿名信源、外媒報(bào)道和券商研報(bào)所定義——這本身已偏離了技術(shù)討論的軌道。
DeepSeek官方從未對(duì)外界的消息做過(guò)任何確認(rèn),這種沉默,又讓討論升級(jí)。
![]()
2月26日,事情迎來(lái)轉(zhuǎn)折。
路透社稱,據(jù)知情人士透露,DeepSeek發(fā)布V4之前,沒(méi)有向美國(guó)芯片公司英偉達(dá)和超微半導(dǎo)體(AMD)提供模型早期訪問(wèn)權(quán)限,而是讓中國(guó)企業(yè)華為提前數(shù)周開展軟件適配優(yōu)化工作。
路透社在報(bào)道中用了一個(gè)表述——
breaking from standard industry practice(打破行業(yè)慣例)。
這是此前無(wú)論中國(guó)公司還是外國(guó)公司的大模型,都沒(méi)有采用過(guò)的方式。
顯然,此時(shí)討論的已經(jīng)不只是一個(gè)公司能否發(fā)布新產(chǎn)品的問(wèn)題了。
簡(jiǎn)單邏輯看復(fù)雜世界 YU YUAN TAN TIAN
此次DeepSeek與華為昇騰國(guó)產(chǎn)芯片體系深度適配,并不令人意外。
去年8月,DeepSeek發(fā)布DeepSeek-V3.1時(shí)就宣布采用UE8M0 FP8 Scale參數(shù)精度,特別表示這一數(shù)據(jù)格式是針對(duì)即將發(fā)布的下一代國(guó)產(chǎn)芯片設(shè)計(jì)。
軟件主動(dòng)適配硬件特性,本質(zhì)上是在為國(guó)產(chǎn)芯片“量體裁衣”。
這背后的難度超乎想象,需要大量改寫調(diào)用芯片的軟件代碼,使其與目標(biāo)系統(tǒng)在各個(gè)環(huán)節(jié)都實(shí)現(xiàn)兼容。
依據(jù)新款芯片的特點(diǎn),哪些代碼還能沿用,哪些必須重寫? 原本依賴的算子、通信方式和并行策略,放到國(guó)產(chǎn)芯片上還能否成立? 訓(xùn)練流程中最關(guān)鍵的環(huán)節(jié),怎樣調(diào)整才能既跑得通,又不損失太多性能?
因此,要想一款國(guó)產(chǎn)芯片嵌入既有的模型訓(xùn)練和推理體系,并達(dá)到可用、好用、能規(guī)模化使用的狀態(tài),往往需要長(zhǎng)期摸索。
而當(dāng)國(guó)產(chǎn)芯片開始在具體場(chǎng)景里能夠接住原本由外國(guó)芯片承擔(dān)的計(jì)算任務(wù),企業(yè)就可以不再依賴特定進(jìn)口型號(hào)。
國(guó)產(chǎn)芯片,能接得住嗎?DeepSeek的姍姍來(lái)遲,似乎給了這個(gè)問(wèn)題一個(gè)答案。但很少有人注意到這樣一個(gè)細(xì)節(jié)。
2025年12月31日,國(guó)家發(fā)展改革委召開了2025年的最后一場(chǎng)新聞發(fā)布會(huì)。會(huì)上,有記者問(wèn)了這樣一個(gè)問(wèn)題:
目前國(guó)產(chǎn)算力達(dá)到什么水平?
發(fā)言人回應(yīng):
目前,國(guó)產(chǎn)芯片產(chǎn)品在不同場(chǎng)景中加速適配,應(yīng)用成效可以說(shuō)非常好。特別是“超節(jié)點(diǎn)”等集群互聯(lián)技術(shù)發(fā)展,為國(guó)產(chǎn)算力趕上國(guó)際領(lǐng)先水平提供了良好機(jī)遇,拓展了廣闊發(fā)展空間。
不少人都知道,芯片、算力等的國(guó)產(chǎn)化,我們回應(yīng)不多。
就拿發(fā)改委來(lái)說(shuō),2015年以來(lái),發(fā)改委的新聞發(fā)布會(huì)上,提及國(guó)產(chǎn)算力寥寥無(wú)幾,并且很少對(duì)具體發(fā)展情況作出說(shuō)明。
從“回應(yīng)不多”到“正面回應(yīng)”,轉(zhuǎn)變,在持續(xù)發(fā)生。
科技與戰(zhàn)略風(fēng)云學(xué)會(huì)副會(huì)長(zhǎng)陳經(jīng)表示,從去年開始,國(guó)產(chǎn)芯片的需求端被真正拉動(dòng)起來(lái)了。
2025年,國(guó)產(chǎn)AI芯片的國(guó)內(nèi)市場(chǎng)份額已達(dá)到41%左右。
有人用,是商業(yè)邏輯的重要一步。
上海財(cái)經(jīng)大學(xué)胡延平教授就提到,從去年開始,國(guó)產(chǎn)AI芯片企業(yè)開始集中上市。
其意義不只在市值水平,企業(yè)能夠把更多資源投向下一代AI訓(xùn)練、推理芯片的研發(fā)。
從技術(shù)產(chǎn)品,到市場(chǎng)應(yīng)用,再回到資本支持,一個(gè)相對(duì)完整的正態(tài)循環(huán)正在形成。
簡(jiǎn)單邏輯看復(fù)雜世界 YU YUAN TAN TIAN
北京郵電大學(xué)人機(jī)交互與認(rèn)知工程實(shí)驗(yàn)室主任劉偉有一個(gè)觀點(diǎn)——模型加上芯片,是人工智能競(jìng)爭(zhēng)更進(jìn)一步的形態(tài)。
未來(lái)的AI發(fā)展,不僅在于算法的好壞,同樣也要看整個(gè)生態(tài)是否具有韌性。
主流的英偉達(dá)生態(tài),將硬件、軟件和開發(fā)者深度綁定,形成了事實(shí)上的行業(yè)標(biāo)準(zhǔn),在中國(guó)大模型訓(xùn)練芯片市場(chǎng)的占比一度高達(dá)95%。
可以說(shuō),幾乎所有頂級(jí)大模型都必須基于CUDA框架運(yùn)行。
于是,現(xiàn)在國(guó)產(chǎn)AI芯片面臨兩個(gè)選擇:
一是兼容CUDA生態(tài),降低遷移成本;二是自研軟件棧,重構(gòu)開發(fā)體系。
而中國(guó)大模型要想實(shí)現(xiàn)真正的自主,就必須形成軟硬件一體化的協(xié)同能力。
DeepSeek-V4模型在適配昇騰芯片后,實(shí)現(xiàn)了高吞吐、低時(shí)延的推理部署。
這是技術(shù)上的新探索,也是我們?cè)谲浻布f(xié)同領(lǐng)域的一種進(jìn)步信號(hào)。
今年初,智譜GLM-5也宣布完成與7家主流國(guó)產(chǎn)芯片平臺(tái)的深度適配,可以在國(guó)產(chǎn)算力集群之上實(shí)現(xiàn)穩(wěn)定運(yùn)行。
在大模型訓(xùn)練中,也出現(xiàn)了“純國(guó)產(chǎn)”的實(shí)踐樣本。
一些企業(yè)的大模型,訓(xùn)練過(guò)程基于國(guó)產(chǎn)算力體系完成。
陳經(jīng)分析稱,這意味著一套國(guó)產(chǎn)軟硬件協(xié)同的AI研發(fā)生態(tài)正在逐漸完善。
盡管當(dāng)前中國(guó)的制程不占優(yōu)、單卡性能有限,但我們也會(huì)通過(guò)系統(tǒng)設(shè)計(jì)、集群架構(gòu)、軟硬件協(xié)同、電力能耗等優(yōu)勢(shì)排布,在既有條件下,探索新的發(fā)展解法。
當(dāng)我們討論中國(guó)AI企業(yè)時(shí),我們討論的其實(shí)不只是企業(yè)本身,更是一個(gè)行業(yè),以及背后代表的一種發(fā)展模式。
正如那十六個(gè)字的后半句所說(shuō):
率道而行,端然正己。
中國(guó)AI,更需要活在自己的節(jié)奏里。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.