4月24日,值得書寫的一天。
DeepSeek V4發(fā)布,同日OpenAI發(fā)布GPT-5.5。兩大模型隔空對決。
深圳夢注意到,一條微博熱搜瞬間引爆全網(wǎng)——#。
這個預(yù)言就是:根據(jù) DeepSeek-V4 技術(shù)報告點名華為昇騰,其并細(xì)粒度專家并行(EP)方案同時在英偉達 GPU 和華為昇騰 NPU 上完成驗證,相比非融合基線在通用推理場景中實現(xiàn)。另據(jù) DeepSeek 公眾號披露,受限于高端算力,目前 DeepSeek-V4-Pro 的服務(wù)吞吐十分有限,預(yù)計下半年昇騰 950 超節(jié)點批量上市后,其價格會大幅下調(diào)。
當(dāng)天,華為昇騰直播解讀 DeepSeek-V4 技術(shù),并披露昇騰 950 性能表現(xiàn)。
值得一提的是,OpenAI 首席執(zhí)行官薩姆 · 奧特曼在社交平臺上分享了英偉達 CEO 黃仁勛發(fā)給他的一封電郵,后者附上了他給英偉達全體員工的一封電郵,要求他們使用 OpenAI 的 Codex 編程工具。黃仁勛在郵件中寫道:" 親愛的英偉達員工們,基于 GPT-5.5 的 OpenAI Codex 現(xiàn)已正式發(fā)布,面向所有英偉達員工開放!我們 10000 名員工——涵蓋工程、產(chǎn)品、法務(wù)、市場營銷、財務(wù)、銷售、人力資源、運營和開發(fā)者項目等各個部門——都已提前體驗,并已用它創(chuàng)造了許多令人驚嘆的成果…… Codex 不僅適用于軟件團隊,每個人都應(yīng)該使用 Codex 智能體。它們是我們的隊友,是讓我們超越以往的超能力。更好、更智能、更快。OpenAl 和英偉達團隊在 Endeavor 中搭建了一個 Codex 實驗室,旨在極大地促進你們的入門學(xué)習(xí)。未來幾周將舉辦一系列線上研討會。讓我們一起邁向光速時代。歡迎來到人工智能時代。"
深圳夢還注意到,4月24日,深圳技術(shù)大學(xué)一則推文稱:4月24日上午,深圳技術(shù)大學(xué)在C3行政樓101報告廳舉行“文化潤心大講堂”,特邀著名經(jīng)濟學(xué)家、澤平宏觀創(chuàng)始人任澤平,為學(xué)校師生開講“中國宏觀展望:新周期”主題報告。他特別提到“AI不是風(fēng)口,是海嘯”等核心觀點,并明確了企業(yè)出海、擁抱AI、挖掘新需求的應(yīng)對路徑。
是的,在深圳,“AI不是風(fēng)口,是海嘯”,讓我們邁向光速時代!
AI海嘯來了:DeepSeek V4發(fā)布,中國AI的"iPhone時刻"
這可能是我們這代人最重要的機遇。4月24日,DeepSeek V4發(fā)布,同日OpenAI發(fā)布GPT-5.5。兩大模型隔空對決,但這一次,中國的牌不一樣了。
01 黃仁勛說對了
4月15日,英偉達CEO黃仁勛在一檔播客節(jié)目中突然拔高音量,說了一句分量很重的話:
"如果DeepSeek先在華為平臺上發(fā)布,那對我們國家來說將是災(zāi)難性的。"
9天后的4月24日,華為昇騰CANN官方開啟直播:DeepSeek V4昇騰首發(fā)。
一條微博熱搜瞬間引爆全網(wǎng)——#。
而這場風(fēng)暴的中心,有一個被很多人忽略的坐標(biāo):深圳。
華為總部所在的深圳坂田基地,正是DeepSeek V4與昇騰芯片深度適配的技術(shù)策源地。2025年9月,昇騰超節(jié)點暨CANN生態(tài)合作大會就是在深圳龍崗華為坂田基地舉辦,匯聚了政府部門、龍頭企業(yè)、科研院所,共同推動國產(chǎn)算力生態(tài)建設(shè)。4月24日當(dāng)天,華為昇騰CANN官方直播也正是在深圳完成"DeepSeek V4昇騰首發(fā)"。
黃仁勛真正關(guān)注的不是中國做出好模型,而是頂級開源模型不再以英偉達CUDA生態(tài)為唯一優(yōu)化起點。過去二十年,CUDA是全球AI開發(fā)的"默認(rèn)操作系統(tǒng)"——寫代碼、跑模型、做訓(xùn)練,都繞不開英偉達。而現(xiàn)在,情況正在發(fā)生變化。
有趣的是,就在DeepSeek V4發(fā)布前后,OpenAI首席執(zhí)行官薩姆·奧特曼在社交平臺上分享了一封黃仁勛發(fā)給英偉達全體員工的內(nèi)部郵件——黃仁勛在郵件中要求所有員工使用OpenAI的Codex編程工具來輔助日常開發(fā)。
一邊在播客中警告"DeepSeek先在華為平臺上發(fā)布將是災(zāi)難性的",一邊在公司內(nèi)部全力推動員工使用OpenAI的AI編程工具。黃仁勛比任何人都清楚:AI不僅僅是模型競賽,更是生態(tài)和工具鏈的全面滲透。
DeepSeek首次在官方技術(shù)報告中,把華為昇騰NPU(神經(jīng)網(wǎng)絡(luò)處理器)和英偉達GPU(圖形處理器)寫進了同一份硬件驗證清單——
"我們在英偉達GPU和華為昇騰NPU兩個平臺上均驗證了細(xì)粒度EP(專家并行)方案。"
![]()
▲昇騰 950 性能表現(xiàn)(圖源:昇騰 CANN 直播截圖)
這標(biāo)志著萬億參數(shù)級別的模型首次在正式文檔中完成了對國產(chǎn)AI芯片的"官方認(rèn)定"。全球開發(fā)者第一次看到:存在一條不依賴英偉達、同樣可運行萬億參數(shù)頂級大模型的完整路徑。
2025財年,英偉達全年營收1305億美元,同比增長114%,數(shù)據(jù)中心收入達1152億美元,依然是全球AI算力的絕對領(lǐng)導(dǎo)者。但在中國市場,英偉達GPU份額已從巔峰時期的95%降至約55%,國產(chǎn)AI芯片出貨量占比已達41%。兩條技術(shù)路線并行發(fā)展的格局正在成型。
02 開源的核彈:性能碾壓、價格屠夫
4月24日,AI圈迎來真正的"神仙打架"。
OpenAI發(fā)布GPT-5.5,代號"土豆"(Spud),自GPT-4.5以來首次從零重訓(xùn),API輸入價5美元、輸出價30美元每百萬Token——價格直接翻倍。
同一天,DeepSeek發(fā)布V4預(yù)覽版,同步開源,MIT協(xié)議,兩個版本任你選:
DeepSeek V4-ProDeepSeek V4-FlashGPT-5.5總參數(shù)
1.6萬億
未公開
激活參數(shù)
490億
130億
上下文長度
100萬Token
100萬Token
100萬Token
輸入價格(元/百萬Token)
1元
0.2元
約36元
輸出價格(元/百萬Token)
24元
2元
約216元
DeepSeek V4-Flash的輸出價,是GPT-5.5的近百分之一。Pro版約為十分之一。
這不是差一點,這是降維打擊。
更關(guān)鍵的是,性能并沒有打折。在核心能力上,DeepSeek V4-Pro在多個基準(zhǔn)測試中比肩甚至超越頂級閉源模型:
![]()
MMLU通用知識:92.8分(GPT-5為92.5分)
MMLU-Pro復(fù)雜推理:88.5分(GPT-5為87.5分)
HumanEval代碼生成:93.8%(GPT-5為93.4%)
MATH競賽數(shù)學(xué):85.2分(GPT-5為84.7分)
SWE-bench真實編程:81.5%(Claude Opus 4.7為80.9%)
Codeforces編程競賽:3206 Elo,相當(dāng)于人類選手第23名,開源最高
在Agent能力方面,V4-Pro內(nèi)部評測體驗優(yōu)于Claude Sonnet 4.5,交付質(zhì)量接近Opus 4.6非思考模式。在第三方vals.ai榜單上,DeepSeek V4排名開源第一、全球第九。
國產(chǎn)模型性能追平、成本碾壓。這意味著什么?意味著AI開發(fā)者的成本門檻即將暴跌,國產(chǎn)AI應(yīng)用即將迎來大爆發(fā)。
2025年,騰訊元寶接入DeepSeek后月活增長265%,豆包應(yīng)用月活破1億。而V4-Flash 0.2元/百萬Token的價格,相當(dāng)于讓每一個中小開發(fā)者都能以接近零的成本構(gòu)建自己的AI產(chǎn)品。
深圳是全國最早全面擁抱DeepSeek的城市。早在2025年2月,深圳就基于政務(wù)云環(huán)境面向全市各區(qū)各部門正式提供DeepSeek模型應(yīng)用服務(wù)——超過160家深圳企業(yè)接入DeepSeek,28家市屬國企舉辦DeepSeek專題研討會,深圳海事局更是以昇騰910 AI服務(wù)器為核心落地了算力底座。從政務(wù)系統(tǒng)到水務(wù)環(huán)保,從金融證券到港口物流,深圳用最實際的動作證明:國產(chǎn)大模型不是概念,而是每天都在運轉(zhuǎn)的基礎(chǔ)設(shè)施。
長文本方面,DeepSeek V4全系標(biāo)配100萬Token上下文——相當(dāng)于把整個《三體》三部曲一次性喂給AI。前代128K上下文已是一代人的記憶,如今直接提升近10倍,且通過創(chuàng)新的DSA稀疏注意力機制,在百萬Token場景下,V4-Pro的單token推理FLOPs僅為前代的27%,KV緩存占用僅為10%。
百萬Token,不再是昂貴的高配,而是標(biāo)準(zhǔn)配置。
普惠時代,真的來了。
03 國產(chǎn)算力的"iPhone時刻"
如果價格和性能只是"量變",那么DeepSeek V4與華為昇騰的深度適配,就是真正的"質(zhì)變"。
4月24日上午,DeepSeek發(fā)布V4預(yù)覽版。下午,華為官方宣布:昇騰超節(jié)點全系列產(chǎn)品全面支持DeepSeek V4。
這不是一次普通的商業(yè)合作。這是國產(chǎn)大模型與國產(chǎn)算力的標(biāo)志性組合,標(biāo)志著中國AI兩條最粗的腿終于綁在了一起。
華為這次拿出的底牌令人震撼。昇騰Atlas 350加速卡搭載昇騰950PR處理器:
單卡算力達到英偉達H20的2.87倍
HBM容量比H20多出16%(達112GB)
多模態(tài)生成速度比H20快60%
國內(nèi)唯一支持FP4低精度推理
要知道,H20是英偉達專門為中國市場定制的合規(guī)版本,算力約為H100的三成。而昇騰950PR的性能接近它的3倍,成本卻僅為三分之一。
在8K輸入場景下實測:昇騰950超節(jié)點運行DeepSeek V4-Pro,TPOT延遲僅20ms,單卡吞吐達4700TPS;運行V4-Flash,延遲僅10ms。
華為說這"重新定義了長文本推理的性能天花板"。
DeepSeek官方在備注中寫了一句意味深長的話:"受限于高端算力,目前V4-Pro的服務(wù)吞吐仍有限。預(yù)計下半年昇騰950超節(jié)點批量上市后,Pro版本價格會大幅下調(diào)。"
![]()
▲ DeepSeek-V4 技術(shù)報告
這意味著什么?意味著下半年國產(chǎn)算力大規(guī)模鋪開后,頂級大模型的價格可能還有數(shù)倍的下降空間。
04 CUDA之外的選擇:國產(chǎn)GPU集體起跑
DeepSeek V4與國產(chǎn)算力的深度融合,也讓深圳這座"AI先鋒城市"走到了聚光燈下。
2024年3月,深圳"20+8"產(chǎn)業(yè)集群2.0版發(fā)布,人工智能首次從軟件與信息服務(wù)集群中獨立升格,成為7個"戰(zhàn)略重點類"產(chǎn)業(yè)集群之一——與半導(dǎo)體、新能源并列,舉全市之力超常規(guī)支持。2025年3月,深圳發(fā)布《加快打造人工智能先鋒城市行動計劃(2025-2026年)》,提出到2026年實時可用智能算力超過80EFlops,規(guī)劃建設(shè)十大AI產(chǎn)業(yè)集聚區(qū),推出"訓(xùn)力券""語料券""模型券"降低企業(yè)成本。
數(shù)據(jù)顯示,2025年深圳人工智能核心產(chǎn)業(yè)營收約2200億元,集聚典型企業(yè)超,2600家,正加速構(gòu)建全球領(lǐng)先的AI產(chǎn)業(yè)生態(tài)。產(chǎn)業(yè)集聚,頭部企業(yè)引領(lǐng)全棧創(chuàng)新在深圳AI產(chǎn)業(yè)的“雁首”,華為、騰訊、榮耀等企業(yè)持續(xù)釋放技術(shù)動能。
2026年3月,深圳印發(fā)《加快推進人工智能服務(wù)器產(chǎn)業(yè)鏈高質(zhì)量發(fā)展行動計劃(2026-2028年)》,推動AI服務(wù)器全產(chǎn)業(yè)鏈——核心芯片、存儲、液冷、高速光模塊——在深圳創(chuàng)新集聚。
深圳在算力上也在全面迎戰(zhàn):3月26日,深圳市投建的11000P 智能算力集群正式點亮,加上去年先期點亮的3000P,目前該集群已全面建成14000P智能算力。這是全國首個使用全國產(chǎn)先進芯片構(gòu)建的萬卡級全棧自主可控智算集群。
此次點亮的智能算力集群是全國首個萬卡昇騰910C超節(jié)點智算集群,其投運標(biāo)志著深圳構(gòu)建自主可控算力底座上取得突破性進展。該項目全部采用國產(chǎn)先進芯片,依托全棧自主可控技術(shù),打造具備國際競爭力的“昇騰+CANN”自主軟硬件生態(tài),有效引導(dǎo)人工智能底層技術(shù)創(chuàng)新,推進關(guān)鍵技術(shù)國產(chǎn)化進程。
值得一提的是,深圳正在打造全棧自主的基礎(chǔ)算力底座。訓(xùn)練芯片方面,華為構(gòu)建從芯片、集群、軟件棧、開發(fā)框架到行業(yè)應(yīng)用的全棧自主可控AI計算生態(tài),全面對標(biāo)替代英偉達計算生態(tài),昇騰910系列芯片性能比肩國外主流產(chǎn)品,成為國產(chǎn)AI芯片的主力軍。在端側(cè)AI芯片及推理芯片方面,云天勵飛、云豹智能、鯤云科技、墨芯科技等公司相關(guān)芯片,已在細(xì)分場景實現(xiàn)商業(yè)化落地。
回到4月24日。除了華為昇騰,寒武紀(jì)、摩爾線程、天數(shù)智芯等國產(chǎn)芯片廠商同步宣布Day 0適配。
這不是一家企業(yè)在戰(zhàn)斗,是整條國產(chǎn)算力產(chǎn)業(yè)鏈在同一天起跑。
2025年,國產(chǎn)AI芯片迎來"豐收之年"。寒武紀(jì)首度全年盈利,營收65億元,同比增長453%;天數(shù)智芯營收10.34億元,同比增長91.6%;摩爾線程營收15.06億元,同比增長243%;沐曦股份營收16.44億元,同比增長121%。
國產(chǎn)AI芯片出貨量占比已達41%,英偉達份額從95%跌至55%。山西證券研報預(yù)測,國產(chǎn)化替代率即將突破50%的關(guān)鍵轉(zhuǎn)折點。
更深層的變化在生態(tài)層面。2025年8月,華為宣布CANN(昇騰計算架構(gòu))全面開源,對標(biāo)英偉達的CUDA。目前昇騰生態(tài)已吸引超3000家合作伙伴、400萬開發(fā)者。阿里通義、字節(jié)豆包等頭部大模型已完成從CUDA到CANN的全棧適配。
英偉達CUDA生態(tài)經(jīng)過二十多年積累,擁有成熟的工具鏈和龐大的開發(fā)者社區(qū),依然是全球AI開發(fā)的主流選擇。而國產(chǎn)算力生態(tài)正在快速追趕——從"能用"到"好用"到"主動選擇",完成了三級跳。兩條技術(shù)棧并行發(fā)展,為全球開發(fā)者提供了更多選擇。
05 新架構(gòu):花小錢,辦大事
DeepSeek V4之所以能在性能和成本上同時碾壓,核心秘密在于架構(gòu)創(chuàng)新。
一是MoE混合專家架構(gòu)——"聰明調(diào)度"。
DeepSeek V4-Pro總參數(shù)高達1.6萬億,但每次任務(wù)僅激活約490億參數(shù)——只"喚醒"3%的專家來解決問題。V4-Flash更極致:2840億總參數(shù),只激活130億。
打個比方:如果你的公司有16000名員工,但每次項目只需要調(diào)490名最對口的專業(yè)人員來干,效率和成本可想而知。
二是混合注意力機制——"兼顧全局與細(xì)節(jié)"。
V4首創(chuàng)融合兩種注意力機制:CSA(壓縮稀疏注意力)和HCA(重度壓縮注意力)。處理長篇內(nèi)容時,它既能精準(zhǔn)定位關(guān)鍵細(xì)節(jié),又能快速掌握宏觀大意,算力需求較前代大幅降低。
三是FP4+FP8混合精度——極致壓縮。
V4的MoE專家權(quán)重采用FP4精度,恰好是華為昇騰950PR芯片的原生支持精度。這意味著在國產(chǎn)芯片上運行V4,效率反而可能更高。
再加上Muon優(yōu)化器替代AdamW實現(xiàn)更快收斂、mHC流形約束超連接增強傳統(tǒng)殘差連接、單token推理FLOPs降至前代的27%……
"花小錢,辦大事",DeepSeek用中國智慧定義了AI效率的新標(biāo)準(zhǔn)。
06 這一代人的機遇
回到開頭那個問題:為什么說這是我們這代人最重要的機遇?
因為AI正在從"比誰更聰明"進入"比誰更便宜、更快、更普惠"的新階段。
黃仁勛說:"AI的終極目標(biāo),是將廉價的電子轉(zhuǎn)化為高價值的Token。"2026年全球AI產(chǎn)業(yè)進入"商業(yè)兌現(xiàn)期",推理算力占比首次超過70%。這意味著AI不再是實驗室里的玩具,而是深入每一個行業(yè)、每一個崗位、每一個日常場景的生產(chǎn)力工具。
OpenAI內(nèi)部超85%員工每周使用GPT-5.5驅(qū)動的Codex。英偉達預(yù)計AI推理規(guī)模很快將達到訓(xùn)練負(fù)載的十億倍。
而當(dāng)推理成本降到DeepSeek V4-Flash的0.2元/百萬Token時,每一個普通人都能擁有一個幾乎免費的超級AI助手。
2025年中國算力市場規(guī)模預(yù)計達8351億元,增長30%。上海、湖北、四川等多地智算中心明確要求國產(chǎn)芯片占比超50%。中國移動哈爾濱智算中心已實現(xiàn)100%國產(chǎn)化。
而深圳,正在成為這場AI普惠浪潮的"超級加速器"。
2026年深圳市政府工作報告明確提出:加快建設(shè)全球人工智能先鋒城市,人工智能產(chǎn)業(yè)集群增加值增長10%以上,加強全棧自主可控AI軟硬件生態(tài)建設(shè)。深圳開放智算中心位于河套深港科技創(chuàng)新合作區(qū),規(guī)劃打造10萬卡級別超強算力集群;鵬城云腦Ⅲ作為國家級AI算力平臺,正建設(shè)E級智能算力核心節(jié)點。
更關(guān)鍵的是,深圳擁有華為(昇騰芯片)、騰訊(云端算力)、大疆(具身智能)、比亞迪(智能駕駛)等一批具備全球競爭力的科技巨頭,以及2800余家AI企業(yè)構(gòu)成的完整產(chǎn)業(yè)鏈。當(dāng)DeepSeek V4這樣的開源"地基"遇上深圳這樣的產(chǎn)業(yè)"高樓",從模型到算力、從芯片到應(yīng)用的全棧國產(chǎn)化閉環(huán),正在這里加速形成。
這不是技術(shù)競賽的故事,而是一個萬億級產(chǎn)業(yè)從底層到應(yīng)用全面重構(gòu)的故事。
07 尾聲:兩條技術(shù)棧,兩種未來,AI海嘯已經(jīng)來了
DeepSeek V4的發(fā)布,表面上看是一場模型更新,實質(zhì)上是AI產(chǎn)業(yè)格局的一次深刻變化。
GPT-5.5以5美元/百萬Token輸入、30美元/百萬Token輸出的高端定價,走的是"美國技術(shù)棧"——閉源、高價、英偉達綁定、企業(yè)級市場。
DeepSeek V4以0.2元/百萬Token輸入、2元/百萬Token輸出的極致定價,走的是"中國技術(shù)棧"——開源、普惠、昇騰適配、全民可用。
黃仁勛說,世界分裂為兩個技術(shù)生態(tài)是"災(zāi)難性的"。站在產(chǎn)業(yè)角度看,他的擔(dān)憂有其合理性——全球AI生態(tài)的分裂會增加開發(fā)成本、降低效率。但站在中國角度看,自主可控的技術(shù)棧是產(chǎn)業(yè)安全的必然選擇。
2025年7月,黃仁勛在北京接受采訪時說過另一句話:"DeepSeek和通義千問都是世界頂尖的開源大模型。"他還說:"中國在開源方面做得很出色,不僅助力形成中國的人工智能生態(tài),還推動了全球其他地區(qū)人工智能生態(tài)的構(gòu)建。"
英偉達CEO預(yù)言成真,相信不僅不能成為”災(zāi)難“,更應(yīng)該是對全球的重要貢獻。
4月24日這天,DeepSeek V4和GPT-5.5同日上線,被稱為AI圈的"雙王炸"。兩者的定價策略、生態(tài)路徑、技術(shù)路線,已經(jīng)勾勒出兩條截然不同的未來圖景。
深圳夢還注意到,4月24日,深圳技術(shù)大學(xué)一則推文稱:4月24日上午,深圳技術(shù)大學(xué)在C3行政樓101報告廳舉行“文化潤心大講堂”,特邀著名經(jīng)濟學(xué)家、澤平宏觀創(chuàng)始人任澤平,為學(xué)校師生開講“中國宏觀展望:新周期”主題報告中,特別提到“AI不是風(fēng)口,是海嘯”等核心觀點,簡要分析了中國經(jīng)濟向高質(zhì)量轉(zhuǎn)型、以AI和新能源為核心的第四次科技革命等關(guān)鍵特征,并明確了企業(yè)出海、擁抱AI、挖掘新需求的應(yīng)對路徑。
是的,AI海嘯已經(jīng)來了。
不是看誰能造出最聰明的模型,而是看誰能把最聰明的模型送到最多人手里。
這一次,中國的回答是:開源、普惠、自主。
深圳的回案是:自主、可控、低成本國產(chǎn)算力供給。
本文數(shù)據(jù)來源:DeepSeek官方API文檔、DeepSeek V4技術(shù)報告(58頁)、華為昇騰官方公告、OpenAI官方公告、《2025深圳人工智能產(chǎn)業(yè)發(fā)展白皮書》、深圳市政府工作報告、深圳特區(qū)報、騰訊科技、36氪、21世紀(jì)經(jīng)濟報道等。
部分基準(zhǔn)測試數(shù)據(jù)來自第三方平臺vals.ai和arena.ai,最終以各廠商官方數(shù)據(jù)為準(zhǔn)。
來源:深圳夢(微信號ID:SZeverything)
我們的使命是:星辰大海,只與夢想者同行!
擁有深圳夢,請關(guān)注(微信號ID:SZeverything)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.