昨天華為正式提出了“韜(τ)定律”,在全行業(yè)引發(fā)了激烈討論。
關(guān)于韜(τ)定律的基本情況,我們已經(jīng)在昨天的文章中進(jìn)行了分析(不清楚的可以點進(jìn)主頁查看)。關(guān)于韜(τ)定律和邏輯折疊技術(shù)本身,目前還缺乏一些必要的技術(shù)細(xì)節(jié)。
今天我們就一些公開的資料,來綜合分析一下韜(τ)定律會給接下來華為麒麟處理器帶來哪些新的改變。
![]()
關(guān)于韜(τ)定律,除了目前公布的一些官方信息之外,最權(quán)威和核心的資料,是華為半導(dǎo)體團(tuán)隊負(fù)責(zé)人何庭波在中國科學(xué)院科技論文預(yù)發(fā)布平臺發(fā)表的一篇名為《A Time Scaling Theory for Multi-Layer Electronic Systems》(多層電子系統(tǒng)的時間縮放理論)的文獻(xiàn)。
華為團(tuán)隊的韜(τ)定律,最核心的觀點就是,將半導(dǎo)體的核心考量指標(biāo)從空間面積變成時間。
背后的邏輯很簡單:普通用戶買手機(jī)、用 AI,并不會在乎里面的晶體管到底是幾納米(空間)。用戶在乎的是:打開軟件快不快?大模型回復(fù)省不省時?這本質(zhì)上追求的是時間概念。
此前半導(dǎo)體行業(yè)拼命把晶體管做小,本質(zhì)上也是為了讓電信號少跑路,從而節(jié)省時間。
既然如此,為什么不把縮短時間作為追求半導(dǎo)體性能的終極目標(biāo)呢?
這就是韜(τ)定律的核心邏輯。在全新的韜(τ)定律下,評價一款芯片性能的強(qiáng)弱將不再單看制程,而是要看整個計算系統(tǒng)內(nèi),完成一次任務(wù)需要耗費的時間(即時間常數(shù)τ)。 在此基礎(chǔ)上,華為半導(dǎo)體團(tuán)隊拿出了最核心的一項技術(shù),就是“邏輯折疊(Logic Folding)”。
![]()
這項技術(shù)的核心原理,昨天我們已經(jīng)在文章中介紹過。簡單說,華為把原本平鋪在二維平面上的數(shù)字邏輯電路、模擬電路和內(nèi)存,通過極為精密的技術(shù)垂直疊在一起。以前兩個晶體管要橫跨大半個芯片才能通信,現(xiàn)在就像“樓上樓下”,坐個電梯就到了。
在文獻(xiàn)中,華為詳細(xì)說明了邏輯折疊技術(shù)帶來的性能和能效紅利。
通過邏輯折疊技術(shù),華為實現(xiàn)了在固定工業(yè)制程節(jié)點下空間利用率的突破。以采用了該項技術(shù)的 Kirin 2026(代號)為例,它的晶體管密度從上一代的 155 MTr/mm2 階躍式提升至 238 MTr/mm2,實現(xiàn)了 55% 的晶體管密度提升。
換句話說,在工藝制程不變的情況下,采用邏輯折疊技術(shù)的麒麟芯片,在同樣的物理尺寸下實現(xiàn)了 55% 的晶體管密度增長。而如果是要依靠傳統(tǒng)的提升工藝制程來實現(xiàn)同等晶體管密度的提升,行業(yè)通常需要耗費 3 年的研發(fā)周期。 新技術(shù)帶來了算力和能效的雙重提升。
![]()
通過縮短信號傳輸距離,減少了電阻電容浪費。華為 Kirin 2026 芯片實現(xiàn)了 13% 的最大時鐘頻率提升。華為在文獻(xiàn)中提到,Kirin 2026 芯片今年最高的核心運行頻率將提升至 3.1 GHz。相比之下,目前華為手機(jī)處理器最強(qiáng)的麒麟9030 Pro最高的核心運行頻率為2.75GHz。
與此同時,其 SoC 性能核心的功耗效率也提升了 41%。此外,通過后硅片時鐘偏斜調(diào)整方案,華為又獨立為 SoC 貢獻(xiàn)了超過 5% 的系統(tǒng)性能增益。
![]()
文獻(xiàn)還披露了這一技術(shù)路線帶來的 Kirin CPU 性能核心最高頻率的演進(jìn)規(guī)劃趨勢:
- 2026 年(Kirin 2026):首次導(dǎo)入邏輯折疊架構(gòu),頻率達(dá)到 3.1 GHz(目前處于 Silicon 硅片階段);
- 2027 年(Kirin 2027):折疊架構(gòu)升級,頻率推升至 3.39 GHz(處于 Silicon 硅片階段);
- 2028 年(Kirin 2028):頻率推升至 3.71 GHz(處于 Pre-silicon 預(yù)硅設(shè)計階段);
- 2029 年(Kirin 2029):頻率將正式觸及 4.0 GHz 門檻。
該文獻(xiàn)還明確指出,麒麟 2026 采用的邏輯折疊方案在工藝上還是相對保守的。隨著未來低溫鍵合等工藝的演進(jìn),技術(shù)將轉(zhuǎn)向完全體的三層、四層乃至更多層的全尺寸邏輯折疊。
在這一技術(shù)和理論的指導(dǎo)下,未來 3~5 年內(nèi)麒麟處理器在用戶典型使用場景下,整體效率預(yù)計將實現(xiàn)一倍以上的增長!這將極大提升未來華為手機(jī)的性能和功耗表現(xiàn)。
還有一個被很多人忽視的細(xì)節(jié)就是,除了邏輯折疊技術(shù)之外,文獻(xiàn)中還有一項非常重要的技術(shù),即:統(tǒng)一總線(Unified Bus)。該技術(shù)主要針對 AI 大模型算力集群和數(shù)據(jù)中心(大規(guī)模多芯片協(xié)同系統(tǒng))。
![]()
在傳統(tǒng)架構(gòu)中,數(shù)據(jù)要在不同芯片之間傳輸,需要經(jīng)過多層物理和軟件協(xié)議的轉(zhuǎn)換。每一層轉(zhuǎn)換都會帶來額外的序列化、DMA 緩沖區(qū)開銷和深層握手,帶來額外的時延和功耗。
Unified Bus (UB) 直接用一種統(tǒng)一協(xié)議,取代了上面整套復(fù)雜的傳統(tǒng)堆棧。這個協(xié)議不僅能在同一個機(jī)箱內(nèi)跑,還能直接跨機(jī)箱在整個數(shù)據(jù)中心網(wǎng)絡(luò)里跑。
通過這一全棧式的重構(gòu),華為披露了 Unified Bus 帶來的性能提升:
端到端的遠(yuǎn)程訪問延遲從傳統(tǒng) TCP/IP 類網(wǎng)絡(luò)軟件棧的幾十微秒(Tens of Microseconds),直接驟降到了大約 100 納秒(~100 ns)。在 AI 集群最核心的通信軸上,實現(xiàn)了高達(dá) ~500 倍的系統(tǒng)時間常數(shù)(τ)壓縮。
另外通過該項技術(shù),分布式機(jī)柜中的千百顆芯片通過 UB 緊密編織在一起,數(shù)據(jù)互連無損且無感知,使整個集群無限逼近一臺統(tǒng)一的、單體的算力中心。
總的來說,華為半導(dǎo)體團(tuán)隊提出的“韜(τ)定律”是國產(chǎn)半導(dǎo)體領(lǐng)域一次非常重大的理論和技術(shù)突破。華為不僅拿出了全新的理論研究體系,還基于這一理論拿出來實實在在的應(yīng)用技術(shù)。尤其是在當(dāng)前摩爾定律紅利放緩,國產(chǎn)半導(dǎo)體存在“卡脖子”的背景下,華為這套理論體系和技術(shù)路線,不僅能夠極大提升國產(chǎn)芯片的整體性能,還為后摩爾定律時代半導(dǎo)體行業(yè)的多元化突圍,提供了一種全新的路徑。這是非常了不起的成就!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.