游戲體積膨脹的速度,比硬盤降價的速度快多了。一個《使命召喚》動輒200GB,SSD再大也扛不住。AMD這次拿出的新方案,瞄準(zhǔn)的正是這個痛點。
5月7日,AMD更新了DGF SDK 1.2版本,正式推出DGFS(DGF SuperCompression)技術(shù)。名字里的DGF是Dense Geometry Format的縮寫,意為"稠密幾何格式"——一種面向硬件的高效幾何壓縮格式。它的核心設(shè)計很極致:每個三角形的信息,必須能通過一次128字節(jié)對齊的內(nèi)存讀取完成訪問。這種設(shè)計讓GPU讀取效率極高,但也帶來副作用——作為存儲格式時,頂點位置和壓縮參數(shù)需要在多個塊之間重復(fù)存儲,還要插入填充位來對齊數(shù)據(jù),空間利用率不高。
![]()
DGFS就是來解決這個問題的。它作為軟件層面的二次壓縮系統(tǒng),對DGF數(shù)據(jù)再壓縮一輪。編碼后的數(shù)據(jù)無法被硬件直接識別,但能精確重建原始DGF塊,也可以高效解碼為傳統(tǒng)的頂點和索引緩沖區(qū),在非DGF硬件上正常運(yùn)行。
實際收益有兩層。第一層是體積:相比直接存DGF塊,DGFS最高再壓縮22%。AMD測試數(shù)據(jù)顯示,原始存儲占用方面DGFS比DGF小約30%;若疊加GDeflate壓縮,優(yōu)勢收窄到20%左右。第二層是兼容性——同一套資源包,既能服務(wù)支持DGF的新硬件,也能向下兼容老設(shè)備,開發(fā)者不用維護(hù)兩套資產(chǎn)。
技術(shù)實現(xiàn)上,DGFS采用集群粒度壓縮。每個三角形簇(Meshlet)獨(dú)立編解碼,這與現(xiàn)代渲染引擎以小規(guī)模自包含簇為單位的架構(gòu)趨勢一致。編碼器先解碼塊頂點,構(gòu)建統(tǒng)一的編碼空間(錨點、指數(shù)、偏移量),將所有頂點轉(zhuǎn)換至該空間后消除重復(fù)。唯一頂點位置轉(zhuǎn)為差值,經(jīng)Zig-Zag編碼后以字節(jié)交錯的結(jié)構(gòu)化數(shù)組存儲。AMD解釋,這種布局有助于后續(xù)疊加通用壓縮算法時獲得更高壓縮率。
頂點在壓縮流中的排列也有講究:唯一頂點按首次出現(xiàn)順序從數(shù)組前端索引,重復(fù)頂點放末尾從后端索引。每個塊配一張頂點表,用一位標(biāo)識"唯一"或"共享"。唯一頂點索引用遞增計數(shù)器計算,共享頂點索直接存儲——從后端索引的設(shè)計,讓存儲的索引值更小。
解碼性能是另一個亮點。AMD強(qiáng)調(diào),單CPU核心即可在極短時間內(nèi)完成大規(guī)模模型解碼,CPU流式解碼速度足夠快。GPU解碼器同樣可行,向量化版本表現(xiàn)良好。這意味著游戲加載時,解壓縮不會成為瓶頸——DGFS數(shù)據(jù)不會常駐內(nèi)存,壓縮后的磁盤大小才是關(guān)鍵指標(biāo)。
有個細(xì)節(jié)值得注意。有觀點將DGF視為對集群級加速結(jié)構(gòu)(CLAS)的回應(yīng),AMD專門澄清這是誤解:兩者并非替代關(guān)系,而是正交互補(bǔ)。DGF解決幾何數(shù)據(jù)在存儲和傳輸中的效率問題,CLAS則聚焦于加速結(jié)構(gòu)構(gòu)建——技術(shù)路線不同,目標(biāo)場景也不同。
對普通玩家來說,這項技術(shù)意味著未來游戲安裝包可能明顯縮水。對開發(fā)者而言,統(tǒng)一資源格式減少了多平臺適配的工作量。而AMD的野心顯然不止于此——從RDNA架構(gòu)的硬件特性到軟件層面的編碼工具,它正在構(gòu)建一套完整的幾何數(shù)據(jù)管線。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.