實(shí)時(shí)光線追蹤提升了電子游戲中的光照藝術(shù)效果,但該過(guò)程需要消耗大量算力。為了減少消耗,NVIDIA 開(kāi)發(fā)了一款顯存實(shí)用程序,它將規(guī)整和二次分配技術(shù)相結(jié)合,可優(yōu)化和減少加速結(jié)構(gòu)的顯存消耗。我們已將此解決方案變?yōu)槊?RTXMU 的 SDK,并在今天將其作為開(kāi)源版本提供。它專(zhuān)為支持各種 DXR 或 Vulkan 光線追蹤應(yīng)用程序而構(gòu)建。
通過(guò)利用 RTXMU 規(guī)整加速結(jié)構(gòu),可消除初始構(gòu)建操作中浪費(fèi)的顯存。對(duì)于使用 RTXMU 的應(yīng)用程序,NVIDIA RTX 顯卡的顯存占用量減少了大約 50%。此外,利用 RTXMU 二次分配加速結(jié)構(gòu)緩沖區(qū)可防止出現(xiàn)碎片和浪費(fèi)的空間。包含數(shù)千個(gè)不同的小 BLAS 的場(chǎng)景將從二次分配中受益匪淺。
RTXMU 如何立即提供幫助?
RTXMU 易于集成,可立即帶來(lái)好處。
二次分配和規(guī)整顯存管理器需要花費(fèi)大量工程時(shí)間進(jìn)行驗(yàn)證。RTXMU 可縮短開(kāi)發(fā)者將規(guī)整和二次分配技術(shù)集成到 RTX 游戲中所需的時(shí)間。
RTXMU 還會(huì)抽象化 BLAS 的顯存和規(guī)整狀態(tài)管理,并管理規(guī)整尺寸回讀和規(guī)整副本所需的所有屏障。
更深入地說(shuō),RTXMU 使用 BLAS 數(shù)據(jù)結(jié)構(gòu)的句柄間接層來(lái)防止錯(cuò)誤管理 CPU 內(nèi)存(包括訪問(wèn)已取消分配或不存在的 BLAS)。此外,二次分配通過(guò)將更多 BLAS 裝入 64 KB 或 4 MB 頁(yè)面中,帶來(lái)了提高 TLB(頁(yè)表緩存)命中率的好處。
簡(jiǎn)而言之,RTXMU 讓開(kāi)發(fā)者毫不費(fèi)力地就能讓實(shí)時(shí)光線追蹤游戲和應(yīng)用程序更快速地運(yùn)行。
關(guān)于作者
Ethan Einhorn 是一位有21年游戲行業(yè)經(jīng)驗(yàn)的資深人士,曾擔(dān)任編輯、營(yíng)銷(xiāo)、制作和創(chuàng)意指導(dǎo)等職位。目前,他是 NVIDIA 的高級(jí)產(chǎn)品營(yíng)銷(xiāo)經(jīng)理。
審核編輯:郭婷
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5708瀏覽量
110164 -
應(yīng)用程序
+關(guān)注
關(guān)注
38文章
3346瀏覽量
60455
發(fā)布評(píng)論請(qǐng)先 登錄
AWQ/GPTQ量化模型加載與顯存優(yōu)化實(shí)戰(zhàn)
超擎數(shù)智為您深度解析NVIDIA Quantum-X800 InfiniBand平臺(tái)
NVIDIA RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)
顯存讀寫(xiě)沖突造成花屏解決方案
NVIDIA CUDA 13.1版本的新增功能與改進(jìn)
利用NVIDIA Cosmos開(kāi)放世界基礎(chǔ)模型加速物理AI開(kāi)發(fā)
借助NVIDIA Megatron-Core大模型訓(xùn)練框架提高顯存使用效率
超過(guò)175款游戲和應(yīng)用現(xiàn)已支持NVIDIA DLSS 4
NVIDIA Jetson AGX Thor開(kāi)發(fā)者套件概述
大模型推理顯存和計(jì)算量估計(jì)方法研究
超150款游戲現(xiàn)已支持NVIDIA Reflex
全球各大品牌利用NVIDIA AI技術(shù)提升運(yùn)營(yíng)效率
借助NVIDIA技術(shù)加速半導(dǎo)體芯片制造
利用NVIDIA技術(shù)構(gòu)建從數(shù)據(jù)中心到邊緣的智慧醫(yī)院解決方案
云電競(jìng)服務(wù)器 工作原理
利用NVIDIA RTXMU改進(jìn)游戲顯存分配
評(píng)論