日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用NVIDIA RTXMU改進(jìn)游戲顯存分配

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:Ethan Einhorn ? 2022-04-22 10:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

實(shí)時(shí)光線追蹤提升了電子游戲中的光照藝術(shù)效果,但該過(guò)程需要消耗大量算力。為了減少消耗,NVIDIA 開(kāi)發(fā)了一款顯存實(shí)用程序,它將規(guī)整和二次分配技術(shù)相結(jié)合,可優(yōu)化和減少加速結(jié)構(gòu)的顯存消耗。我們已將此解決方案變?yōu)槊?RTXMU 的 SDK,并在今天將其作為開(kāi)源版本提供。它專(zhuān)為支持各種 DXR 或 Vulkan 光線追蹤應(yīng)用程序而構(gòu)建。

通過(guò)利用 RTXMU 規(guī)整加速結(jié)構(gòu),可消除初始構(gòu)建操作中浪費(fèi)的顯存。對(duì)于使用 RTXMU 的應(yīng)用程序,NVIDIA RTX 顯卡的顯存占用量減少了大約 50%。此外,利用 RTXMU 二次分配加速結(jié)構(gòu)緩沖區(qū)可防止出現(xiàn)碎片和浪費(fèi)的空間。包含數(shù)千個(gè)不同的小 BLAS 的場(chǎng)景將從二次分配中受益匪淺。

RTXMU 如何立即提供幫助?

RTXMU 易于集成,可立即帶來(lái)好處。

二次分配和規(guī)整顯存管理器需要花費(fèi)大量工程時(shí)間進(jìn)行驗(yàn)證。RTXMU 可縮短開(kāi)發(fā)者將規(guī)整和二次分配技術(shù)集成到 RTX 游戲中所需的時(shí)間。

RTXMU 還會(huì)抽象化 BLAS 的顯存和規(guī)整狀態(tài)管理,并管理規(guī)整尺寸回讀和規(guī)整副本所需的所有屏障。

更深入地說(shuō),RTXMU 使用 BLAS 數(shù)據(jù)結(jié)構(gòu)的句柄間接層來(lái)防止錯(cuò)誤管理 CPU 內(nèi)存(包括訪問(wèn)已取消分配或不存在的 BLAS)。此外,二次分配通過(guò)將更多 BLAS 裝入 64 KB 或 4 MB 頁(yè)面中,帶來(lái)了提高 TLB(頁(yè)表緩存)命中率的好處。

簡(jiǎn)而言之,RTXMU 讓開(kāi)發(fā)者毫不費(fèi)力地就能讓實(shí)時(shí)光線追蹤游戲和應(yīng)用程序更快速地運(yùn)行。

關(guān)于作者

Ethan Einhorn 是一位有21年游戲行業(yè)經(jīng)驗(yàn)的資深人士,曾擔(dān)任編輯、營(yíng)銷(xiāo)、制作和創(chuàng)意指導(dǎo)等職位。目前,他是 NVIDIA 的高級(jí)產(chǎn)品營(yíng)銷(xiāo)經(jīng)理。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5708

    瀏覽量

    110164
  • 應(yīng)用程序
    +關(guān)注

    關(guān)注

    38

    文章

    3346

    瀏覽量

    60455
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AWQ/GPTQ量化模型加載與顯存優(yōu)化實(shí)戰(zhàn)

    大語(yǔ)言模型(LLM)推理顯存需求呈指數(shù)級(jí)增長(zhǎng),70B參數(shù)的模型需要約140GB顯存(FP16),遠(yuǎn)超單卡GPU容量。量化技術(shù)通過(guò)降低模型參數(shù)精度(從FP16到INT4),在精度損失最小的情況下減少50-75%顯存占用,使得大模型
    的頭像 發(fā)表于 03-13 09:45 ?802次閱讀

    超擎數(shù)智為您深度解析NVIDIA Quantum-X800 InfiniBand平臺(tái)

    NVIDIA
    專(zhuān)精特新
    發(fā)布于 :2026年01月08日 19:47:03

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升級(jí)迭代產(chǎn)品,其各項(xiàng)核心指標(biāo)均針對(duì) GPU 加速工作流的高性能
    的頭像 發(fā)表于 01-06 09:51 ?4508次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)

    顯存讀寫(xiě)沖突造成花屏解決方案

    方案1、分配兩個(gè)獨(dú)立顯存區(qū)——A和B,顯示A區(qū)時(shí)寫(xiě)B(tài)區(qū)準(zhǔn)備,完成B區(qū)準(zhǔn)備后,設(shè)定控制器顯示B區(qū),交替循環(huán)更新 方案2、客戶(hù)MCU 的TFT控制器資源是否有類(lèi)似的 “TE”信號(hào)可以監(jiān)測(cè),根據(jù)“TE
    發(fā)表于 12-29 09:07

    NVIDIA CUDA 13.1版本的新增功能與改進(jìn)

    NVIDIA CUDA 13.1 是自 CUDA 二十年前發(fā)明以來(lái),規(guī)模最大、內(nèi)容最全面的一次更新。
    的頭像 發(fā)表于 12-13 10:08 ?2510次閱讀

    利用NVIDIA Cosmos開(kāi)放世界基礎(chǔ)模型加速物理AI開(kāi)發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開(kāi)放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測(cè)試與驗(yàn)證數(shù)據(jù)生成。借助 NVIDIA Omniverse 庫(kù)和 Cosmos,開(kāi)發(fā)者可以大規(guī)模生成基于物理學(xué)的合
    的頭像 發(fā)表于 12-01 09:25 ?1522次閱讀

    借助NVIDIA Megatron-Core大模型訓(xùn)練框架提高顯存使用效率

    隨著模型規(guī)模邁入百億、千億甚至萬(wàn)億參數(shù)級(jí)別,如何在有限顯存中“塞下”訓(xùn)練任務(wù),對(duì)研發(fā)和運(yùn)維團(tuán)隊(duì)都是巨大挑戰(zhàn)。NVIDIA Megatron-Core 作為流行的大模型訓(xùn)練框架,提供了靈活高效的并行化
    的頭像 發(fā)表于 10-21 10:55 ?1454次閱讀
    借助<b class='flag-5'>NVIDIA</b> Megatron-Core大模型訓(xùn)練框架提高<b class='flag-5'>顯存</b>使用效率

    超過(guò)175款游戲和應(yīng)用現(xiàn)已支持NVIDIA DLSS 4

    超過(guò) 175 款游戲和應(yīng)用現(xiàn)已支持 DLSS 4,包括《生化危機(jī):安魂曲》(Resident Evil Requiem)、《影之刃零》(Phantom Blade Zero)等支持光線追蹤的大作,升級(jí)的 NVIDIA RTX Remix、Project G-Assist
    的頭像 發(fā)表于 08-20 14:26 ?1598次閱讀

    NVIDIA Jetson AGX Thor開(kāi)發(fā)者套件概述

    NVIDIA Jetson AGX Thor 開(kāi)發(fā)者套件為您提供出色的性能和可擴(kuò)展性。它由 NVIDIA Blackwell GPU和128 GB 顯存提供動(dòng)力支持,提供高達(dá) 2070 FP4
    的頭像 發(fā)表于 08-11 15:03 ?2118次閱讀

    大模型推理顯存和計(jì)算量估計(jì)方法研究

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)大模型在各個(gè)領(lǐng)域得到了廣泛應(yīng)用。然而,大模型的推理過(guò)程對(duì)顯存和計(jì)算資源的需求較高,給實(shí)際應(yīng)用帶來(lái)了挑戰(zhàn)。為了解決這一問(wèn)題,本文將探討大模型推理顯存和計(jì)算量的估計(jì)
    發(fā)表于 07-03 19:43

    超150款游戲現(xiàn)已支持NVIDIA Reflex

    NVIDIA Reflex 是一項(xiàng)顛覆性技術(shù),可降低 GeForce 顯卡、臺(tái)式電腦和筆記本電腦的 PC 延遲,讓玩家更迅速地作出反應(yīng),使其在多人游戲中更具競(jìng)爭(zhēng)力,并且該技術(shù)能夠讓單人游戲擁有更快的響應(yīng)速度、更加爽快的體驗(yàn)。
    的頭像 發(fā)表于 06-26 09:29 ?1366次閱讀

    全球各大品牌利用NVIDIA AI技術(shù)提升運(yùn)營(yíng)效率

    歐萊雅、LVMH 集團(tuán)和雀巢利用 NVIDIA 加速的智能體 AI 和物理 AI,大幅提升產(chǎn)品設(shè)計(jì)、營(yíng)銷(xiāo)及物流等方面的運(yùn)營(yíng)效率。
    的頭像 發(fā)表于 06-19 14:36 ?1395次閱讀

    借助NVIDIA技術(shù)加速半導(dǎo)體芯片制造

    NVIDIA Blackwell GPU、NVIDIA Grace CPU、高速 NVIDIA NVLink 網(wǎng)絡(luò)架構(gòu)和交換機(jī),以及諸如 NVIDIA cuDSS 和
    的頭像 發(fā)表于 05-27 13:59 ?1314次閱讀

    利用NVIDIA技術(shù)構(gòu)建從數(shù)據(jù)中心到邊緣的智慧醫(yī)院解決方案

    全球領(lǐng)先的電子制造商正在利用 NVIDIA 技術(shù),構(gòu)建從數(shù)據(jù)中心到邊緣的智慧醫(yī)院解決方案。
    的頭像 發(fā)表于 05-22 09:50 ?1215次閱讀

    云電競(jìng)服務(wù)器 工作原理

    實(shí)例,實(shí)現(xiàn)硬件資源的按需分配與隔離運(yùn)行。 資源池化?:CPU、GPU、內(nèi)存等硬件資源整合為統(tǒng)一資源池,支持多租戶(hù)并行使用 彈性調(diào)度?:根據(jù)游戲負(fù)載自動(dòng)調(diào)整資源配比(如《賽博朋克2077》運(yùn)行時(shí)自動(dòng)分配更高GPU
    的頭像 發(fā)表于 05-14 07:44 ?816次閱讀
    云電競(jìng)服務(wù)器 工作原理
    白水县| 共和县| 安丘市| 色达县| 黄浦区| 武清区| 周至县| 从江县| 武山县| 石台县| 玛多县| 武穴市| 石渠县| 清新县| 顺平县| 孟州市| 出国| 鄂伦春自治旗| 梁河县| 福清市| 宁津县| 华容县| 华亭县| 江阴市| 滨州市| 永川市| 依安县| 桂平市| 宝兴县| 阳新县| 兴宁市| 抚远县| 都江堰市| 吕梁市| 衡东县| 龙门县| 安达市| 广南县| 咸宁市| 柏乡县| 芦溪县|