英偉達(dá)GTC25亮點(diǎn)：NVIDIA Dynamo開源庫(kù)加速并擴(kuò)展AI推理模型

NVIDIA Dynamo 提高了推理性能，同時(shí)降低了擴(kuò)展測(cè)試時(shí)計(jì)算 (Scaling Test-Time Compute) 的成本；在 NVIDIA Blackwell 上的推理優(yōu)化將 DeepSeek-R1 上的吞吐量提高了 30 倍

NVIDIA 發(fā)布了開源推理軟件 NVIDIA Dynamo，旨在以高效率、低成本加速并擴(kuò)展 AI 工廠中的 AI 推理模型。

作為 NVIDIA Triton 推理服務(wù)器的后續(xù)產(chǎn)品，NVIDIA Dynamo 是一款全新的 AI 推理服務(wù)軟件，旨在為部署推理 AI 模型的 AI 工廠最大化其 token 收益。它協(xié)調(diào)并加速數(shù)千個(gè) GPU 之間的推理通信，并使用分離服務(wù)將大語(yǔ)言模型 (LLM) 的處理階段和生成階段在不同 GPU 上分離開來(lái)。這使得每個(gè)階段的特定需求可以進(jìn)行單獨(dú)優(yōu)化，并確保更大程度地利用 GPU 資源。

NVIDIA Dynamo 完全開源并支持 PyTorch、SGLang、NVIDIA TensorRT-LLM 和 vLLM，使企業(yè)、初創(chuàng)公司和研究人員能夠開發(fā)和優(yōu)化在分離推理時(shí)部署 AI 模型的方法。

“全世界各行業(yè)都在訓(xùn)練 AI 模型以不同的方式進(jìn)行思考和學(xué)習(xí)，從而使模型復(fù)雜度持續(xù)升級(jí)?！?NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示，“為了實(shí)現(xiàn)自定義推理 AI 的未來(lái)，NVIDIA Dynamo 可以在這些模型上進(jìn)行規(guī)?；渴?，從而為 AI 工廠實(shí)現(xiàn)降本增效”。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5696

瀏覽量
110139
AI

AI

+關(guān)注

關(guān)注
91

文章
41315

瀏覽量
302690

原文標(biāo)題：GTC25 | NVIDIA Dynamo 開源庫(kù)加速并擴(kuò)展 AI 推理模型

文章出處：【微信號(hào)：NVIDIA_China，微信公眾號(hào)：NVIDIA英偉達(dá)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

NVIDIA英偉達(dá)
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁(yè)

Hot VR、AR與MR的發(fā)展歷史以及商業(yè)應(yīng)用實(shí)例
Hot NVIDIA RTX與GTX的區(qū)別是什么？

New 能夠降低每Token成本的因素有哪些
New NVIDIA重點(diǎn)展示推動(dòng)AI走向物理世界的關(guān)鍵突破

精選推薦
更多

文章

資料

帖子

「智匯邊緣·雙核競(jìng)放」AIoT大賽報(bào)名開啟，獎(jiǎng)金+算力卡等你拿

RT-Thread官方賬號(hào)
3天前

6861 閱讀

瑞薩RA系列FSP庫(kù)開發(fā)實(shí)戰(zhàn)指南之AGT低功耗定時(shí)器簡(jiǎn)介和結(jié)構(gòu)框圖

瑞薩嵌入式小百科
3天前

3423 閱讀

押注機(jī)器人賽道！IQ10算力狂飆，高通攜手阿加犀加速機(jī)器人大小腦方案落地

章鷹觀察
4天前

1w 閱讀

霸州x華為：立一個(gè)存力支點(diǎn)，撬動(dòng)華北平原的數(shù)據(jù)富礦

腦極體
4天前

7525 閱讀

實(shí)戰(zhàn) | 睿擎平臺(tái)SQLite：嵌入式設(shè)備上的數(shù)據(jù)持久化方案，從移植到應(yīng)用一文打通

RT-Thread官方賬號(hào)
4天前

4283 閱讀

Altera公司SoC FPGA 簡(jiǎn)介

Kelly Yang
2.33 MB

免費(fèi)

153下載

精品推薦!Intel伽利略開發(fā)板官方原理圖及pcb文件

段雷
3231KB

6積分

0下載

zychat iOS碼農(nóng)聊天室

鄒倆珍
16.26 MB

免費(fèi)

0下載

pg_lightool PostgresSQL數(shù)據(jù)壞塊修復(fù)工具

劉超
0.05 MB

2積分

1下載

EarlGrey iOS UI測(cè)試自動(dòng)化框架

李鳳津
3.52 MB

免費(fèi)

0下載

【RA-Eco-RA4M2開發(fā)板評(píng)測(cè)】在觸摸按鍵例程上添加0.96寸OLED驅(qū)動(dòng)并顯示漢字

吉吉祥
5天前

1480 閱讀

【RA-Eco-RA4M2開發(fā)板評(píng)測(cè)】+ 光照強(qiáng)度檢測(cè)

jinglixixi
12天前

3477 閱讀

【RA-Eco-RA4M2開發(fā)板評(píng)測(cè)】+ 導(dǎo)航鍵模塊及其性能測(cè)試

jinglixixi
14天前

3675 閱讀

《電子發(fā)燒友電子設(shè)計(jì)周報(bào)》聚焦硬科技領(lǐng)域核心價(jià)值 26年第7期：2026.3.30--2025.4.15

電子人steve
17天前

4485 閱讀

從零開始學(xué)硬件 <3>demo源碼1.OceanOS-CM0-B1解讀

jf_28912132
19天前

5488 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

搜索歷史

英偉達(dá)GTC25亮點(diǎn)：NVIDIA Dynamo開源庫(kù)加速并擴(kuò)展AI推理模型

評(píng)論