NVIDIA TensorRT 8.2將推理速度提高6倍

NVIDIA 發(fā)布了 TensorRT 8.2 ，對(duì)十億參數(shù) NLU 模型進(jìn)行了優(yōu)化。其中包括 T5 和 GPT-2 ，用于翻譯和文本生成，使實(shí)時(shí)運(yùn)行 NLU 應(yīng)用程序成為可能。

TensorRT 是一款高性能的深度學(xué)習(xí)推理優(yōu)化器和運(yùn)行時(shí)，為人工智能應(yīng)用程序提供低延遲、高吞吐量推理。 TensorRT 用于醫(yī)療、汽車、制造、互聯(lián)網(wǎng)/電信服務(wù)、金融服務(wù)和能源等多個(gè)行業(yè)。

PyTorch 和 TensorFlow 是擁有數(shù)百萬用戶的最流行的深度學(xué)習(xí)框架。新的 TensorRT 框架集成現(xiàn)在在 PyTorch 和 TensorFlow 中提供了一個(gè)簡(jiǎn)單的 API ，并提供了強(qiáng)大的 FP16 和 INT8 優(yōu)化，從而將推理速度提高了 6 倍。

亮點(diǎn)包括

TensorRT 8.2:T5 和 GPT-2 的優(yōu)化運(yùn)行實(shí)時(shí)翻譯和摘要，與 CPU 相比，性能提高了 21 倍。

TensorRT 8.2 ：適用于使用 Windows 的開發(fā)人員的簡(jiǎn)單 Python API 。

Torch TensorRT:PyTorch 的集成與 GPU 上的框架內(nèi)推理相比，僅需一行代碼即可提供高達(dá) 6 倍的性能。

TensorFlow TensorRT:TensorFlow 與 TensorRT 的集成提供了比使用一行代碼在 GPU 上進(jìn)行框架內(nèi)推理快 6 倍的性能。

資源

Torch- TensorRT 在 NGC catalog 的 PyTorch 容器中提供。

TensorFlow- TensorRT 目前可從 NGC catalog 的 TensorFlow 容器中獲得。

TensorRT 免費(fèi)提供給 NVIDIA 開發(fā)程序的成員。

在 TensorRT 產(chǎn)品頁(yè)面了解更多信息。

關(guān)于作者

About Jay Rodge

Jay Rodge 是 NVIDIA 的產(chǎn)品營(yíng)銷經(jīng)理，負(fù)責(zé)深入學(xué)習(xí)和推理產(chǎn)品，推動(dòng)產(chǎn)品發(fā)布和產(chǎn)品營(yíng)銷計(jì)劃。杰伊在芝加哥伊利諾伊理工學(xué)院獲得計(jì)算機(jī)科學(xué)碩士學(xué)位，主攻計(jì)算機(jī)視覺和自然語言處理。在 NVIDIA 之前，杰伊是寶馬集團(tuán)的人工智能研究實(shí)習(xí)生，為寶馬最大的制造廠使用計(jì)算機(jī)視覺解決問題。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5696

瀏覽量
110142
互聯(lián)網(wǎng)

互聯(lián)網(wǎng)

+關(guān)注

關(guān)注
55

文章
11350

瀏覽量
110492
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5610

瀏覽量
124656

評(píng)論

星星科技指導(dǎo)員
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁(yè)

Hot 使用microchip參考設(shè)計(jì)開發(fā)您的下一個(gè)基于USB-C PD的充電器
Hot 所有IC中半導(dǎo)體噪聲的特性如何估算基準(zhǔn)電壓源的噪聲

New 微電網(wǎng)系統(tǒng)控制方法和原理
New 飛輪儲(chǔ)能系統(tǒng)的核心及優(yōu)勢(shì)分析

精選推薦
更多

文章

資料

帖子

晶振頻率漂移的主要成因與機(jī)理分析的詳解

愛在七夕時(shí)
1天前

3429 閱讀

嵌入式2---在單片機(jī)里實(shí)現(xiàn)module_init機(jī)制

jf_49463572
1天前

3353 閱讀

「智匯邊緣·雙核競(jìng)放」AIoT大賽報(bào)名開啟，獎(jiǎng)金+算力卡等你拿

RT-Thread官方賬號(hào)
5天前

8836 閱讀

瑞薩RA系列FSP庫(kù)開發(fā)實(shí)戰(zhàn)指南之AGT低功耗定時(shí)器簡(jiǎn)介和結(jié)構(gòu)框圖

瑞薩嵌入式小百科
5天前

4448 閱讀

押注機(jī)器人賽道！IQ10算力狂飆，高通攜手阿加犀加速機(jī)器人大小腦方案落地

章鷹觀察
5天前

1.2w 閱讀

華為無線通信培訓(xùn)教程

本劇主演
3.13 MB

免費(fèi)

0下載

一文讀懂無線充電產(chǎn)業(yè)鏈

半導(dǎo)體動(dòng)態(tài)
0.72 MB

10積分

46下載

PLOGS項(xiàng)目任務(wù)日志管理系統(tǒng)

欲望都市
8.72 MB

免費(fèi)

0下載

Stetho Realm用于Stetho的Realm模塊

發(fā)燒友推溫針
0.08 MB

2積分

1下載

DKAsyncImageView iOS異步加載

楊杰
0.02 MB

免費(fèi)

0下載

【瑞薩RA2L1入門學(xué)習(xí)】+ RA-Eco-RA2L1-V2.0開發(fā)板概覽、環(huán)境搭建與TTL串口燒錄點(diǎn)燈

jf_84491108
3天前

198 閱讀

【瑞薩RA2L1入門學(xué)習(xí)】+ touch控制OLED

安安踢球球
1天前

204 閱讀

【瑞薩RA2L1入門學(xué)習(xí)】+ 電子秤計(jì)量

jennyzhaojie
4天前

208 閱讀

【瑞薩RA2L1入門學(xué)習(xí)】+ LCD1602液晶屏顯示驅(qū)動(dòng)

jinglixixi
4天前

277 閱讀

【RA-Eco-RA4M2開發(fā)板評(píng)測(cè)】在觸摸按鍵例程上添加0.96寸OLED驅(qū)動(dòng)并顯示漢字

吉吉祥
6天前

1924 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

搜索歷史

NVIDIA TensorRT 8.2將推理速度提高6倍

評(píng)論