NVIDIA GPU曾于去年12月和今年7月兩度樹立了數(shù)據(jù)中心神經(jīng)網(wǎng)絡(luò)訓(xùn)練的性能標(biāo)桿。今天發(fā)布的行業(yè)基準(zhǔn)測(cè)試結(jié)果顯示,NVIDIA也引領(lǐng)著數(shù)據(jù)中心內(nèi)部與外部AI網(wǎng)絡(luò)的趨勢(shì)。
NVIDIA Turing GPU和Xavier芯片系統(tǒng)在首個(gè)獨(dú)立AI推理基準(zhǔn)測(cè)試 ——MLPerf Inference 0.5中取得第一名。由于推理一直是AI市場(chǎng)中最大、同時(shí)也是最具競(jìng)爭(zhēng)力的領(lǐng)域,業(yè)內(nèi)此前一直希望能夠有一套客觀的推理性能測(cè)試指標(biāo)。
在參與此次測(cè)試的十二家公司中,只有NVIDIA AI平臺(tái)提交了MLPerf的全部五項(xiàng)推理測(cè)試成績(jī)(MLPerf是一個(gè)于2018年5月成立的行業(yè)基準(zhǔn)測(cè)試小組)。這證明了NVIDIA CUDA-X AI和TensorRT軟件的成熟程度。它們讓用戶能夠更加輕松地將所有的NVIDIA GPU應(yīng)用于數(shù)據(jù)中心、邊緣等領(lǐng)域。
MLPerf定義了五項(xiàng)推理基準(zhǔn),涵蓋了三個(gè)現(xiàn)有的人工智能應(yīng)用:圖像分類、目標(biāo)檢測(cè)和翻譯。每項(xiàng)基準(zhǔn)分為四個(gè)場(chǎng)景:與數(shù)據(jù)中心應(yīng)用關(guān)聯(lián)性最高的服務(wù)器和離線場(chǎng)景,以及用于滿足邊緣設(shè)備地芯片系統(tǒng)需求的單流和多流場(chǎng)景。
圖1:NVIDIA在兩個(gè)數(shù)據(jù)中心場(chǎng)景(離線和服務(wù)器)的全部五項(xiàng)基準(zhǔn)測(cè)試中均排在第一位,Turing GPU被評(píng)為市面上單處理器性能最高的GPU。
圖2:NVIDIA Turing在MLPerf數(shù)據(jù)中心場(chǎng)景中的成績(jī)超過(guò)了其他市面上的處理器。
離線場(chǎng)景中具有代表性的場(chǎng)景有圖像標(biāo)記等,該場(chǎng)景下所有數(shù)據(jù)可在本地使用;而服務(wù)器場(chǎng)景代表性場(chǎng)景有在線翻譯服務(wù)等,此場(chǎng)景下會(huì)突然或間歇性隨機(jī)出現(xiàn)數(shù)據(jù)和請(qǐng)求工作。
Xavier在兩個(gè)邊緣場(chǎng)景(單流和多流)中被評(píng)為市面上性能最佳的邊緣和移動(dòng)芯片系統(tǒng)。
工業(yè)檢測(cè)相機(jī)主要被用來(lái)在快速移動(dòng)的生產(chǎn)線上發(fā)現(xiàn)不合格品,這是一種典型的單流任務(wù)。多流場(chǎng)景則是測(cè)試芯片能夠處理多少個(gè)數(shù)據(jù)源 —— 該性能對(duì)于一輛可能需要使用6臺(tái)以上攝像機(jī)的自動(dòng)駕駛汽車而言,是一項(xiàng)關(guān)鍵的能力。
圖3:NVIDIA Xavier在MLPerf邊緣場(chǎng)景中成為市面上最佳的邊緣和移動(dòng)芯片系統(tǒng)。
該結(jié)果顯示了NVIDIA CUDA和TensorRT軟件的性能。它們?yōu)橛脩籼峁┝艘粋€(gè)通用平臺(tái),使用戶可以在多個(gè)產(chǎn)品和應(yīng)用中取得領(lǐng)先結(jié)果,而這正是NVIDIA所獨(dú)有的能力。
在數(shù)據(jù)中心場(chǎng)景中,NVIDIA的兩款GPU還出現(xiàn)了相互競(jìng)爭(zhēng)的場(chǎng)面。NVIDIA TITAN RTX展示了Turing級(jí) GPU的巨大潛力,尤其是在各種要求苛刻的任務(wù)中,比如運(yùn)行用于語(yǔ)言翻譯的GNMT模型等。
功能豐富、應(yīng)用廣泛的NVIDIA T4 Tensor Core GPU在多個(gè)場(chǎng)景取得了優(yōu)秀的成績(jī)。這個(gè)功耗僅為70瓦的GPU能夠輕松安裝到任何帶有PCIe槽的服務(wù)器中,使用戶能夠根據(jù)需要擴(kuò)展其計(jì)算力,進(jìn)而大幅擴(kuò)展其推理工作。
MLPerf已經(jīng)獲得行業(yè)和學(xué)術(shù)界的廣泛支持。其成員包括Arm、Facebook、Futurewei、通用汽車、Google、哈佛大學(xué)、Intel、MediaTek、微軟、NVIDIA及Xilinx。值得一提的是,相比于之前的兩次訓(xùn)練比賽,此次基準(zhǔn)測(cè)試吸引了更多的參與者。
NVIDIA此次共采用了三款產(chǎn)品,共計(jì)四種配置參加此次測(cè)試,并提交了全部20個(gè)場(chǎng)景中的19個(gè)場(chǎng)景的成績(jī),以此表明公司對(duì)這項(xiàng)工作的支持。NVIDIA的合作伙伴Dell EMC,以及NVIDIA的客戶阿里巴巴同樣使用NVIDIA GPU提交了成績(jī)。相比于其他參與者,NVIDIA與合作伙伴和客戶一同向用戶全面地展示了NVIDIA產(chǎn)品組合的潛力。
全新的視角與產(chǎn)品
推理指的是在實(shí)時(shí)生產(chǎn)系統(tǒng)中,通過(guò)運(yùn)行AI模型,從大量數(shù)據(jù)中篩選出可執(zhí)行洞察的過(guò)程。這是一項(xiàng)仍處于發(fā)展中的新興技術(shù),而NVIDIA也在該領(lǐng)域中不斷前進(jìn),未曾停止腳步。今天,NVIDIA發(fā)布了用于MLPerf測(cè)試的Xavier芯片系統(tǒng)低功耗版本——Jetson Xavier NX,其最大功率僅為15瓦,卻具有最高21 TOPS的性能。它將為那些對(duì)性能要求高、但功率有限的新一代機(jī)器人、無(wú)人機(jī)和其他自主設(shè)備提供驅(qū)動(dòng)力。
除了新的硬件之外,NVIDIA還發(fā)布了在MLPerf基準(zhǔn)測(cè)試中所使用的最新TensorRT 6優(yōu)化,并在GitHub上以開源方式為用戶提供該軟件。用戶可以在MLPerf 開發(fā)者博客中了解更多關(guān)于這些優(yōu)化的信息。NVIDIA不斷地對(duì)該軟件進(jìn)行升級(jí),使用戶可以從日益增加的AI自動(dòng)化與性能中獲益。
讓推理變得更簡(jiǎn)單
今天的MLPerf測(cè)試還說(shuō)明了一個(gè)結(jié)論,那就是推理很困難。例如,在實(shí)際工作負(fù)載中,由于推理還需要大量預(yù)處理和后處理步驟,那么在實(shí)際工作負(fù)載中其對(duì)推理性能的需求甚至比基準(zhǔn)測(cè)試更高。NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛在去年GTC大會(huì)的主題演講中就曾將這種復(fù)雜性概括為一個(gè)詞:PLASTER。他表示,現(xiàn)代AI推理對(duì)可編程性(Programmability)、延遲性(Latency)、準(zhǔn)確性(Accuracy)、模型大小(Accuracy)、吞吐量(Throughput)、能效(Energy efficiency)和學(xué)習(xí)率(Rate of Learning)的要求很高。
這就是為何用戶越來(lái)越喜歡使用高性能的NVIDIA GPU和軟件來(lái)處理各種要求苛刻的推理工作,其中就包括:BMW、Capital One、思科、Expedia、John Deere、微軟、PayPal、Pinterest、寶潔、Postmates、Shazam、Snap、Shopify、Twitter、Verizon和沃爾瑪?shù)葮O具遠(yuǎn)見的公司。
本周,全球最大的郵政服務(wù)系統(tǒng)——美國(guó)郵政,也加入了此行列,使用NVIDIA GPU進(jìn)行AI訓(xùn)練和推理。
硬盤制造商希捷希望通過(guò)在NVIDIA GPU上運(yùn)行的AI推理將生產(chǎn)量提高10%。該公司預(yù)計(jì),通過(guò)提高效率和質(zhì)量,其將獲得高達(dá)300%的投資回報(bào)。
Pinterest依靠NVIDIA GPU訓(xùn)練和評(píng)估其識(shí)別模型并對(duì)其1750億條Pin貼文執(zhí)行實(shí)時(shí)推理。
Snap使用NVIDIA T4加速器在谷歌云平臺(tái)上執(zhí)行推理。相比于僅采用了CPU的系統(tǒng),這提高了其廣告的效果,同時(shí)降低了成本。
Twitter發(fā)言人就這一趨勢(shì)表示:“GPU的使用不僅大大縮短了訓(xùn)練時(shí)間,還讓我們?cè)谕评頃r(shí)能夠?qū)崟r(shí)了解直播視頻,讓我們可以在自己的平臺(tái)上了解各媒體?!?
AI會(huì)話:關(guān)于推理
未來(lái),會(huì)話式AI將帶來(lái)大量的機(jī)會(huì)以及技術(shù)方面的挑戰(zhàn)。NVIDIA在這一領(lǐng)域同樣是當(dāng)之無(wú)愧的領(lǐng)導(dǎo)者。NVIDIA已經(jīng)為會(huì)話式AI服務(wù)提供了經(jīng)過(guò)優(yōu)化的參照設(shè)計(jì),比如自動(dòng)語(yǔ)音識(shí)別、文本-語(yǔ)言轉(zhuǎn)換和自然語(yǔ)言理解等。NVIDIA們的BERT、GNMT和Jasper等AI模型開源優(yōu)化幫助開發(fā)者實(shí)現(xiàn)頂尖推理性能。NVIDIA的客戶和合作伙伴中包括有會(huì)話式AI領(lǐng)域的一流公司,比如Kensho、微軟、Nuance、Optum等。
最后要補(bǔ)充的是,MLPerf小組已經(jīng)開始致力于改進(jìn)其當(dāng)前的0.5推理測(cè)試。NVIDIA將努力在基準(zhǔn)測(cè)試中繼續(xù)發(fā)揮領(lǐng)導(dǎo)作用。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
gpu
+關(guān)注
關(guān)注
28文章
5283瀏覽量
136096 -
人工智能
+關(guān)注
關(guān)注
1821文章
50366瀏覽量
267047 -
推理
+關(guān)注
關(guān)注
0文章
9瀏覽量
7425
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
是德科技推出全新AI推理仿真平臺(tái)
是德科技(NYSE: KEYS)近日推出KAI推理構(gòu)建器(Keysight AI Inference Builder),這款仿真與分析平臺(tái)旨在大規(guī)模驗(yàn)證針對(duì)推理進(jìn)行優(yōu)化的AI基礎(chǔ)設(shè)施。
NVIDIA推出代理式AI藍(lán)圖與電信推理模型
借助全新開源大型電信模型與 NVIDIA Blueprint,電信運(yùn)營(yíng)商能夠利用自有數(shù)據(jù)訓(xùn)練 AI 智能體,構(gòu)建自主網(wǎng)絡(luò)。
禮來(lái)與NVIDIA宣布成立AI聯(lián)合創(chuàng)新實(shí)驗(yàn)室以應(yīng)對(duì)藥物研發(fā)挑戰(zhàn)
NVIDIA 與禮來(lái)公司在今日共同宣布,將合作成立一家開創(chuàng)性的 AI 聯(lián)合創(chuàng)新實(shí)驗(yàn)室,致力于運(yùn)用 AI 技術(shù)解決制藥行業(yè)長(zhǎng)期面臨的諸多挑戰(zhàn)。
生命科學(xué)領(lǐng)先企業(yè)采用 NVIDIA BioNeMo 平臺(tái)加速 AI 驅(qū)動(dòng)的藥物研發(fā)
新聞?wù)?l 禮來(lái)與 NVIDIA 宣布成立 AI 聯(lián)合創(chuàng)新實(shí)驗(yàn)室以應(yīng)對(duì)藥物研發(fā)挑戰(zhàn)。 l NVIDIA 攜手賽默飛打造自主實(shí)驗(yàn)室基礎(chǔ)設(shè)施
基于NVIDIA模組與軟件套件推動(dòng)邊緣與機(jī)器人AI推理
NVIDIA 正式推出 NVIDIA Jetson T4000,將高性能 AI 與實(shí)時(shí)推理能力帶入更廣泛的機(jī)器人和邊緣 AI 應(yīng)用。T400
NVIDIA 推出 Alpamayo 系列開源 AI 模型與工具,加速安全可靠的推理型輔助駕駛汽車開發(fā)
新聞?wù)?: l NVIDIA 率先發(fā)布為應(yīng)對(duì)輔助駕駛長(zhǎng)尾場(chǎng)景挑戰(zhàn)而設(shè)計(jì)的開源視覺(jué)-語(yǔ)言-動(dòng)作推理模型(Reasoning VLA);NVIDIA
NVIDIA TensorRT LLM 1.0推理框架正式上線
TensorRT LLM 作為 NVIDIA 為大規(guī)模 LLM 推理打造的推理框架,核心目標(biāo)是突破 NVIDIA 平臺(tái)上的推理性能瓶頸。為實(shí)
MediaTek攜手NVIDIA開啟個(gè)人AI算力新紀(jì)元
Spark 助力開發(fā)者能在本地端對(duì)大型 AI 模型進(jìn)行原型設(shè)計(jì)(Prototype)、微調(diào)(Fine-tune)和推理(Inference)。NVIDIA DGX Spark 將于 10 月 15 日上市,將驅(qū)動(dòng)各產(chǎn)業(yè)迎來(lái)新一
什么是AI模型的推理能力
NVIDIA 的數(shù)據(jù)工廠團(tuán)隊(duì)為 NVIDIA Cosmos Reason 等 AI 模型奠定了基礎(chǔ),該模型近日在 Hugging Face 的物理推理模型排行榜中位列榜首。
使用NVIDIA NVLink Fusion技術(shù)提升AI推理性能
本文詳細(xì)闡述了 NVIDIA NVLink Fusion 如何借助高效可擴(kuò)展的 NVIDIA NVLink scale-up 架構(gòu)技術(shù),滿足日益復(fù)雜的 AI 模型不斷增長(zhǎng)的需求。
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)
當(dāng)今社會(huì),AI已經(jīng)發(fā)展很迅速了,但是你了解AI的發(fā)展歷程嗎?本章作者將為我們打開AI的發(fā)展歷程以及需求和挑戰(zhàn)的面紗。
從2017年開始生成式
發(fā)表于 09-12 16:07
NVIDIA Nemotron Nano 2推理模型發(fā)布
NVIDIA 正式推出準(zhǔn)確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
利用NVIDIA推理模型構(gòu)建AI智能體
開放式推理模型能夠更快、更廣泛地進(jìn)行思考,為客戶服務(wù)、網(wǎng)絡(luò)安全、制造、物流和機(jī)器人等領(lǐng)域的 AI 智能體生成更明智的結(jié)果。
信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代
,還是工業(yè)協(xié)議時(shí)序混亂,均可完整還原端到端業(yè)務(wù)會(huì)話鏈條,為智能分析提供堅(jiān)實(shí)基礎(chǔ)。2.AI根因定位:推理引擎驅(qū)動(dòng)秒級(jí)精準(zhǔn)診斷l(xiāng) 知識(shí)圖譜驅(qū)動(dòng):將網(wǎng)絡(luò)拓?fù)?、流量統(tǒng)計(jì)、歷史趨勢(shì)、會(huì)話日志、異
發(fā)表于 07-16 15:29
潤(rùn)和軟件發(fā)布StackRUNS異構(gòu)分布式推理框架
當(dāng)下,AI模型規(guī)模持續(xù)膨脹、多模態(tài)應(yīng)用場(chǎng)景日益復(fù)雜,企業(yè)正面臨異構(gòu)算力資源碎片化帶來(lái)的嚴(yán)峻挑戰(zhàn)。為應(yīng)對(duì)行業(yè)痛點(diǎn),江蘇潤(rùn)和軟件股份有限公司(以下簡(jiǎn)稱“潤(rùn)和軟件”)正式發(fā)布自主研發(fā)的Sta
NVIDIA 如何應(yīng)對(duì)會(huì)話式AI帶來(lái)的推理挑戰(zhàn)?
評(píng)論