日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA 在 MLPerf 測(cè)試中將推理帶到新高度

NVIDIA英偉達(dá) ? 來(lái)源:未知 ? 2023-04-08 00:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在最新 MLPerf 基準(zhǔn)測(cè)試中,NVIDIA H100 和 L4 GPU 將生成式 AI 和所有其他工作負(fù)載帶到了新的水平,Jetson AGX Orin 則在性能和效率方面都有所提升。

作為獨(dú)立的第三方基準(zhǔn)測(cè)試,MLPerf 仍是衡量 AI 性能的權(quán)威標(biāo)準(zhǔn)。自 MLPerf 誕生以來(lái),NVIDIA 的 AI 平臺(tái)在訓(xùn)練和推理這兩個(gè)方面一直展現(xiàn)出領(lǐng)先優(yōu)勢(shì),包括最新發(fā)布的 MLPerf Inference 3.0 基準(zhǔn)測(cè)試。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“三年前我們推出 A100 時(shí),AI 世界由計(jì)算機(jī)視覺(jué)主導(dǎo)。如今,生成式 AI 已經(jīng)到來(lái)?!?/p>

“這正是我們打造 Hopper 的原因,其通過(guò) Transformer 引擎專為 GPT 進(jìn)行了優(yōu)化。最新的 MLPerf 3.0 凸顯了 Hopper 的性能比 A100 高出 4 倍?!?/p>

“下一階段的生成式 AI 需要高能效的新的 AI 基礎(chǔ)設(shè)施來(lái)訓(xùn)練大型語(yǔ)言模型。客戶正在大規(guī)模采用 Hopper,以構(gòu)建由數(shù)萬(wàn)顆通過(guò) NVIDIA NVLink 和 InfiniBand 連接的 Hopper GPU 組成的 AI 基礎(chǔ)設(shè)施?!?/p>

“業(yè)界正努力推動(dòng)安全、可信的生成式 AI 取得新的進(jìn)展。而 Hopper 正在推動(dòng)這項(xiàng)重要的工作?!?/p>

最新 MLPerf 結(jié)果顯示,NVIDIA 將從云到邊緣的 AI 推理性能和效率帶到了一個(gè)新的水平。

具體而言,在 DGX H100 系統(tǒng)中運(yùn)行的 NVIDIA H100 Tensor Core GPU 在每項(xiàng) AI 推理測(cè)試(即在生產(chǎn)中運(yùn)行神經(jīng)網(wǎng)絡(luò))中均展現(xiàn)出最高的性能。得益于軟件優(yōu)化,該 GPU 在 9 月首次亮相時(shí)就實(shí)現(xiàn)了高達(dá) 54%的性能提升。

針對(duì)醫(yī)療領(lǐng)域,H100 GPU 在 3D-UNet(MLPerf 醫(yī)學(xué)影像基準(zhǔn)測(cè)試)中的性能相比 9 月提高了 31%。

06856d9a-d561-11ed-bfe3-dac502259ad0.jpg

在 Transformer 引擎的加持下,基于 Hopper 架構(gòu)的 H100 GPU 在 BERT 上的表現(xiàn)十分優(yōu)異。BERT 是一個(gè)基于 transformer 的大型語(yǔ)言模型,它為如今已經(jīng)得到廣泛應(yīng)用的生成式 AI 奠定了基礎(chǔ)。

生成式 AI 使用戶可以快速創(chuàng)建文本、圖像、3D 模型等。從初創(chuàng)公司到云服務(wù)提供商,企業(yè)都在迅速采用這一能力,以實(shí)現(xiàn)新的業(yè)務(wù)模式和加速現(xiàn)有業(yè)務(wù)。

數(shù)億人現(xiàn)在正在使用 ChatGPT(同樣是一個(gè) transformer 模型)等生成式 AI 工具,以期得到即時(shí)響應(yīng)。

在這個(gè) AI 的 iPhone 時(shí)刻,推理性能至關(guān)重要。深度學(xué)習(xí)的部署幾乎無(wú)處不在,這推動(dòng)了從工廠車(chē)間到在線推薦系統(tǒng)等對(duì)推理性能的無(wú)盡需求。

L4 GPU 精彩亮相

NVIDIA L4 Tensor Core GPU 在本次 MLPerf 測(cè)試中首次亮相,其速度是上一代 T4 GPU 的 3 倍以上。這些加速器具有扁平的外形,可在幾乎所有的服務(wù)器中提供高吞吐量和低延遲。

L4 GPU 運(yùn)行了所有 MLPerf 工作負(fù)載。憑借對(duì)關(guān)鍵的 FP8 格式的支持,其在對(duì)性能要求很高的 BERT 模型上取得了非常驚人的結(jié)果。

除了出色的 AI 性能外,L4 GPU 的圖像解碼速度快了 10 倍,視頻處理速度快了 3.2 倍,同時(shí)圖形和實(shí)時(shí)渲染性能提高了 4 倍以上。

這些加速器兩周前在 GTC 上發(fā)布并已通過(guò)各大系統(tǒng)制造商和云服務(wù)提供商提供。L4 GPU 是 NVIDIA 在 GTC 上發(fā)布的 AI 推理平臺(tái)產(chǎn)品組合中的最新成員。

069b91ce-d561-11ed-bfe3-dac502259ad0.jpg ?

軟件和網(wǎng)絡(luò)在系統(tǒng)測(cè)試中大放異彩

NVIDIA 的全棧式 AI 平臺(tái)在一項(xiàng)全新 MLPerf 測(cè)試中展現(xiàn)了其領(lǐng)先優(yōu)勢(shì)。

被稱之為 Network-division 的基準(zhǔn)測(cè)試將數(shù)據(jù)傳輸至一個(gè)遠(yuǎn)程推理服務(wù)器。它反映了企業(yè)用戶將數(shù)據(jù)存儲(chǔ)在企業(yè)防火墻后面、在云上運(yùn)行 AI 作業(yè)的熱門(mén)場(chǎng)景。

在 BERT 測(cè)試中,遠(yuǎn)程 NVIDIA DGX A100 系統(tǒng)提供高達(dá) 96%的最大本地性能,其性能下降的原因之一是因?yàn)樗鼈冃枰却?CPU 完成部分任務(wù)。在單純依靠 GPU 進(jìn)行處理的 ResNet-50 計(jì)算機(jī)視覺(jué)測(cè)試中,它們達(dá)到了 100%的性能。

這兩個(gè)結(jié)果在很大程度上要?dú)w功于 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)、NVIDIA ConnectX SmartNIC 以及 NVIDIA GPUDirect 等軟件。

Orin 在邊緣的性能提升 3.2 倍

另外,相較于一年前的結(jié)果,NVIDIA Jetson AGX Orin 模塊化系統(tǒng)的能效提高了 63%,性能提高了 81%。Jetson AGX Orin 可在需要 AI 的狹小空間內(nèi)以低功率進(jìn)行推理,包括在由電池供電的系統(tǒng)上。

專為需要更小模塊、更低功耗的應(yīng)用而開(kāi)發(fā)的 Jetson Orin NX 16G 在本次基準(zhǔn)測(cè)試中首次亮相便大放異彩。其性能是上一代 Jetson Xavier NX 處理器的 3.2 倍。

廣泛的 NVIDIA AI 生態(tài)

MLPerf 結(jié)果顯示,NVIDIA AI 得到了業(yè)內(nèi)最廣泛的機(jī)器學(xué)習(xí)生態(tài)系統(tǒng)的支持。

在這一輪測(cè)試中,有十家公司在 NVIDIA 平臺(tái)上提交了結(jié)果,包括華碩、戴爾科技、技嘉、新華三、聯(lián)想、寧暢、超微和超聚變等系統(tǒng)制造商和微軟 Azure 云服務(wù)。

他們所提交的結(jié)果表明,無(wú)論是在云端還是在自己的數(shù)據(jù)中心運(yùn)行的服務(wù)器中,用戶都可以通過(guò) NVIDIA AI 獲得出色的性能。

NVIDIA 的眾多合作伙伴也參與了 MLPerf,因?yàn)樗麄冎肋@是一個(gè)幫助客戶評(píng)估 AI 平臺(tái)和廠商的很有價(jià)值的工具。最新一輪結(jié)果表明,他們今天所提供的性能將隨著 NVIDIA 平臺(tái)的發(fā)展而不斷提升。

用戶需要的是“多面手”

NVIDIA AI 是唯一能夠在數(shù)據(jù)中心和邊緣計(jì)算中運(yùn)行所有 MLPerf 推理工作負(fù)載和場(chǎng)景的平臺(tái)。其全面的性能和效率讓用戶能夠成為真正的贏家。

用戶在實(shí)際應(yīng)用中通常會(huì)采用許多不同類型的神經(jīng)網(wǎng)絡(luò),這些網(wǎng)絡(luò)往往需要實(shí)時(shí)提供答案。

例如,一個(gè) AI 應(yīng)用可能需要先理解用戶的語(yǔ)音請(qǐng)求,對(duì)圖像進(jìn)行分類、提出建議,然后以人聲作為語(yǔ)音來(lái)回答用戶。每個(gè)步驟都需要用到不同類型的 AI 模型。

MLPerf 基準(zhǔn)測(cè)試涵蓋了這些以及其他流行的 AI 工作負(fù)載,所以這些測(cè)試能夠確保 IT 決策者獲得可靠且可以靈活部署的性能。

06b4db66-d561-11ed-bfe3-dac502259ad0.jpg

用戶可以根據(jù) MLPerf 的結(jié)果做出明智的購(gòu)買(mǎi)決定,因?yàn)檫@些測(cè)試是透明的、客觀的。該基準(zhǔn)測(cè)試得到了包括 Arm、百度、Facebook AI、谷歌、哈佛大學(xué)、英特爾、微軟、斯坦福大學(xué)和多倫多大學(xué)在內(nèi)的廣泛支持。

可以使用的軟件

NVIDIA AI 平臺(tái)的軟件層 NVIDIA AI Enterprise 確保用戶能夠從他們的基礎(chǔ)設(shè)施投資中獲得最佳的性能以及在企業(yè)數(shù)據(jù)中心運(yùn)行 AI 所需的企業(yè)級(jí)支持、安全性和可靠性。

這些測(cè)試所使用的所有軟件都可以從 MLPerf 庫(kù)中獲得,因此任何人都可以獲得這些領(lǐng)先的結(jié)果。

各項(xiàng)優(yōu)化措施不斷地被整合到 NGC(NVIDIA 的 GPU 加速軟件目錄)上的容器中。本輪測(cè)試中提交的每項(xiàng)工作均使用了該目錄中的 NVIDIA TensorRT 優(yōu)化 AI 推理性能。

掃描海報(bào)二維碼,或點(diǎn)擊“閱讀原文”,即可觀看 NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛 GTC23 主題演講重播!


原文標(biāo)題:NVIDIA 在 MLPerf 測(cè)試中將推理帶到新高度

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4118

    瀏覽量

    99669

原文標(biāo)題:NVIDIA 在 MLPerf 測(cè)試中將推理帶到新高度

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    探索Z86C90 CCP:?jiǎn)涡酒軜?gòu)的新高度

    探索Z86C90 CCP:?jiǎn)涡酒軜?gòu)的新高度 電子工程師的世界里,不斷尋找性能卓越、功能強(qiáng)大且成本效益高的微控制器是永恒的追求。今天,我們就來(lái)深入了解一下Z86C90 CCP(Consumer
    的頭像 發(fā)表于 04-04 12:05 ?254次閱讀

    賦予AI設(shè)備靈動(dòng)雙眸 | 匠芯創(chuàng)亮相“AI+教育硬件”沙龍 解鎖流暢交互新高度

    -高幀芯動(dòng)力解鎖流暢新高度》的主題演講。直面行業(yè)痛點(diǎn)匠芯創(chuàng)給出“芯”答案當(dāng)前,AI陪伴設(shè)備兒童教育、智能玩具、家庭陪伴等場(chǎng)景中快速普及。然而,傳統(tǒng)AI硬件顯示效
    的頭像 發(fā)表于 04-02 18:51 ?445次閱讀
    賦予AI設(shè)備靈動(dòng)雙眸 | 匠芯創(chuàng)亮相“AI+教育硬件”沙龍 解鎖流暢交互<b class='flag-5'>新高度</b>

    思必馳攜手雅迪冠能系列推動(dòng)兩輪智能出行邁向新高度

    近日,思必馳與雅迪深度攜手,為冠能星艦Ⅱ、冠能白鯊Ⅱ高配版兩款重磅車(chē)型量身打造7寸智能語(yǔ)音儀表,將全鏈路語(yǔ)音技術(shù)、AI大模型能力與兩輪車(chē)騎行場(chǎng)景融合,為用戶帶來(lái)更安全、更便捷、更豐富的騎行體驗(yàn),推動(dòng)兩輪智能出行邁向新高度。
    的頭像 發(fā)表于 04-02 09:13 ?899次閱讀

    AI服務(wù)器電源測(cè)試新高度-艾諾EDPP測(cè)試解決方案解鎖高效能驗(yàn)證

    功率測(cè)試(EDPP)、大斜率測(cè)試、并機(jī)時(shí)差等技術(shù)難點(diǎn),同時(shí)還提供供電布局、冷熱區(qū)布局等場(chǎng)地實(shí)施方案,眾多標(biāo)桿客戶的嚴(yán)苛測(cè)試中表現(xiàn)優(yōu)異,成為服務(wù)器電源
    的頭像 發(fā)表于 02-13 12:03 ?685次閱讀
    AI服務(wù)器電源<b class='flag-5'>測(cè)試</b><b class='flag-5'>新高度</b>-艾諾EDPP<b class='flag-5'>測(cè)試</b>解決方案解鎖高效能驗(yàn)證

    AI定義座艙新高度|搭載天璣座艙S1 Ultra的奇瑞風(fēng)云T9L

    」推向「AI 定義座艙」的新高度。 旗艦算力 構(gòu)建車(chē)載 AI 的基礎(chǔ) ? 風(fēng)云 T9L 搭載的 MediaTek 天璣座艙 S1 Ultra 采用先進(jìn)的 3nm 制程工藝,這是其能夠平穩(wěn)運(yùn)行高負(fù)載
    的頭像 發(fā)表于 02-12 16:19 ?2806次閱讀
    AI定義座艙<b class='flag-5'>新高度</b>|搭載天璣座艙S1 Ultra的奇瑞風(fēng)云T9L

    探索ISO724x系列高速四通道數(shù)字隔離器,解鎖電子設(shè)計(jì)新高度

    探索ISO724x系列高速四通道數(shù)字隔離器,解鎖電子設(shè)計(jì)新高度 電子工程師的日常設(shè)計(jì)工作中,數(shù)字隔離器是不可或缺的關(guān)鍵組件,它能夠有效阻斷高電壓、隔離接地,防止噪聲電流干擾或損壞敏感電路。今天
    的頭像 發(fā)表于 01-25 09:50 ?577次閱讀

    NVIDIA DGX SuperPOD為Rubin平臺(tái)橫向擴(kuò)展提供藍(lán)圖

    NVIDIA DGX Rubin 系統(tǒng)整合了 NVIDIA 計(jì)算、網(wǎng)絡(luò)和軟件領(lǐng)域的最新突破,將推理 token 成本降至 NVIDIA B
    的頭像 發(fā)表于 01-14 09:14 ?916次閱讀

    NVIDIA 推出 Alpamayo 系列開(kāi)源 AI 模型與工具,加速安全可靠的推理型輔助駕駛汽車(chē)開(kāi)發(fā)

    新聞?wù)?: l NVIDIA 率先發(fā)布為應(yīng)對(duì)輔助駕駛長(zhǎng)尾場(chǎng)景挑戰(zhàn)而設(shè)計(jì)的開(kāi)源視覺(jué)-語(yǔ)言-動(dòng)作推理模型(Reasoning VLA);NVIDIA Alpamayo 系列還包含賦能輔助駕駛汽車(chē)開(kāi)發(fā)
    的頭像 發(fā)表于 01-06 09:40 ?537次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Alpamayo 系列開(kāi)源 AI 模型與工具,加速安全可靠的<b class='flag-5'>推理</b>型輔助駕駛汽車(chē)開(kāi)發(fā)

    共推鴻蒙生態(tài)邁向新高度!拓維信息攜開(kāi)鴻智谷亮相開(kāi)源鴻蒙行業(yè)論壇

    ,離不開(kāi)廣大行業(yè)伙伴及開(kāi)發(fā)者的協(xié)同共建。為進(jìn)一步匯聚產(chǎn)業(yè)力量,推動(dòng)鴻蒙生態(tài)邁向新高度,11月28日上午,由開(kāi)源鴻蒙項(xiàng)目群工作委員會(huì)主辦、華為承辦的開(kāi)源鴻蒙行業(yè)論壇
    的頭像 發(fā)表于 11-28 17:47 ?1061次閱讀
    共推鴻蒙生態(tài)邁向<b class='flag-5'>新高度</b>!拓維信息攜開(kāi)鴻智谷亮相開(kāi)源鴻蒙行業(yè)論壇

    NVIDIA TensorRT LLM 1.0推理框架正式上線

    TensorRT LLM 作為 NVIDIA 為大規(guī)模 LLM 推理打造的推理框架,核心目標(biāo)是突破 NVIDIA 平臺(tái)上的推理性能瓶頸。為實(shí)
    的頭像 發(fā)表于 10-21 11:04 ?1466次閱讀

    什么是AI模型的推理能力

    NVIDIA 的數(shù)據(jù)工廠團(tuán)隊(duì)為 NVIDIA Cosmos Reason 等 AI 模型奠定了基礎(chǔ),該模型近日 Hugging Face 的物理推理模型排行榜中位列榜首。
    的頭像 發(fā)表于 09-23 15:19 ?1527次閱讀

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準(zhǔn)確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?2058次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2<b class='flag-5'>推理</b>模型發(fā)布

    華為助力埃塞俄比亞電信通信網(wǎng)絡(luò)技術(shù)邁向新高度

    近日,埃塞俄比亞領(lǐng)先運(yùn)營(yíng)商埃塞俄比亞電信與華為共同宣布,北非區(qū)域率先完成GigaAAU FDD三頻Massive MIMO站點(diǎn)的商用部署。此次合作是雙方提升網(wǎng)絡(luò)性能、改善用戶體驗(yàn)方面的又一重大舉措,標(biāo)志著埃塞俄比亞電信通信網(wǎng)絡(luò)技術(shù)邁向
    的頭像 發(fā)表于 08-20 13:53 ?1076次閱讀

    海格天乘推動(dòng)低空經(jīng)濟(jì)產(chǎn)業(yè)發(fā)展邁向新高度

    運(yùn)營(yíng)服務(wù)和操控員培訓(xùn)“雙證”資質(zhì)的機(jī)構(gòu),標(biāo)志著海格天乘具備安全、合法、合規(guī)開(kāi)展無(wú)人機(jī)商業(yè)運(yùn)營(yíng)服務(wù)及無(wú)人機(jī)操控員培訓(xùn)的能力,推動(dòng)低空經(jīng)濟(jì)產(chǎn)業(yè)發(fā)展邁向新高度。
    的頭像 發(fā)表于 08-16 09:16 ?8143次閱讀

    麥格米特與鴻路鋼構(gòu)合作邁入全新高度

    近日,深圳市麥格米特焊接技術(shù)有限公司(以下簡(jiǎn)稱:麥格米特焊接技術(shù))與安徽鴻路鋼結(jié)構(gòu)(集團(tuán))股份有限公司(以下簡(jiǎn)稱:鴻路鋼構(gòu))正式簽署1800臺(tái)機(jī)器人焊接電源采購(gòu)協(xié)議。鴻路鋼構(gòu)董事長(zhǎng)商曉波、麥格米特董事長(zhǎng)童永勝等雙方高層共同出席簽約儀式,標(biāo)志著兩家企業(yè)在數(shù)字化智能焊接領(lǐng)域的合作邁入全新高度。
    的頭像 發(fā)表于 05-08 10:39 ?1118次閱讀
    祁阳县| 曲松县| 达日县| 屏边| 枣强县| 沭阳县| 桂阳县| 漯河市| 手游| 安仁县| 遂昌县| 嘉义县| 晋宁县| 晋中市| 富阳市| 威海市| 和静县| 凤山县| 游戏| 望江县| 宁都县| 岗巴县| 大关县| 北流市| 彭山县| 岑溪市| 南康市| 天祝| 镇雄县| 沭阳县| 泾源县| 武冈市| 连城县| 特克斯县| 兰西县| 夹江县| 晴隆县| 通海县| 云安县| 沂水县| 阳江市|