日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用MLPerf 推理 1.1提升NVIDIA績(jī)效領(lǐng)導(dǎo)力

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:NVIDIA ? 2022-04-08 16:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能繼續(xù)推動(dòng)跨行業(yè)的突破性創(chuàng)新,包括消費(fèi)互聯(lián)網(wǎng)、醫(yī)療保健和生命科學(xué)、金融服務(wù)、零售、制造和超級(jí)計(jì)算。研究人員繼續(xù)推動(dòng)快速發(fā)展的模型在規(guī)模、復(fù)雜度和多樣性方面的發(fā)展。此外,其中許多復(fù)雜的大規(guī)模模型需要為聊天機(jī)器人、數(shù)字助理和欺詐檢測(cè)等人工智能支持的服務(wù)提供實(shí)時(shí)結(jié)果。

考慮到人工智能推理的廣泛用途,評(píng)估性能對(duì)開(kāi)發(fā)人員和基礎(chǔ)設(shè)施管理人員提出了許多挑戰(zhàn)。對(duì)于數(shù)據(jù)中心、 edge 和移動(dòng)平臺(tái)上的 AI 推理, MLPerf 推理 1.1 是一個(gè)行業(yè)標(biāo)準(zhǔn)基準(zhǔn),用于衡量計(jì)算機(jī)視覺(jué)、醫(yī)學(xué)成像、自然語(yǔ)言和推薦系統(tǒng)的性能。這些基準(zhǔn)由人工智能行業(yè)領(lǐng)導(dǎo)者組成的聯(lián)盟制定,為人工智能培訓(xùn)和推理提供了當(dāng)今最全面的同行評(píng)審績(jī)效數(shù)據(jù)集。

要在這一基準(zhǔn)測(cè)試中完成大量測(cè)試,需要一個(gè)具有強(qiáng)大生態(tài)系統(tǒng)支持的全堆棧平臺(tái),無(wú)論是框架還是網(wǎng)絡(luò)。 NVIDIA 是唯一一家提交所有數(shù)據(jù)中心和邊緣測(cè)試并提供全面領(lǐng)先性能的公司。

這項(xiàng)工作的一個(gè)重要副產(chǎn)品是,這些優(yōu)化中的許多已經(jīng)進(jìn)入了推理開(kāi)發(fā)工具,如TensorRT和 NVIDIA Triton 。用于高性能深度學(xué)習(xí)推理的 TensorRT SDK 包括一個(gè)深度學(xué)習(xí)推理優(yōu)化器和運(yùn)行時(shí),為深度學(xué)習(xí)推理應(yīng)用程序提供低延遲和高吞吐量。

Triton 推理服務(wù)器軟件簡(jiǎn)化了人工智能模型在大規(guī)模生產(chǎn)中的部署。這種開(kāi)源推理服務(wù)軟件使團(tuán)隊(duì)能夠在任何基于 GPUCPU 的基礎(chǔ)設(shè)施上從本地存儲(chǔ)或云平臺(tái)的任何框架部署經(jīng)過(guò)培訓(xùn)的人工智能模型。

按數(shù)字

在數(shù)據(jù)中心和邊緣兩大類(lèi)中, NVIDIA 憑借 NVIDIA A100 張量核 GPU 和 NVIDIA A30 張量核 GPU 在性能測(cè)試中名列榜首。自從 MLPerf 推斷 0.7 的結(jié)果發(fā)布以來(lái),在過(guò)去一年中, NVIDIA 僅通過(guò)軟件改進(jìn)就提高了 50% 的性能。

在另一個(gè)行業(yè)中, NVIDIA 首次使用基于 GPU – 加速 ARM 的服務(wù)器提交數(shù)據(jù)中心類(lèi)別,該服務(wù)器支持所有工作負(fù)載,并提供與類(lèi)似配置的基于 x86 的服務(wù)器相同的結(jié)果。這些基于 ARM 的新提交為 GPU 加速 ARM 服務(wù)器創(chuàng)造了新的性能世界記錄。這標(biāo)志著這些平臺(tái)的一個(gè)重要里程碑,因?yàn)樗鼈儸F(xiàn)在已經(jīng)在同行評(píng)審的行業(yè)標(biāo)準(zhǔn)基準(zhǔn)中證明了自己,以提供市場(chǎng)領(lǐng)先的性能。它還展示了 NVIDIA ARM 軟件生態(tài)系統(tǒng)的性能、多功能性和就緒性,以應(yīng)對(duì)數(shù)據(jù)中心的計(jì)算挑戰(zhàn)。

pYYBAGJP7FSAb4UmAABG9iwx2cg552.png

圖 1 。使用 Ampere Altra CPU s 的基于 ARM 的服務(wù)器提供的性能與類(lèi)似配置的基于 x86 的服務(wù)器相當(dāng)

MLPerf v1.1 推理關(guān)閉;每個(gè)加速器的性能源自使用數(shù)據(jù)中心脫機(jī)中報(bào)告的加速器計(jì)數(shù)的各個(gè)提交的最佳 MLPerf 結(jié)果。 x86 服務(wù)器: 1.1-034 、 ARM 服務(wù)器: 1.1-033 MLPerf 名稱(chēng)和徽標(biāo)是商標(biāo)。

綜觀整體表現(xiàn), NVIDIA 全面領(lǐng)先。圖 2 顯示了服務(wù)器場(chǎng)景的結(jié)果,其中使用泊松分布為測(cè)試中的系統(tǒng)生成推理工作,以更緊密地模擬真實(shí)世界的工作負(fù)載模式。

pYYBAGJP7FuAQr9CAACxiiMT8EI989.png

圖 2 。 NVIDIA 與 CPU 純服務(wù)器的性能比較

MLPerf v1.1 推理關(guān)閉;使用數(shù)據(jù)中心脫機(jī)和服務(wù)器中報(bào)告的加速器計(jì)數(shù),從各個(gè)提交的最佳 MLPerf 結(jié)果中得出每個(gè)加速器的性能。高通 AI 100 : 1.1-057 和 1.1-058 ,英特爾至強(qiáng) 8380 : 1.1-023 和 1.1-024 , NVIDIA A30 : 1.1-43 , NVIDIA A100 ( ARM ): 1.1-033 , NVIDIA A100 ( x86 ): 1.1-047 。 MLPerf 名稱(chēng)和徽標(biāo)是商標(biāo)。

NVIDIA 比 CPU 純服務(wù)器的性能全面提高了 104 倍。這種性能優(yōu)勢(shì)轉(zhuǎn)化為對(duì)更大、更復(fù)雜的模型以及在對(duì)話(huà) AI 、推薦系統(tǒng)和數(shù)字助理中實(shí)時(shí)作業(yè)中運(yùn)行的多個(gè)模型進(jìn)行推理的能力。

結(jié)果背后的優(yōu)化

我們的工程團(tuán)隊(duì)實(shí)施了一些優(yōu)化,使這些偉大的結(jié)果成為可能。首先,基于 ARM 的服務(wù)器和基于 x86 的服務(wù)器的所有這些結(jié)果都是使用 TensorRT 8 生成的,現(xiàn)在普遍可用。特別令人感興趣的是雙內(nèi)核的非冪函數(shù)的使用,這是為了加速工作負(fù)載而實(shí)現(xiàn)的,比如 BERT – 大型單流場(chǎng)景測(cè)試。

NVIDIA 提交利用添加到 NVIDIA Triton 推理服務(wù)器的新主機(jī)策略功能。您可以在配置 NVIDIA Triton 服務(wù)器時(shí)指定主機(jī)策略,以在服務(wù)器應(yīng)用程序中啟用線程和內(nèi)存固定。利用此功能, NVIDIA Triton 可以為系統(tǒng)中的每個(gè) GPU 指定輸入的最佳位置。最佳位置可以基于系統(tǒng)的非統(tǒng)一內(nèi)存體系結(jié)構(gòu)( NUMA )配置,在這種情況下,每個(gè) NUMA 節(jié)點(diǎn)上都有一個(gè)查詢(xún)樣本庫(kù)。

您還可以使用主機(jī)策略啟用“從設(shè)備啟動(dòng)”配置設(shè)置,服務(wù)器將在選擇執(zhí)行的 GPU 上拾取輸入。此設(shè)置還可以將網(wǎng)絡(luò)輸入直接輸入 GPU 內(nèi)存,完全繞過(guò) CPU 和系統(tǒng)內(nèi)存副本。

推理能力三人組: TensorRT , NVIDIA Triton 和 NGC

NVIDIA 推理領(lǐng)導(dǎo)力來(lái)自于構(gòu)建最優(yōu)秀的人工智能加速器,用于培訓(xùn)和推理。但同樣重要的是支持所有 AI 框架和 800 多個(gè) HPC 應(yīng)用程序的 NVIDIA 端到端、全棧軟件生態(tài)系統(tǒng)。

所有這些軟件都可以在NGC、 NVIDIA 集線器上獲得,該集線器帶有 GPU ——用于深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和 HPC 的優(yōu)化軟件。 NGC 負(fù)責(zé)所有管道,因此數(shù)據(jù)科學(xué)家、開(kāi)發(fā)人員和研究人員可以專(zhuān)注于構(gòu)建解決方案、收集 i NSight 并提供業(yè)務(wù)價(jià)值。

NGC 可通過(guò)您首選的云提供商的市場(chǎng)免費(fèi)獲得。在那里,您可以找到 TensorRT 和 NVIDIA Triton 的最新版本,這兩個(gè)版本都有助于生成最新的 MLPerf 推斷 1.1 結(jié)果。

關(guān)于作者

Dave Salvator 是 NVIDIA 旗下 Tesla 集團(tuán)的高級(jí)產(chǎn)品營(yíng)銷(xiāo)經(jīng)理,專(zhuān)注于超規(guī)模、深度學(xué)習(xí)和推理。

Jesus Corbal San Adrian 是 NVIDIA 計(jì)算架構(gòu)組的杰出工程師,專(zhuān)注于深度學(xué)習(xí)推理 GPU 分析和優(yōu)化。

Madhumitha Sridhara 是 TensorRT 團(tuán)隊(duì)的高級(jí)軟件工程師,專(zhuān)注于使用 Triton 推理服務(wù)器的 NVIDIA MLPerf推理提交。她擁有卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)工程碩士學(xué)位和印度卡納塔克邦蘇拉特卡爾國(guó)家理工學(xué)院電子和通信工程學(xué)士學(xué)位。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50366

    瀏覽量

    267047
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8567

    瀏覽量

    137254
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5610

    瀏覽量

    124652
  • MLPerf
    +關(guān)注

    關(guān)注

    0

    文章

    37

    瀏覽量

    986
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    天合光能出席2026地球合伙人領(lǐng)導(dǎo)力峰會(huì)

    在第57個(gè)世界地球日來(lái)臨之際,以“我們的力量,我們的地球”為主題的2026地球合伙人領(lǐng)導(dǎo)力峰會(huì)在上海隆重舉行。天合光能作為全球光儲(chǔ)領(lǐng)軍企業(yè)應(yīng)邀出席。會(huì)上,憑借在推動(dòng)全球能源轉(zhuǎn)型與生態(tài)修復(fù)領(lǐng)域的卓越貢獻(xiàn),天合光能榮獲大會(huì)授予“新銳地球合伙人”榮譽(yù)稱(chēng)號(hào)。
    的頭像 發(fā)表于 04-24 15:21 ?310次閱讀

    NVIDIA 推出 Alpamayo 系列開(kāi)源 AI 模型與工具,加速安全可靠的推理型輔助駕駛汽車(chē)開(kāi)發(fā)

    新聞?wù)?: l NVIDIA 率先發(fā)布為應(yīng)對(duì)輔助駕駛長(zhǎng)尾場(chǎng)景挑戰(zhàn)而設(shè)計(jì)的開(kāi)源視覺(jué)-語(yǔ)言-動(dòng)作推理模型(Reasoning VLA);NVIDIA Alpamayo 系列還包含賦能輔助駕駛汽車(chē)開(kāi)發(fā)
    的頭像 發(fā)表于 01-06 09:40 ?525次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Alpamayo 系列開(kāi)源 AI 模型與工具,加速安全可靠的<b class='flag-5'>推理</b>型輔助駕駛汽車(chē)開(kāi)發(fā)

    DEKRA德凱榮獲2025社會(huì)責(zé)任與可持續(xù)增長(zhǎng)領(lǐng)導(dǎo)力獎(jiǎng)

    2025年11月19日,中國(guó)歐盟商會(huì)第12屆企業(yè)社會(huì)責(zé)任獎(jiǎng)?lì)C獎(jiǎng)典禮在南京舉行,DEKRA德凱在本屆評(píng)選中榮獲“社會(huì)責(zé)任與可持續(xù)增長(zhǎng)領(lǐng)導(dǎo)力獎(jiǎng)”。受主辦方邀請(qǐng),DEKRA德凱中國(guó)規(guī)劃發(fā)展副總裁周旋發(fā)表了主題演講,分享了公司在企業(yè)社會(huì)責(zé)任方面的長(zhǎng)期實(shí)踐與階段性成果。
    的頭像 發(fā)表于 11-26 10:33 ?761次閱讀

    安波福榮獲2025年度最佳實(shí)踐獎(jiǎng)之產(chǎn)品領(lǐng)導(dǎo)力大獎(jiǎng)

    近日,全球領(lǐng)先的增長(zhǎng)咨詢(xún)公司Frost & Sullivan在美國(guó)亞利桑那州舉辦2025年度最佳實(shí)踐獎(jiǎng)?lì)C獎(jiǎng)典禮。安波福PULSE雷達(dá)視覺(jué)一體感知系統(tǒng)憑借在全球汽車(chē)輔助泊車(chē)領(lǐng)域的卓越表現(xiàn),榮獲2025年度最佳實(shí)踐獎(jiǎng)之產(chǎn)品領(lǐng)導(dǎo)力大獎(jiǎng)。
    的頭像 發(fā)表于 10-30 15:02 ?1869次閱讀

    NVIDIA TensorRT LLM 1.0推理框架正式上線

    TensorRT LLM 作為 NVIDIA 為大規(guī)模 LLM 推理打造的推理框架,核心目標(biāo)是突破 NVIDIA 平臺(tái)上的推理性能瓶頸。為實(shí)
    的頭像 發(fā)表于 10-21 11:04 ?1457次閱讀

    MediaTek攜手NVIDIA開(kāi)啟個(gè)人AI算新紀(jì)元

    Spark 助力開(kāi)發(fā)者能在本地端對(duì)大型 AI 模型進(jìn)行原型設(shè)計(jì)(Prototype)、微調(diào)(Fine-tune)和推理(Inference)。NVIDIA DGX Spark 將于 10 月 15 日上市,將驅(qū)動(dòng)各產(chǎn)業(yè)迎來(lái)新一波的 AI 發(fā)展。
    的頭像 發(fā)表于 10-16 11:26 ?960次閱讀

    利用NVIDIA DOCA GPUNetIO技術(shù)提升MoE模型推理性能

    在第三屆 NVIDIA DPU 中國(guó)黑客松競(jìng)賽中,我們見(jiàn)證了開(kāi)發(fā)者與 NVIDIA 網(wǎng)絡(luò)技術(shù)的深度碰撞。在 23 支參賽隊(duì)伍中,有 5 支隊(duì)伍脫穎而出,展現(xiàn)了在 AI 網(wǎng)絡(luò)、存儲(chǔ)和安全等領(lǐng)域的創(chuàng)新突破。
    的頭像 發(fā)表于 09-23 15:25 ?1242次閱讀

    使用NVIDIA NVLink Fusion技術(shù)提升AI推理性能

    本文詳細(xì)闡述了 NVIDIA NVLink Fusion 如何借助高效可擴(kuò)展的 NVIDIA NVLink scale-up 架構(gòu)技術(shù),滿(mǎn)足日益復(fù)雜的 AI 模型不斷增長(zhǎng)的需求。
    的頭像 發(fā)表于 09-23 14:45 ?1163次閱讀
    使用<b class='flag-5'>NVIDIA</b> NVLink Fusion技術(shù)<b class='flag-5'>提升</b>AI<b class='flag-5'>推理</b>性能

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準(zhǔn)確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?2033次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2<b class='flag-5'>推理</b>模型發(fā)布

    NVIDIA從云到邊緣加速OpenAI gpt-oss模型部署,實(shí)現(xiàn)150萬(wàn)TPS推理

    的發(fā)布持續(xù)深化了雙方的 AI 創(chuàng)新合作。NVIDIANVIDIA Blackwell 架構(gòu)上優(yōu)化了這兩款全新的開(kāi)放權(quán)重模型并實(shí)現(xiàn)了推理性能加速,在 NVIDIA 系統(tǒng)上至高達(dá)到每
    的頭像 發(fā)表于 08-15 20:34 ?2536次閱讀
    <b class='flag-5'>NVIDIA</b>從云到邊緣加速OpenAI gpt-oss模型部署,實(shí)現(xiàn)150萬(wàn)TPS<b class='flag-5'>推理</b>

    利用NVIDIA推理模型構(gòu)建AI智能體

    開(kāi)放式推理模型能夠更快、更廣泛地進(jìn)行思考,為客戶(hù)服務(wù)、網(wǎng)絡(luò)安全、制造、物流和機(jī)器人等領(lǐng)域的 AI 智能體生成更明智的結(jié)果。
    的頭像 發(fā)表于 08-13 14:32 ?1786次閱讀
    <b class='flag-5'>利用</b><b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b>模型構(gòu)建AI智能體

    偉創(chuàng)榮獲制造業(yè)“奧斯卡”大獎(jiǎng) 美國(guó)制造商協(xié)會(huì)頒發(fā)的“制造業(yè)領(lǐng)導(dǎo)力獎(jiǎng)”

    數(shù)字供應(yīng)鏈閃耀全球 ?制造業(yè)“奧斯卡”收入囊中 在制造業(yè)界, 有一項(xiàng)大獎(jiǎng)被譽(yù)為“行業(yè)奧斯卡”, ?那就是由美國(guó)制造商協(xié)會(huì)頒發(fā)的 “制造業(yè)領(lǐng)導(dǎo)力獎(jiǎng)” 。 而就在最近, 偉創(chuàng)憑借在 數(shù)字供應(yīng)鏈領(lǐng)域
    的頭像 發(fā)表于 06-26 09:27 ?1238次閱讀
    偉創(chuàng)<b class='flag-5'>力</b>榮獲制造業(yè)“奧斯卡”大獎(jiǎng)  美國(guó)制造商協(xié)會(huì)頒發(fā)的“制造業(yè)<b class='flag-5'>領(lǐng)導(dǎo)力</b>獎(jiǎng)”

    偉創(chuàng)憑借在數(shù)字供應(yīng)鏈領(lǐng)域的卓越成就,榮膺&quot;2025年制造業(yè)領(lǐng)導(dǎo)力獎(jiǎng)&quot;

    上海?2025年6月25日?/美通社/ --?近日,偉創(chuàng)(納斯達(dá)克股票代碼:FLEX)宣布,公司憑借在數(shù)字供應(yīng)鏈領(lǐng)域的杰出成就,榮獲"2025年制造業(yè)領(lǐng)導(dǎo)力獎(jiǎng)"。該獎(jiǎng)項(xiàng)由美國(guó)制造商協(xié)會(huì)主辦,旨在
    的頭像 發(fā)表于 06-25 15:59 ?672次閱讀
    偉創(chuàng)<b class='flag-5'>力</b>憑借在數(shù)字供應(yīng)鏈領(lǐng)域的卓越成就,榮膺&quot;2025年制造業(yè)<b class='flag-5'>領(lǐng)導(dǎo)力</b>獎(jiǎng)&quot;

    全球各大品牌利用NVIDIA AI技術(shù)提升運(yùn)營(yíng)效率

    歐萊雅、LVMH 集團(tuán)和雀巢利用 NVIDIA 加速的智能體 AI 和物理 AI,大幅提升產(chǎn)品設(shè)計(jì)、營(yíng)銷(xiāo)及物流等方面的運(yùn)營(yíng)效率。
    的頭像 發(fā)表于 06-19 14:36 ?1375次閱讀

    中興通訊應(yīng)邀出席2025年金磚國(guó)家女性領(lǐng)導(dǎo)力論壇

    近日,以“金磚織錦、巾幗添彩”為主題的2025年金磚國(guó)家女性領(lǐng)導(dǎo)力論壇在北京啟幕,來(lái)自金磚國(guó)家的數(shù)百名代表匯聚一堂,圍繞科技創(chuàng)新、人文交流等多個(gè)議題進(jìn)行深入研討,共話(huà)女性領(lǐng)導(dǎo)力成長(zhǎng)的成功經(jīng)驗(yàn)及最佳實(shí)踐。中興通訊董事長(zhǎng)方榕應(yīng)邀出席,并就“科技向善,共創(chuàng)綠色金磚可持續(xù)未來(lái)”這
    的頭像 發(fā)表于 05-09 09:38 ?1321次閱讀
    江华| 伊通| 顺昌县| 昭平县| 新宁县| 张掖市| 伊宁县| 平凉市| 永川市| 定结县| 祁东县| 灵璧县| 盐山县| 新竹市| 乌兰察布市| 陆良县| 武功县| 新晃| 唐海县| 镇康县| 油尖旺区| 青铜峡市| 蒲江县| 芮城县| 沅江市| 虹口区| 涟源市| 镇康县| 于都县| 富源县| 迁西县| 突泉县| 郓城县| 呼和浩特市| 宜兴市| 陵川县| 南京市| 贞丰县| 银川市| 昌都县| 墨脱县|