日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

最新測(cè)試:NVIDIA的安培GPU測(cè)試性能是最先進(jìn) CPU的237倍

如意 ? 來源:雷鋒網(wǎng) ? 作者:包永剛 ? 2020-10-23 09:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

MLPerf組織今天發(fā)布最新的推理基準(zhǔn)測(cè)試(Benchmark)MLPerf Inference v0.7結(jié)果,總共有23個(gè)組織提交了結(jié)果,相比上一個(gè)版本(MLPerf Inference v0.5)的12個(gè)提交者增加了近一倍。

結(jié)果顯示,今年5月NVIDIA(Nvidia)發(fā)布的安培(Ampere)架構(gòu)A100 Tensor Core GPU,在云端推理的基準(zhǔn)測(cè)試性能是最先進(jìn)Intel CPU的237倍。

最新測(cè)試:NVIDIA的安培GPU測(cè)試性能是最先進(jìn) CPU的237倍

MLPerf Inference V0.7部分結(jié)果截圖

最新的AI推理測(cè)試結(jié)果意味著,NVIDIA未來可能在AI推理和訓(xùn)練市場(chǎng)都占據(jù)領(lǐng)導(dǎo)地位,給云端AI推理市場(chǎng)擁有優(yōu)勢(shì)的Intel帶來更大壓力的同時(shí),也將讓其他追趕者面臨更大挑戰(zhàn)。

MLPerf推理基準(zhǔn)測(cè)試進(jìn)一步完善的價(jià)值

與2019年的MLPerf Inference v0.5版本相比,最新的0.7版本將測(cè)試從AI研究的核心視覺和語言的5項(xiàng)測(cè)試,擴(kuò)展了到了包括推薦系統(tǒng)、自然語言理解、語音識(shí)別和醫(yī)療影像應(yīng)用的6項(xiàng)測(cè)試,并且有分別針對(duì)云端和終端推理的測(cè)試,還加入了手機(jī)和筆記本電腦的結(jié)果。

擴(kuò)展的測(cè)試項(xiàng)從MLPerf和業(yè)界兩個(gè)角度都有積極意義。

最新測(cè)試:NVIDIA的安培GPU測(cè)試性能是最先進(jìn) CPU的237倍

任何一個(gè)基準(zhǔn)測(cè)試都需要給業(yè)界具有參考價(jià)值的指標(biāo)。MLPerf基準(zhǔn)測(cè)試是在業(yè)界缺乏對(duì)AI芯片公認(rèn)的評(píng)價(jià)標(biāo)準(zhǔn)的2018年誕生,因此,MLPerf組織既需要給出各方都認(rèn)可的成績(jī),還需要根據(jù)AI行業(yè)的發(fā)展完善評(píng)價(jià)標(biāo)準(zhǔn)。

不過,AI行業(yè)發(fā)展迅速,AI模型的參數(shù)越來越多,應(yīng)用的場(chǎng)景也越來越廣泛。評(píng)價(jià)AI芯片和系統(tǒng)的推理性能需要涵蓋可編程性、延遲、準(zhǔn)確性、模型大小、吞吐量、能效等指標(biāo),也需要選擇更具指導(dǎo)價(jià)值的模型和應(yīng)用。

此次增加的推薦系統(tǒng)測(cè)試對(duì)于互聯(lián)網(wǎng)公司意義重大。在王喆的《深度學(xué)習(xí)推薦系統(tǒng)》一書中提到,2019年天貓“雙11”的成交額是2684億元,假設(shè)推薦系統(tǒng)進(jìn)行了優(yōu)化,整體的轉(zhuǎn)化率提高1%,那么增加的成交額大約為26.84億元。

另外,MLPerf Inference v0.7中增加醫(yī)療影像3D U-Net模型測(cè)試與新冠大流行以及AI在醫(yī)療行業(yè)的重要性與日俱增密切相關(guān),比如一家初創(chuàng)公司使用AI簡(jiǎn)化了超聲心電圖的采集工作,在新冠大流行初期發(fā)揮了作用。

基準(zhǔn)測(cè)試從v0.5到v0.7,能夠?yàn)橐x用AI芯片和系統(tǒng)的公司提供更直觀和有價(jià)值的參考是MLPerf基準(zhǔn)測(cè)試的價(jià)值所在,比如,幫助金融結(jié)構(gòu)的會(huì)話式AI更快速回答客戶問題,幫助零售商使用AI保證貨架庫存充足。

與此同時(shí),這也將促進(jìn)MLPerf組織在業(yè)界的受認(rèn)可程度,從接近翻倍的提交成績(jī)的組織就能看出來。

GPU云端推理性能最高是CPU的237倍

過去幾年,云端AI訓(xùn)練市場(chǎng)NVIDIA擁有絕對(duì)優(yōu)勢(shì),云端AI推理市場(chǎng)被Intel賺取了大部分利潤是事實(shí)。這讓不少人都產(chǎn)生了GPU更適合訓(xùn)練而CPU更適合推理的認(rèn)知,但MLPerf最新的推理測(cè)試結(jié)果可能會(huì)改變這一觀點(diǎn)。

MLPerf Inference V0.7的測(cè)試結(jié)果顯示,在數(shù)據(jù)中心OFFLINE(離線)測(cè)試模式下,賽靈思U250和IntelCooper Lake在各個(gè)測(cè)試模型下與NVIDIAT4的差距不大,但A100對(duì)比CPU、FPGA和自家的T4就有明顯的性能差距。

在SERVER模式下的推薦系統(tǒng)DLRM模型下,A100 GPU對(duì)比IntelCooper Lake有最高237倍的性能差距,在其他模型下也有比較顯著的差距。值得注意的是,Intel的Cooper Lake系統(tǒng)的狀態(tài)還是預(yù)覽,其余三款芯片的系統(tǒng)都已經(jīng)可用。

A100 GPU的優(yōu)勢(shì)也在邊緣推理中也十分明顯。在單數(shù)據(jù)流(Singel-Stream)測(cè)試中,A100對(duì)比NVIDIAT4和面向邊緣終端的NVIDIAJetson AGX Xavier有幾倍到十幾倍的性能優(yōu)勢(shì)。在多數(shù)據(jù)流(Multi-Stream)測(cè)試中,A100對(duì)比另外兩款自家產(chǎn)品在不同AI模型中有幾倍到二十多倍的性能優(yōu)勢(shì)。

在邊緣OFFLINE模式下,A100對(duì)比T4和Jetson AGX Xavier也有幾倍到二十多倍的性能優(yōu)勢(shì)。

這很好地說明A100的安培架構(gòu)以及其第三代Tensor Core優(yōu)勢(shì)的同時(shí),也表明了NVIDIA能夠覆蓋整個(gè)AI推理市場(chǎng)。

在此次提交結(jié)果的23家公司中,除了NVIDIA外還有11家其合作伙伴提交了基于NVIDIA GPU的1029個(gè)測(cè)試結(jié)果,占數(shù)據(jù)中心和邊緣類別中參評(píng)測(cè)試結(jié)果總數(shù)的85%以上。

從提交結(jié)果的合作伙伴的系統(tǒng)中可以看到,NVIDIAT4仍然是企業(yè)的邊緣服務(wù)器推理平臺(tái)的主要選擇。A100提升到新高度的性能意味著未來企業(yè)邊緣服務(wù)器在選擇AI推理平臺(tái)的時(shí)候,可以從T4升級(jí)到A100,對(duì)于功耗受限的設(shè)備,可以選擇Jeston系列產(chǎn)品。

特別值得注意的是,NVIDIA GPU首次在公有云中實(shí)現(xiàn)了超越CPU的AI推理能力。

臨界點(diǎn)到來?AI推理芯片市場(chǎng)競(jìng)爭(zhēng)門檻更高

五年前,只有少數(shù)領(lǐng)先的高科技公司使用GPU進(jìn)行推理。如今,NVIDIAGPU首次在公有云市場(chǎng)實(shí)現(xiàn)超越CPU的AI推理能力,或許意味著AI推理市場(chǎng)臨界點(diǎn)的到來。NVIDIA還預(yù)測(cè),基于其GPU的總體云端AI推理計(jì)算能力每?jī)赡暝鲩L約10倍,增長速度高于CPU。

另外,NVIDIA還強(qiáng)調(diào)基于A100高性能系統(tǒng)的成本效益。NVIDIA表示,一套DGX A100系統(tǒng)可以提供相當(dāng)于近1000臺(tái)雙插槽CPU服務(wù)器的性能,能為客戶AI推薦系統(tǒng)模型從研發(fā)走向生產(chǎn)的過程,具有極高的成本效益。

同時(shí),NVIDIA也在不斷優(yōu)化推理軟件堆棧,進(jìn)一步提升在推理市場(chǎng)的競(jìng)爭(zhēng)力。

最先感受到影響的會(huì)是Intel,但在云端AI推理市場(chǎng)體現(xiàn)出顯著變化至少需要幾年時(shí)間,因?yàn)槠髽I(yè)在更換平臺(tái)的時(shí)候會(huì)更加謹(jǐn)慎,生態(tài)的護(hù)城河此時(shí)也更能體現(xiàn)出價(jià)值。

但無論如何,我們都看到NVIDIA在AI市場(chǎng)的強(qiáng)勢(shì)地位。雷鋒網(wǎng)七月底報(bào)道,在MLPerf發(fā)布的MLPerf Training v0.7基準(zhǔn)測(cè)試中,A100 Tensor Core GPU,和HDR InfiniBand實(shí)現(xiàn)多個(gè)DGX A100 系統(tǒng)互聯(lián)的龐大集群DGX SuperPOD系統(tǒng)在性能上開創(chuàng)了八個(gè)全新里程碑,共打破16項(xiàng)紀(jì)錄。

安培架構(gòu)A100在MLPerf最新的訓(xùn)練和推理成績(jī)表明NVIDIA不僅給云端AI訓(xùn)練的競(jìng)爭(zhēng)者更大的壓力,也可能改變AI推理市場(chǎng)的格局。

NVIDIA將其在云端訓(xùn)練市場(chǎng)的優(yōu)勢(shì)進(jìn)一步拓展到云端和邊緣推理市場(chǎng)符合AI未來的發(fā)展趨勢(shì)。有預(yù)測(cè)指出,隨著AI模型的成熟,市場(chǎng)對(duì)云端AI訓(xùn)練需求的增速將會(huì)降低,云端AI推理的市場(chǎng)規(guī)模將會(huì)迅速增加,并有望在2022年超過訓(xùn)練市場(chǎng)。

另據(jù)市場(chǎng)咨詢公司ABI Research的數(shù)據(jù),預(yù)計(jì)到2025年,邊緣AI芯片市場(chǎng)收入將達(dá)到122億美元,云端AI芯片市場(chǎng)收入將達(dá)到119億美元,邊緣AI芯片市場(chǎng)將超過云端AI芯片市場(chǎng)。

憑借強(qiáng)大的軟硬件生態(tài)系統(tǒng),NVIDIA和Intel依舊會(huì)是AI市場(chǎng)的重要玩家,只是隨著他們競(jìng)爭(zhēng)力的不斷提升,其他參與AI市場(chǎng)競(jìng)爭(zhēng)的AI芯片公司們面臨的壓力也隨之增加。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11343

    瀏覽量

    226045
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5707

    瀏覽量

    110154
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5296

    瀏覽量

    136121
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    TPS54373EVM - 237評(píng)估模塊深度解析

    - 237評(píng)估模塊,從其背景、性能規(guī)格、測(cè)試結(jié)果到板級(jí)布局和物料清單,全方位剖析這款模塊的特點(diǎn)和應(yīng)用。 文件下載: TPS54373EVM-237.pdf 一、模塊背景與特性 1.1
    的頭像 發(fā)表于 04-24 14:55 ?255次閱讀

    雷達(dá)性能測(cè)試怎么做?設(shè)備故障在雷達(dá)性能測(cè)試時(shí)如何有效避免?

    雷達(dá)性能測(cè)試是指通過一系列標(biāo)準(zhǔn)化程序和技術(shù)手段,對(duì)雷達(dá)系統(tǒng)的各項(xiàng)性能指標(biāo)進(jìn)行測(cè)量和評(píng)估的過程。其目的是驗(yàn)證雷達(dá)設(shè)備在不同環(huán)境條件下是否能夠穩(wěn)定、準(zhǔn)確地執(zhí)行探測(cè)、跟蹤和識(shí)別任務(wù),確保其符合設(shè)計(jì)要求
    的頭像 發(fā)表于 04-22 15:21 ?107次閱讀
    雷達(dá)<b class='flag-5'>性能</b><b class='flag-5'>測(cè)試</b>怎么做?設(shè)備故障在雷達(dá)<b class='flag-5'>性能</b><b class='flag-5'>測(cè)試</b>時(shí)如何有效避免?

    散熱器需要做哪些測(cè)試?需要哪些設(shè)備?測(cè)試流程和標(biāo)準(zhǔn)是什么?

    散熱器性能測(cè)試是評(píng)估散熱器在不同條件下的散熱效率、通風(fēng)阻力、溫度分布等關(guān)鍵性能指標(biāo)的過程。通常涉及到一系列的實(shí)驗(yàn)和測(cè)量,以確定散熱器如何有效地將熱量從熱源(如CPU
    的頭像 發(fā)表于 04-16 15:11 ?259次閱讀
    散熱器需要做哪些<b class='flag-5'>測(cè)試</b>?需要哪些設(shè)備?<b class='flag-5'>測(cè)試</b>流程和標(biāo)準(zhǔn)是什么?

    NVIDIA推出Vera CPU以顯著提升系統(tǒng)性能與能效

    NVIDIA 今日發(fā)布 NVIDIA Vera CPU,這是全球首款專為代理式 AI 與強(qiáng)化學(xué)習(xí)時(shí)代打造的處理器,其效率是傳統(tǒng)機(jī)架級(jí) CPU 的 2
    的頭像 發(fā)表于 03-18 14:33 ?1903次閱讀

    借助NVIDIA CUDA Tile IR后端推進(jìn)OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計(jì)目標(biāo)是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限
    的頭像 發(fā)表于 02-10 10:31 ?562次閱讀

    先進(jìn)封裝時(shí)代,芯片測(cè)試面臨哪些新挑戰(zhàn)?

    架構(gòu);封裝前需確保芯粒為 KGD 以避免高價(jià)值封裝體報(bào)廢,推高測(cè)試成本;高密度封裝使測(cè)試時(shí)散熱困難,易引發(fā)誤判。先進(jìn)封裝要求測(cè)試工程師兼具多領(lǐng)域知識(shí),
    的頭像 發(fā)表于 02-05 10:41 ?634次閱讀

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升級(jí)迭代產(chǎn)品,其各項(xiàng)核心指標(biāo)均針對(duì) GPU 加速工作流的高性能
    的頭像 發(fā)表于 01-06 09:51 ?4449次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度評(píng)測(cè)

    NVIDIA RTX PRO 4000 Blackwell GPU性能測(cè)試

    Generation 的全面超越。那么,這款劃時(shí)代的專業(yè) GPU 在真實(shí)應(yīng)用場(chǎng)景中的表現(xiàn)究竟如何?今天,我們將通過深度實(shí)測(cè),為您揭曉 NVIDIA RTX PRO 4000 Blackwell 相較于前代產(chǎn)品的性能躍遷。
    的頭像 發(fā)表于 12-29 15:30 ?1966次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 Blackwell <b class='flag-5'>GPU</b><b class='flag-5'>性能</b><b class='flag-5'>測(cè)試</b>

    NVIDIA RTX PRO 2000 Blackwell GPU性能測(cè)試

    越來越多的應(yīng)用正在使用 AI 加速,而無論工作站的大小或形態(tài)如何,都有越來越多的用戶需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的頭像 發(fā)表于 11-28 09:39 ?7169次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b><b class='flag-5'>性能</b><b class='flag-5'>測(cè)試</b>

    NVIDIA RTX PRO 4500 Blackwell GPU測(cè)試分析

    今天我們帶來全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測(cè)試,對(duì)比上一代產(chǎn)品
    的頭像 發(fā)表于 08-28 11:02 ?4464次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b><b class='flag-5'>測(cè)試</b>分析

    NVIDIA桌面GPU系列擴(kuò)展新產(chǎn)品

    NVIDIA 桌面 GPU 系列擴(kuò)展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的頭像 發(fā)表于 08-18 11:50 ?1692次閱讀

    NVIDIA Jetson AGX Thor開發(fā)者套件概述

    NVIDIA Jetson AGX Thor 開發(fā)者套件為您提供出色的性能和可擴(kuò)展性。它由 NVIDIA Blackwell GPU和128 GB 顯存提供動(dòng)力支持,提供高達(dá) 2070
    的頭像 發(fā)表于 08-11 15:03 ?2111次閱讀

    PCIe協(xié)議分析儀能測(cè)試哪些設(shè)備?

    :提升數(shù)據(jù)中心的整體效率,降低CPU負(fù)載。 四、異構(gòu)計(jì)算與擴(kuò)展設(shè)備 多GPU系統(tǒng) 測(cè)試場(chǎng)景:利用PCIe協(xié)議分析儀模擬高負(fù)載的GPU間通信,測(cè)試
    發(fā)表于 07-25 14:09

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場(chǎng)景中的性能紀(jì)錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 個(gè) NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場(chǎng)景中的性能紀(jì)錄:在 G
    的頭像 發(fā)表于 07-02 19:31 ?3656次閱讀
    <b class='flag-5'>NVIDIA</b> Blackwell <b class='flag-5'>GPU</b>優(yōu)化DeepSeek-R1<b class='flag-5'>性能</b> 打破DeepSeek-R1在最小延遲場(chǎng)景中的<b class='flag-5'>性能</b>紀(jì)錄

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    。。) 原理學(xué)習(xí) 在「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」書中,作者詳解了從帕斯卡架構(gòu)到40系的Hopper架構(gòu)的技術(shù)演變進(jìn)化,按照出版時(shí)間算是囊括了NVIDIA
    發(fā)表于 06-18 19:31
    丰原市| 华安县| 连城县| 蕲春县| 盐城市| 综艺| 辽源市| 新乡县| 巩留县| 盖州市| 浙江省| 河南省| 安义县| 固安县| 铁岭市| 和田市| 深圳市| 赤壁市| 新田县| 昌江| 彭泽县| 三原县| 望都县| 建宁县| 徐闻县| 西乡县| 额济纳旗| 海南省| 西畴县| 新建县| 涿州市| 郎溪县| 滕州市| 界首市| 琼中| 博罗县| 宁国市| 高邮市| 泊头市| 诸暨市| 湾仔区|