日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

賽靈思FPGA與VMware vSphere相結(jié)合實(shí)現(xiàn)高吞吐量、低時(shí)延ML推斷性能

454398 ? 來(lái)源:Xilinx賽靈思官微 ? 作者:Xilinx賽靈思官微 ? 2020-09-29 11:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

硬件加速器已在數(shù)據(jù)中心得到普遍使用,一系列新的工作負(fù)載已經(jīng)能夠成熟地發(fā)揮 FPGA 的加速優(yōu)勢(shì)及其更優(yōu)異的計(jì)算效率。業(yè)界對(duì)機(jī)器學(xué)習(xí) (ML) 的關(guān)注度不斷提高,推動(dòng) FPGA 加速器在私有云、公有云、混合云數(shù)據(jù)中心環(huán)境中日益普及,從而為計(jì)算密集型工作負(fù)載加速。近期,在推動(dòng) IT 基礎(chǔ)設(shè)施向異構(gòu)計(jì)算轉(zhuǎn)型的過(guò)程中,賽靈思與 VMware 展開(kāi)協(xié)作,在 VMware 的云計(jì)算虛擬化平臺(tái)vSphere上測(cè)試 FPGA 加速。由于賽靈思 FPGA 越來(lái)越廣泛地應(yīng)用于 ML 推斷加速,本文將展示的是如何將賽靈思 FPGA 與 VMware vSphere 相結(jié)合,在虛擬部署和裸機(jī)部署上實(shí)現(xiàn)基本相同的高吞吐量、低時(shí)延 ML 推斷性能。

“自適應(yīng)計(jì)算”的優(yōu)勢(shì)
FPGA 是一種自適應(yīng)計(jì)算器件,能夠靈活地進(jìn)行重新編程,從而滿足目標(biāo)應(yīng)用不同的處理需求和功能要求。該特性使 FPGA 從 GPUASIC 等架構(gòu)固定的器件中脫穎而出,更是遠(yuǎn)遠(yuǎn)優(yōu)于成本不斷飆升的的定制 ASIC。此外,與其他硬件加速器相比,F(xiàn)PGA 還具備高能效、低時(shí)延的優(yōu)勢(shì),使 FPGA 特別適用于 ML 推斷工作。與基本依靠大量并行處理核心實(shí)現(xiàn)高吞吐量的 GPU 不同的是,F(xiàn)PGA 通過(guò)定制化硬件內(nèi)核、數(shù)據(jù)流流水線和互聯(lián),助力 ML 推斷同時(shí)實(shí)現(xiàn)高吞吐量和低時(shí)延。

01. 在 vSphere 上使用 FPGA 開(kāi)展 ML 推斷

VMware 在其實(shí)驗(yàn)室中使用賽靈思 Alveo U250 數(shù)據(jù)中心卡進(jìn)行測(cè)試。使用在Vitis AI中提供的 Docker 容器——為從邊緣到云端的賽靈思硬件平臺(tái)提供的 ML 推斷統(tǒng)一開(kāi)發(fā)棧,ML 模型可以迅速完成配置。該容器由經(jīng)過(guò)優(yōu)化的工具、庫(kù)、模型和示例構(gòu)成。Vitis AI 支持含 Caffe 和 TensorFlow 在內(nèi)的主流框架以及能夠執(zhí)行多種深度學(xué)習(xí)任務(wù)的最新模型。此外,Vitis AI 是一種開(kāi)源應(yīng)用,可通過(guò)訪問(wèn)GitHub獲取。

賽靈思FPGA與VMware vSphere相結(jié)合實(shí)現(xiàn)高吞吐量、低時(shí)延ML推斷性能

圖 1:Vitis AI 軟件協(xié)議棧

目前,賽靈思 FPGA 通過(guò) DirectPath I/O 模式(直通模式)能在 vSphere 上使用。在這種模式下,我們的 FPGA 能夠由運(yùn)行在虛擬機(jī)內(nèi)部的應(yīng)用直接訪問(wèn),繞過(guò)程序管理層,從而最大化性能并最大限度降低時(shí)延。配置 DirectPath I/O 模式下的 FPGA 只需簡(jiǎn)單的兩步流程:首先,在主機(jī)層面上啟用 ESXi,然后將器件添加到目標(biāo)虛擬機(jī)。詳細(xì)操作方法參見(jiàn) VMware KB 一文( https://kb.vmware.com/s/article/1010789 )。請(qǐng)注意,如果運(yùn)行的是 vSphere 7,則不再需要重啟主機(jī)。

02. 高吞吐量、低時(shí)延 ML 推斷性能

通過(guò)與賽靈思合作,VMware 使用四個(gè) CNN 模型執(zhí)行推斷任務(wù),對(duì)我們的 Alveo U250 加速器卡在 DirectPath I/O 模式工作下的吞吐量和時(shí)延性能進(jìn)行評(píng)估。這四個(gè)模型分別為Inception_v1、Inception_v2、Resnet50 和 VGG16。這些模型在模型參數(shù)數(shù)量上不盡相同,因而具備不同的處理復(fù)雜性。

測(cè)試在搭載兩顆 10 核 Intel Xeon Silver 4114 CPU 和 192GB DDR4 存儲(chǔ)器的 Dell PowerEdge R740 服務(wù)器上進(jìn)行。我們使用 ESXi 7.0 虛擬機(jī)程序管理器,將每種模型的端到端性能結(jié)果與作為基線的裸機(jī)性能進(jìn)行對(duì)比。Ubuntu 16.04(內(nèi)核版本 4.4.0-116)用作客戶端操作系統(tǒng)和本地操作系統(tǒng)。此外,在整個(gè)測(cè)試過(guò)程中將 Vitis AI v1.1 與 Docker CE 19.03.4 結(jié)合使用。同時(shí)使用源于 ImageNet2012 的 50k 圖像數(shù)據(jù)集。為進(jìn)一步避免圖像讀取過(guò)程中遭遇磁盤(pán)瓶頸,還創(chuàng)建了一個(gè) RAM 磁盤(pán)用于存儲(chǔ) 50k 圖像。

完成這些設(shè)置后,虛擬測(cè)試和裸機(jī)測(cè)試之間的性能比較可從下面的兩個(gè)圖中進(jìn)行觀察。一個(gè)針對(duì)吞吐量,另一個(gè)針對(duì)時(shí)延。y 軸代表虛擬測(cè)試和裸機(jī)測(cè)試間的吞吐量性能比值。y=1.0 代表虛擬測(cè)試和裸機(jī)測(cè)試的吞吐量性能結(jié)果相同。

圖 2:在 Alveo U250 FPGA 上運(yùn)行 ML 推斷時(shí)裸機(jī)測(cè)試和虛擬測(cè)試的吞吐量性能比較

圖 3:在 Alveo U250 FPGA 上運(yùn)行 ML 推斷時(shí)裸機(jī)測(cè)試和虛擬測(cè)試的時(shí)延性能比較

測(cè)試證明,虛擬環(huán)境和裸機(jī)間在吞吐量和時(shí)延兩方面的性能差距最大不超過(guò) 2%。這說(shuō)明在虛擬環(huán)境中運(yùn)行在 vSphere 上的 Alveo U250 的 ML 性能與作為基線的裸機(jī)性能極為相近。

03. 云端的 FPGA 性能

在數(shù)據(jù)中心中采用 FPGA 加速器已成為普遍現(xiàn)象,而且為滿足對(duì)異構(gòu)計(jì)算和性能提升的需求,F(xiàn)PGA 加速器的應(yīng)用還將繼續(xù)增長(zhǎng)。我們非常高興能夠與 VMware 展開(kāi)合作,共同確保客戶能充分發(fā)揮運(yùn)行在 vSphere 平臺(tái)上的賽靈思 FPGA 加速的全部?jī)?yōu)勢(shì)。我們?cè)?vSphere 上對(duì)我們的 Alveo U250 加速器卡進(jìn)行 ML 推斷性能測(cè)試,成功地向客戶證明了該器件在 DirectPath I/O 模式下能夠?qū)崿F(xiàn)接近裸機(jī)的性能。

編輯:hfy


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1664

    文章

    22509

    瀏覽量

    639518
  • 賽靈思
    +關(guān)注

    關(guān)注

    33

    文章

    1798

    瀏覽量

    133678
  • 云計(jì)算
    +關(guān)注

    關(guān)注

    39

    文章

    8044

    瀏覽量

    144802
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8567

    瀏覽量

    137255
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    使用 LPC55S69 和 MCUX 驅(qū)動(dòng)程序的 CDC 應(yīng)該實(shí)現(xiàn)什么樣的吞吐量

    ,使用 LPC55S69 和 MCUX 驅(qū)動(dòng)程序的 CDC 應(yīng)該實(shí)現(xiàn)什么樣的吞吐量? 特別是,我想知道 CDC 驅(qū)動(dòng)程序是否針對(duì)性能進(jìn)行了優(yōu)化,或者它是否設(shè)計(jì)為將復(fù)雜性降至最低。我試圖避免切換到高速 USB
    發(fā)表于 04-16 09:20

    基于openEuler平臺(tái)的CPU、GPU與FPGA異構(gòu)加速實(shí)戰(zhàn)

    隨著 AI、視頻處理、加密和高性能計(jì)算需求的增長(zhǎng),單一 CPU 已無(wú)法滿足延遲、吞吐量的計(jì)算需求。openEuler 作為面向企業(yè)和云端的開(kāi)源操作系統(tǒng),在 多樣算力支持 方面表現(xiàn)出
    的頭像 發(fā)表于 04-08 11:02 ?897次閱讀
    基于openEuler平臺(tái)的CPU、GPU與<b class='flag-5'>FPGA</b>異構(gòu)加速實(shí)戰(zhàn)

    AD7739:高精度、吞吐量模擬前端ADC的深度解析

    AD7739:高精度、吞吐量模擬前端ADC的深度解析 在電子工程師的日常工作中,高精度、吞吐量的模擬前端ADC是實(shí)現(xiàn)高質(zhì)量信號(hào)采集和處理
    的頭像 發(fā)表于 04-07 17:20 ?483次閱讀

    AD7731:低噪聲、吞吐量的24位Sigma - Delta ADC

    AD7731:低噪聲、吞吐量的24位Sigma - Delta ADC 在電子工程師的日常設(shè)計(jì)中,一款性能優(yōu)異的模數(shù)轉(zhuǎn)換器(ADC)至關(guān)重要。今天我們就來(lái)詳細(xì)探討一下Analog Devices
    的頭像 發(fā)表于 04-07 11:45 ?218次閱讀

    FPGA電源解決方案全解析

    FPGA電源解決方案全解析 在當(dāng)今的電子設(shè)計(jì)領(lǐng)域,現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)憑借其出色的設(shè)計(jì)靈活性和較低的工程成本,在眾多應(yīng)用和終端
    的頭像 發(fā)表于 04-02 15:45 ?241次閱讀

    高精度吞吐量ADC——AD7732的特性與應(yīng)用分析

    高精度吞吐量ADC——AD7732的特性與應(yīng)用分析 在當(dāng)今的工業(yè)和自動(dòng)化領(lǐng)域,高精度的模擬信號(hào)采集和處理至關(guān)重要。AD7732作為一款高性能的24位Σ - Δ ADC,為工程師們?cè)谠O(shè)計(jì)高分辨率
    的頭像 發(fā)表于 04-01 16:10 ?134次閱讀

    基于FPGA的DAQ系統(tǒng)|實(shí)現(xiàn)性能數(shù)據(jù)采集的挑戰(zhàn)

    性能和靈活性備受關(guān)注。FPGA,就像一塊可以根據(jù)我們需求“變形”的芯片,可高速并行處理大量數(shù)據(jù),實(shí)現(xiàn)傳統(tǒng)處理器難以達(dá)到的延遲和高性能,使
    的頭像 發(fā)表于 03-30 15:38 ?507次閱讀
    基于<b class='flag-5'>FPGA</b>的DAQ系統(tǒng)|<b class='flag-5'>實(shí)現(xiàn)</b>高<b class='flag-5'>性能</b>數(shù)據(jù)采集的挑戰(zhàn)

    歐洲快遞行業(yè)巨頭部署全新Matrix 830/930系統(tǒng)以應(yīng)對(duì)吞吐量業(yè)務(wù)

    迅速的市場(chǎng)認(rèn)可,有力地證實(shí)了該新產(chǎn)品的戰(zhàn)略意義。 該決定是在經(jīng)過(guò)嚴(yán)格的基準(zhǔn)測(cè)試、性能對(duì)比以及真實(shí)運(yùn)行條件下的現(xiàn)場(chǎng)驗(yàn)證后做出的。在評(píng)估了其他配置方案后,客戶確認(rèn)新款 Matrix 830/930 是其吞吐量物流環(huán)境下的最優(yōu)解決方
    的頭像 發(fā)表于 03-17 16:46 ?843次閱讀

    羅德與施瓦茨攜手瑞昱展示藍(lán)牙低功耗數(shù)據(jù)吞吐量測(cè)試解決方案

    羅德與施瓦茨(以下簡(jiǎn)稱(chēng)“R&S”)與瑞昱半導(dǎo)體已成功驗(yàn)證了業(yè)界首個(gè)針對(duì)即將推出的藍(lán)牙 低功耗數(shù)據(jù)吞吐量(HDT)功能的測(cè)試解決方案。雙方將聯(lián)合在2026年巴塞羅那世界移動(dòng)通信大會(huì)(以下簡(jiǎn)稱(chēng)
    的頭像 發(fā)表于 03-09 13:57 ?610次閱讀
    羅德與施瓦茨攜手瑞昱展示藍(lán)牙低功耗<b class='flag-5'>高</b>數(shù)據(jù)<b class='flag-5'>吞吐量</b>測(cè)試解決方案

    用“分區(qū)”來(lái)面對(duì)超大數(shù)據(jù)集和超大吞吐量

    分區(qū)(partitions) 也被稱(chēng)為 分片(sharding),通常采用對(duì)數(shù)據(jù)進(jìn)行分區(qū)的方式來(lái)增加系統(tǒng)的 可伸縮性,以此來(lái)面對(duì)非常大的數(shù)據(jù)集或非常吞吐量,避免出現(xiàn)熱點(diǎn)。
    的頭像 發(fā)表于 12-30 16:40 ?297次閱讀
    用“分區(qū)”來(lái)面對(duì)超大數(shù)據(jù)集和超大<b class='flag-5'>吞吐量</b>

    如何加速實(shí)時(shí)工作負(fù)載

    對(duì)于需要實(shí)時(shí)響應(yīng)的數(shù)據(jù)中心工作負(fù)載,性能不僅是指原始吞吐量或處理能力。挑戰(zhàn)在于:在保持吞吐量和能效的同時(shí),實(shí)現(xiàn)確定性時(shí)
    的頭像 發(fā)表于 09-10 15:36 ?821次閱讀

    使用羅德與施瓦茨CMX500的吞吐量應(yīng)用層測(cè)試方案

    5G NR(New Radio)吞吐量應(yīng)用層測(cè)試是評(píng)估5G網(wǎng)絡(luò)性能的一個(gè)重要方面,它主要關(guān)注的是在實(shí)際應(yīng)用條件下,用戶能夠體驗(yàn)到的數(shù)據(jù)傳輸速率。這種測(cè)試通常包括了對(duì)下行鏈路和上行鏈路的吞吐量進(jìn)行測(cè)量,以確保網(wǎng)絡(luò)可以滿足各種應(yīng)用場(chǎng)
    的頭像 發(fā)表于 09-02 13:56 ?8181次閱讀
    使用羅德與施瓦茨CMX500的<b class='flag-5'>吞吐量</b>應(yīng)用層測(cè)試方案

    CY7C65211 作為 SPI 從機(jī)模式工作時(shí)每秒的最大吞吐量是多少?

    CY7C65211 作為 SPI 從機(jī)模式工作時(shí)每秒的最大吞吐量是多少? 有實(shí)際的測(cè)試數(shù)據(jù)嗎?
    發(fā)表于 05-27 07:38

    如何在Visual Studio 2022中運(yùn)行FX3吞吐量基準(zhǔn)測(cè)試工具?

    我正在嘗試運(yùn)行 John Hyde 的書(shū)“SuperSpeed by Design”中的 FX3 吞吐量基準(zhǔn)測(cè)試工具。 但是,我面臨一些困難,希望得到任何指導(dǎo)。 具體來(lái)說(shuō),我正在使用 Visual
    發(fā)表于 05-13 08:05

    FX3進(jìn)行讀或?qū)懖僮鲿r(shí)CS信號(hào)拉,在讀或?qū)懲瓿珊驝S置,對(duì)吞吐量有沒(méi)有影響?

    從盡可能提高吞吐量的角度看,在進(jìn)行讀或?qū)懖僮鲿r(shí)CS信號(hào)拉,在讀或?qū)懲瓿珊驝S置,對(duì)吞吐量有沒(méi)有影響,還是應(yīng)該CS一直拉比較好。
    發(fā)表于 05-08 07:13
    土默特右旗| 博爱县| 三门县| 深圳市| 清原| 深州市| 虹口区| 玉环县| 新巴尔虎左旗| 陆丰市| 华池县| 南乐县| 岫岩| 教育| 遵义市| 钦州市| 葵青区| 德钦县| 菏泽市| 高台县| 鱼台县| 通辽市| 平泉县| 静安区| 宿松县| 会理县| 汤原县| 天等县| 祁门县| 长子县| 兰坪| 双牌县| 石嘴山市| 土默特右旗| 潍坊市| 丰城市| 封开县| 景东| 瓮安县| 三都| 南昌县|