日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

VMware在vSphere上驗證Alveo FPGA性能

星星科技指導員 ? 來源:Xilinx ? 作者:Xilinx ? 2022-06-03 11:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

硬件加速器已經(jīng)在數(shù)據(jù)中心變得司空見慣,大量新的工作負載已經(jīng)成熟,可以利用 FPGA 加速的優(yōu)勢及其更高的計算效率。對機器學習 (ML) 的快速增長的興趣正在推動在私有、公共和混合云數(shù)據(jù)中心環(huán)境中越來越多地采用 FPGA 加速器來加速這種計算密集型工作負載。作為促進 IT 基礎(chǔ)架構(gòu)向異構(gòu)計算轉(zhuǎn)型的一部分,我們最近與 VMware 合作在 vSphere上測試 FPGA 加速,VMware的云計算虛擬化平臺。鑒于賽靈思 FPGA 越來越多地用于 ML 推理加速,我們將展示如何將賽靈思 FPGA 與 VMware vSphere 結(jié)合使用,以實現(xiàn)虛擬和裸機部署之間幾乎相同的高吞吐量和低延遲 ML 推理性能。

自適應計算優(yōu)勢

FPGA 是自適應計算設(shè)備,可提供重新編程的靈活性以滿足所需應用程序的不同處理和功能要求。這一特性將 FPGA 與 GPUASIC 等固定架構(gòu)區(qū)分開來——更不用說定制 ASIC 飛漲的成本了。此外,與其他硬件加速器相比,F(xiàn)PGA 在實現(xiàn)高能效和低延遲方面也具有優(yōu)勢,這使得 FPGA 特別適用于 ML 推理任務(wù)。與 GPU 從根本上依賴大量并行處理內(nèi)核來實現(xiàn)高吞吐量不同,F(xiàn)PGA 可以通過定制的硬件內(nèi)核、數(shù)據(jù)流管道和互連同時實現(xiàn) ML 推理的高吞吐量和低延遲。

在 vSphere 上使用 Xilinx FPGA 進行 ML 推理

VMware 在他們的實驗室中使用 Xilinx Alveo U250 數(shù)據(jù)中心卡 進行測試。使用 Vitis AI中提供的 Docker 容器快速配置 ML 模型, Vitis AI是 Xilinx 統(tǒng)一開發(fā)堆棧,用于在 Xilinx 硬件平臺上從 Edge 到 Cloud 進行 ML 推理。它由優(yōu)化的工具、庫、模型和示例組成。Vitis AI 支持主流框架,包括 Caffe 和 TensorFlow,以及能夠執(zhí)行各種深度學習任務(wù)的最新模型。此外,Vitis AI 是開源的,可以在 GitHub 上訪問。

poYBAGKUOhaAWWRxAABjyRIuucA862.png

Vitis AI 軟件堆棧

目前,Xilinx FPGA 可以通過 DirectPath I/O 模式(直通)在 vSphere 上啟用。通過這種方式,我們的 FPGA 可以被運行在 VM 中的應用程序直接訪問,繞過虛擬機管理程序?qū)?,從而最大限度地提高性能并最大限度地減少延遲。在 DirectPath I/O 模式下配置 FPGA 是一個簡單的兩步過程:首先,在主機級別啟用 ESXi 上的設(shè)備,然后將設(shè)備添加到目標 VM。詳細說明可在此 VMware 知識庫文章中找到。請注意,如果您運行的是 vSphere 7,則不再需要重新引導主機。

高吞吐量、低延遲的機器學習推理性能

VMware 與 Xilinx 一起通過使用四個 CNN 模型運行推理來評估我們的 Alveo U250 加速卡在 DirectPath I/O 模式下的吞吐量和延遲性能:Inception_v1;初始_v2;資源網(wǎng)50;和 VGG16。這些模型的模型參數(shù)數(shù)量不同,因此具有不同的處理復雜性。

測試使用了配備兩個 10 核 Intel Xeon Silver 4114 CPU 和 192 GB DDR4 內(nèi)存的 Dell PowerEdge R740 服務(wù)器。我們使用了 ESXi 7.0 管理程序,并將每個模型的端到端性能結(jié)果與作為基準的裸機進行了比較。Ubuntu 16.04(內(nèi)核 4.4.0-116)用作來賓操作系統(tǒng)和本機操作系統(tǒng)。此外,Vitis AI v1.1 和 Docker CE 19.03.4 用于整個測試。使用從 ImageNet2012 派生的 50k 圖像數(shù)據(jù)集,為了進一步避免讀取圖像的磁盤瓶頸,創(chuàng)建了一個 RAM 磁盤并用于存儲 50k 圖像。

通過這些設(shè)置,虛擬和裸機測試之間的性能比較可以在以下兩張圖中查看,一張用于吞吐量,另一張用于延遲。y 軸是虛擬機和裸機之間的比率,y=1.0 表示虛擬機和裸機的性能相同。

pYYBAGKUOiGAZcb2AAA-wxzkd5U703.png

Xilinx Alveo U250 FPGA 機器學習推理的裸機和虛擬機吞吐量性能比較

pYYBAGKUOieAJctFAAA7mw1IcfU006.png

Xilinx Alveo U250 FPGA 機器學習推理的裸機和虛擬機延遲性能比較

測試驗證了虛擬機和裸機之間的性能差距上限為 2%,無論是吞吐量還是延遲。這表明在虛擬環(huán)境中用于 ML 推理的 vSphere 上的 Alveo U250 的性能幾乎與裸機基準相同。

云中的 FPGA 性能

FPGA 加速器在數(shù)據(jù)中心的采用正變得越來越普遍,并將繼續(xù)增加以滿足對異構(gòu)計算和性能提升的日益增長的需求。我們很高興與 VMware 合作,以確??蛻裟軌虺浞掷?vSphere 平臺上的 Xilinx FPGA 加速。我們的 Alveo U250 加速器在 vSphere for ML inference 上的測試成功地向客戶展示了通過 DirectPath I/O 模式實現(xiàn)的接近原生的性能。審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1664

    文章

    22509

    瀏覽量

    639582
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    18

    文章

    5780

    瀏覽量

    75215
  • 機器學習
    +關(guān)注

    關(guān)注

    67

    文章

    8567

    瀏覽量

    137263
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    請教:6G 確定性通信原型驗證,FPGA+SDR 方案該怎么搭?

    平臺選什么型號更適合做低時延空口驗證? 原型驗證階段,最小可行驗證系統(tǒng)應該包含哪些模塊? 有沒有類似確定性通信 / 硬實時通信的原型參考方案? 純技術(shù)探討,不涉及商業(yè)項目,希望做原型驗證
    發(fā)表于 04-11 10:24

    選擇AMD Alveo V80加速卡的五大理由

    AMD Alveo V80 加速卡專為需要實時加速的企業(yè)數(shù)據(jù)中心和云服務(wù)提供商而設(shè)計,它結(jié)合了可編程邏輯、片上高帶寬內(nèi)存( HBM )、高速網(wǎng)絡(luò)核心以及網(wǎng)絡(luò)直連接口,可實現(xiàn)實時性能。Alveo
    的頭像 發(fā)表于 04-10 14:59 ?371次閱讀

    深入解析IGLOO2 FPGA與SmartFusion2 SoC FPGA性能、規(guī)格與應用考量

    深入解析IGLOO2 FPGA與SmartFusion2 SoC FPGA性能、規(guī)格與應用考量 在當今電子設(shè)計領(lǐng)域,FPGA(現(xiàn)場可編程門陣列)和SoC
    的頭像 發(fā)表于 04-07 12:05 ?197次閱讀

    深入解析IGLOO2 FPGA與SmartFusion2 SoC FPGA性能、特性與應用

    深入解析IGLOO2 FPGA與SmartFusion2 SoC FPGA性能、特性與應用 在當今電子科技飛速發(fā)展的時代,現(xiàn)場可編程門陣列(FPGA)和片
    的頭像 發(fā)表于 04-07 11:55 ?243次閱讀

    FPGA音頻產(chǎn)品的應用案例

    FPGA(Field-Programmable Gate Array),現(xiàn)場可編程邏輯門陣列,它是一種電子設(shè)備,用于執(zhí)行任何(數(shù)字)邏輯功能或數(shù)字電路的硬件實現(xiàn)。它是作為專用集成電路(ASIC)領(lǐng)域中的一種半定制電路而出現(xiàn)的,既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點。
    的頭像 發(fā)表于 03-19 10:30 ?3844次閱讀
    <b class='flag-5'>FPGA</b><b class='flag-5'>在</b>音頻產(chǎn)品<b class='flag-5'>上</b>的應用案例

    比斯特綜合性能測試機提升電池組性能驗證效率精度

    深圳比斯特自動化設(shè)備有限公司推出的綜合性能測試機,憑通過技術(shù)創(chuàng)新重新定義了電池性能測試的標準,保證測試精度的同時,提升了驗證效率。
    的頭像 發(fā)表于 02-06 16:37 ?1132次閱讀
    比斯特綜合<b class='flag-5'>性能</b>測試機提升電池組<b class='flag-5'>性能</b><b class='flag-5'>驗證</b>效率精度

    AMD Alveo MA35D加速器:開啟大規(guī)模交互式流媒體新時代

    AMD Alveo MA35D加速器:開啟大規(guī)模交互式流媒體新時代 在當今全球視頻市場被直播主導的背景下,低延遲應用不斷涌現(xiàn),對基礎(chǔ)設(shè)施和視頻處理技術(shù)的成本結(jié)構(gòu)及部署策略產(chǎn)生了深遠影響。AMD推出
    的頭像 發(fā)表于 12-15 14:35 ?592次閱讀

    華為阿根廷完成拉美首次5G-A雙路徑性能驗證

    日,華為阿根廷首都布宜諾斯艾利斯市,于實驗室及商用站點,同時完成了Sub 3.5G 3CC CA,和毫米波+C-band CA兩種5G-A eMBB場景的性能驗證,分別達成了單用戶
    的頭像 發(fā)表于 11-14 16:33 ?1586次閱讀

    如何使用FPGA實現(xiàn)SRIO通信協(xié)議

    本例程詳細介紹了如何在FPGA實現(xiàn)Serial RapidIO(SRIO)通信協(xié)議,并通過Verilog語言進行編程設(shè)計。SRIO作為一種高速、低延遲的串行互連技術(shù),性能計算和嵌
    的頭像 發(fā)表于 11-12 14:38 ?6121次閱讀
    如何使用<b class='flag-5'>FPGA</b>實現(xiàn)SRIO通信協(xié)議

    NVMe高速傳輸之擺脫XDMA設(shè)計43:如何驗證

    仿真驗證之后, 搭建硬件測試平臺, 測試本IP實際應用環(huán)境中的功能與性能。本IP基于 Xilinx PCIe Integration Block 搭建, 常用的 PCIE 集成塊版本有
    發(fā)表于 10-30 18:10

    如何利用Verilog HDLFPGA實現(xiàn)SRAM的讀寫測試

    本篇將詳細介紹如何利用Verilog HDLFPGA實現(xiàn)SRAM的讀寫測試。SRAM是一種非易失性存儲器,具有高速讀取和寫入的特點。FPGA
    的頭像 發(fā)表于 10-22 17:21 ?4595次閱讀
    如何利用Verilog HDL<b class='flag-5'>在</b><b class='flag-5'>FPGA</b><b class='flag-5'>上</b>實現(xiàn)SRAM的讀寫測試

    搭建自己的ubuntu系統(tǒng)之VMware Tools安裝

    接下來安裝VMware Tools,如果不安裝該工具,Windows主機和虛擬機之間無法使用復制粘貼、文件拖拽。首先右擊VMware導航欄的“虛擬機”,然后在下拉框中點擊“安裝
    發(fā)表于 09-25 09:45

    ubuntu系統(tǒng)安裝之Vmware虛擬機安裝

    Linux操作系統(tǒng)有很多版本,我們選擇使用的是ubuntu18.04發(fā)行版。ubuntu是基于Debian派生的操作系統(tǒng),兼容性極強,ubuntu的特點是界面友好,容易上手。本文中的介紹及開發(fā)均是
    發(fā)表于 09-22 16:27

    使用VerilogFPGA實現(xiàn)FOC電機控制系統(tǒng)

    自動駕駛、電動滑板車、無人機甚至工業(yè)自動化領(lǐng)域,高性能電機控制是不可或缺的核心技術(shù)。而如果你對硬件有足夠的熱情,你會發(fā)現(xiàn):傳統(tǒng)用 MCU 實現(xiàn) FOC(Field-Oriented Control,磁場定向控制)也能“搬”到 FPGA
    的頭像 發(fā)表于 08-21 15:27 ?5644次閱讀
    使用Verilog<b class='flag-5'>在</b><b class='flag-5'>FPGA</b><b class='flag-5'>上</b>實現(xiàn)FOC電機控制系統(tǒng)

    降低adc不同PCB的噪聲,如何做到接近AD4134驗證板噪聲水平?

    ,。多片AD4134布局到一整版PCB,且PCB存在FPGA和大量DC/DC,LDO。 374ksps采樣率下,Nrms大約有1mvpp,(已采集過已知正弦波信號,波形特征正常)
    發(fā)表于 08-11 08:24
    定结县| 托里县| 建瓯市| 珠海市| 永胜县| 禹州市| 龙井市| 乌拉特后旗| 喀喇沁旗| 盐亭县| 林口县| 读书| 任丘市| 贵阳市| 漳州市| 曲靖市| 金坛市| 平南县| 芷江| 含山县| 百色市| 陕西省| 米泉市| 临漳县| 昌图县| 嘉荫县| 阳信县| 马山县| 泸定县| 沙雅县| 搜索| 宁德市| 交城县| 延边| 伊吾县| 赫章县| 师宗县| 和林格尔县| 江陵县| 教育| 大丰市|