日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達GPU Direct不可或缺的RMDA技術到底有多厲害?

SSDFans ? 來源:楊湘祁 ? 作者:電子發(fā)燒友 ? 2019-03-01 13:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

和娛樂圈的明星八卦一樣,IT行業(yè)里面的各種并購也是非常有市場的。畢竟,像EMC,Cisco,Broadcom 這樣的公司都是一路并購成長起來的。最近比較熱門的應該是Mellanox說自己準備賣自己了。在25G/50G/100G市場上占據(jù)了69%的市場份額,2018年前三個季度,出貨了2.1M的網(wǎng)絡端口。[1] 這么好的標的,一時各種傳聞都出來了。Xilinx[2],Microsoft[3],Intel[4],估計還有Broadcom[5]都在準備,以色列人的確有水平,已經(jīng)從5.5B到了6B。陳福陽在華爾街籌錢的能力,估計還有大招。

Mellanox是個什么公司,一句話,就是目前RDMA技術的事實的技術定義者。雖然海有很多公司也有RDMA技術,但是在IB和Ethernet兩個市場都能夠呼風喚雨,只有它了。

Remote DMA技術在Ethernet上的應用不能不提微軟,目前微軟是目前在數(shù)據(jù)中心大規(guī)模部署RDMA的第一家HyperScale公司。微軟在2015/6/7/8年的Sigcomm [6]有大量的論文來講RDMA在數(shù)據(jù)中心的部署,很多人講微軟的風格是自己做了100分,但是對外只講1分。因此可以想象Microsoft對于Mellanox準備賣身的關注,自己的技術投入不能打水漂,不僅自己下手,而且鼓勵合作伙伴一起團購。

RDMA的技術是在一個有Mellanox主導的行業(yè)組織OFA[7]主導的。目前的成員如下圖,可以看到還是集中在HPC的專業(yè)領域。

英偉達GPU Direct必不可少的RMDA技術到底有多厲害?

OFA是2004年成立的工業(yè)組織,在整個HPC行業(yè)從Myrinet[8]轉換到IB的時候成立的。在2005年, Myrinet在TOP500的市場份額占到了28%,之后就一路下降,被IB替換掉了。對于誕生于HPC專業(yè)的領域,可用性一直是個大問題,HPC一切為了性能,不要虛擬化,不要通用操作系統(tǒng)和架構,每臺超算恨不得自成一臺體系。大家看看Mellanox的Linux 驅動的家族就知道這個有多復雜了。[7]

這路吐一個槽,作為Mellanox卡的資深用戶,我很早就自己畫了一份他們的OFED驅動的加載流程,作為Mellanox,這么基本的文檔在2018年12月才發(fā)布,而且很多模塊沒有upstream,讓人無奈的是,到現(xiàn)在為止我還沒有找到卸載rdma_cm ( connection mangament ) 的有效方法。每次都需要重啟

因此看到AWS說要發(fā)布他們的EFA的時候,覺得他們還是真有勇氣,但是仔細一看,原來和AWS的HPC業(yè)務緊密結合,而且利用了libfabric 的生態(tài)[8]

很明顯,libfabric在網(wǎng)路傳輸層和流行的HPC編程框架之間做了一個統(tǒng)一。更重要的是,對于原來OFA的功能定義做了一個大大減法。俺曾經(jīng)自己研究總結了Mellanox CX系列網(wǎng)卡的功能。大家可以自己看看這個復雜度。

對于像AWS這樣的Hyperscale公司也要部署RDMA,這個做法和之前的微軟有很大的不同。對于微軟,他們從40G開始規(guī)模部署RDMA,就是為了Azure的云環(huán)境的低延時網(wǎng)絡,目前微軟的網(wǎng)絡還是天下第一。[9]當然微軟為了大規(guī)模部署RoCEv2的所作的各種流控算法以及應用的優(yōu)化對于整個業(yè)界都是非常有用的,但是他們主要停留在傳統(tǒng)的網(wǎng)絡上面。

AWS則不同,對于低延時網(wǎng)絡來講,在2014年之前,大部分的場景就是SDS,太多的存儲startup公司,使用PCIE Flash和RDMA 網(wǎng)卡來構建自己的分布式存儲系統(tǒng),比較典型就是EMC收購的ScaleI/O了。[10]

2014年之后,由于ALexnet的出色表現(xiàn),RMDA和Nvidia有了深度合作,利用GPU Direct,在GPU集群中快速傳遞數(shù)據(jù)成了RDMA的另一個

大眾應用。[11]

GPU+RDMA也是目前在TOP500部署量最大的應用,因此可以很明確地看出AWS使用Nitro做EFA的目的了。

貌似只有一款機型部署了EFA。[12] 對于這個機型,定位很清楚,HPC和分布式機器學習的訓練,因此功能實現(xiàn)也非常有目的,不要指望EFA會和Mellanox一樣功能強大。

因此,可以看出,傳統(tǒng)的Nitro芯片在升級了25G的Serdes之后,利用libfabric的生態(tài)實現(xiàn)了部分的RDMA的功能,可以滿足AWS上的HPC和ML的業(yè)務需求。這個和國內(nèi)的大廠的想法類似。

因此,對于未來RDMA在數(shù)據(jù)中心的使用場景,存儲和HPC是兩個比較明確的方向。對于存儲,如何和NVMe這樣的存儲介質,以及NVMeoF和Cephover RDMA這樣的存儲后端結合是一個方向,在這個方向上,是不是要支持IB的編程框架并不重要。對于HPC的方向,則是如何和GPU這樣的計算引擎結合,簡單數(shù)據(jù)傳輸?shù)难訒r,和上層的ML的框架緊密結合。

廣告時間: Xilinx在2018.1 中就推出了自己的RDMA的實現(xiàn),目前主要關注在存儲應用這個方向。[13]實現(xiàn)了對10G/25G/40G/100G的網(wǎng)絡速率的支持,在Vivado 2019.1中會在延時上有進一步的提升,在512Byte上和標準的Mellanox類似,當然我們也是兼容Mellanox。歡迎大家垂詢。

[1]https://www.businesswire.com/news/home/20181025005197/en/Mellanox-Ships-2.1-Million-Ethernet-Adapters-Quarters

[2]https://www.cnbc.com/2018/11/07/xilinx-working-with-barclays-to-buy-mellanox-possible-december-deal.html

[3]https://www.cbronline.com/news/microsoft-mellanox

[4]https://www.hpcwire.com/2019/01/30/intel-reportedly-in-6b-bid-for-mellanox/

[5]https://en.globes.co.il/en/article-mellanox-acquisition-fits-broadcom-like-a-glove-1001258241

[6]http://www.sigcomm.org/

[7]https://community.mellanox.com/s/article/mellanox-linux-driver-modules-relationship--mlnx-ofed-x

[8]https://ofiwg.github.io/libfabric/

[9]https://mspoweruser.com/report-microsoft-azure-beats-google-cloud-and-amazon-aws-in-network-performance/

[10]https://en.wikipedia.org/wiki/Dell_EMC_ScaleIO

[11]https://devblogs.nvidia.com/benchmarking-gpudirect-rdma-on-modern-server-platforms/

[12]https://aws.amazon.com/cn/ec2/instance-types/

[13]https://www.xilinx.com/products/intellectual-property/etrnic.html

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    23

    文章

    4118

    瀏覽量

    99669

原文標題:深度好文:RDMA,到底有多厲害?

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    豪言自家芯片比英偉GPU強10倍,這家AI公司再獲融資

    電子發(fā)燒友網(wǎng)報道(文 / 吳子鵬)在 AI 算力需求呈指數(shù)級增長的今天,英偉憑借其 GPU 和 CUDA 生態(tài)構筑的 “護城河” 似乎堅不可摧。然而,一股由前谷歌 TPU 核心工程師
    的頭像 發(fā)表于 03-01 06:41 ?1.2w次閱讀

    轉載|射頻美容儀:控制射頻/電流至關重要,紅外測溫不可或缺

    射頻電流的重要性,以及紅外測溫傳感器在其中不可或缺的作用。圖中信息轉載鳳凰網(wǎng)科技行業(yè)亂象叢生,安全隱患重重當前家用射頻美容儀市場亂象叢生,暴利現(xiàn)象驚人,不少產(chǎn)品售
    的頭像 發(fā)表于 03-26 09:34 ?278次閱讀
    轉載|射頻美容儀:控制射頻/電流至關重要,紅外測溫<b class='flag-5'>不可或缺</b>

    到底有小?

    想知道硅到底有小;CPU 并不比 Wii 上的百老匯芯片大,但功能卻無限強大,哈哈。
    發(fā)表于 03-25 06:51

    GPU不是AI的唯一解:英偉用Groq LPU證明,推理賽道需要“另一條腿”

    大會上,英偉CEO黃仁勛正式發(fā)布了Vera Rubin AI超級計算機平臺。這一平臺的問世,不僅標志著英偉戰(zhàn)略從單一的GPU主導轉向涵蓋
    的頭像 發(fā)表于 03-24 11:27 ?6109次閱讀
    <b class='flag-5'>GPU</b>不是AI的唯一解:<b class='flag-5'>英偉</b><b class='flag-5'>達</b>用Groq LPU證明,推理賽道需要“另一條腿”

    英偉Rubin GPU采用鉆石銅散熱,解決芯片散熱難題

    電子發(fā)燒友網(wǎng)綜合報道 在AI算力狂飆的時代,芯片散熱問題成為制約技術發(fā)展的關鍵瓶頸。英偉下一代Vera Rubin架構GPU,將全面采用“鉆石銅復合散熱 + 45℃溫水直液冷”全新方
    的頭像 發(fā)表于 02-05 13:46 ?5540次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>Rubin <b class='flag-5'>GPU</b>采用鉆石銅散熱,解決芯片散熱難題

    英偉重磅出手!AI 推理存儲全面覺醒

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)近日,消息稱,英偉將以大約200億美元收購人工智能芯片初創(chuàng)公司Groq,這將是英偉迄今為止規(guī)模最大的一筆
    的頭像 發(fā)表于 12-26 08:44 ?1.2w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>重磅出手!AI 推理存儲全面覺醒

    英偉發(fā)布 NVQLink 開放系統(tǒng)架構;國內(nèi)首個汽車芯片標準驗證平臺投入使用

    英偉發(fā)布 NVQLink 開放系統(tǒng)架構 在華盛頓特區(qū)舉行的英偉全球技術大會上,英偉
    發(fā)表于 10-29 10:33 ?1355次閱讀

    英偉自研HBM基礎裸片

    "后的下一代AI GPU "Feynman"。 ? 分析指出,英偉此舉或是將部分GPU功能集成到基礎裸片中,旨在提高HBM和
    的頭像 發(fā)表于 08-21 08:16 ?3068次閱讀

    電磁干擾“江湖三兄弟”:EMC、EMI、EMS 到底有啥區(qū)別?

    電磁干擾“江湖三兄弟”:EMC、EMI、EMS 到底有啥區(qū)別?
    的頭像 發(fā)表于 08-20 15:16 ?3124次閱讀
    電磁干擾“江湖三兄弟”:EMC、EMI、EMS <b class='flag-5'>到底有</b>啥區(qū)別?

    aicube的n卡gpu索引該如何添加?

    請問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當還是只能看到默認的gpu0,顯示不了gpu1
    發(fā)表于 07-25 08:18

    漫畫科普 | 功率放大器到底有哪些應用?帶你解鎖功放經(jīng)典應用場景?。ㄒ唬?/a>

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

    自家GPU 提出的卡算力互連技術,是早期為了應對深度學習對超高算力需求而單卡算力不足的局面的解決方案,當然這都是官方用來吹牛的話術。我自己在2019年左右第一次接觸到卡交火的GIY
    發(fā)表于 06-18 19:31

    英偉擬再推中國特供GPU,今年6月量產(chǎn)!

    電子發(fā)燒友網(wǎng)綜合報道 近年來,美國政府對華半導體出口管制政策不斷收緊,英偉等半導體企業(yè)面臨嚴峻挑戰(zhàn)。為保持在中國市場的競爭力,英偉推出了多款特供版
    發(fā)表于 05-27 00:03 ?4919次閱讀

    從游戲到智能駕駛,英偉哪些技術升級?

    [首發(fā)于智駕最前沿微信公眾號]在2025年國際消費電子展(CES 2025)上,英偉重磅發(fā)布了其最新一代車規(guī)級自動駕駛芯片“Thor”,并同步展示了在智能汽車領域的技術進展與合作布局。英偉
    的頭像 發(fā)表于 05-16 09:02 ?1211次閱讀
    從游戲到智能駕駛,<b class='flag-5'>英偉</b><b class='flag-5'>達</b><b class='flag-5'>有</b>哪些<b class='flag-5'>技術</b>升級?
    宁河县| 苗栗县| 敖汉旗| 凯里市| 丰都县| 莱阳市| 永修县| 襄樊市| 扬中市| 新竹市| 宾阳县| 眉山市| 延寿县| 南开区| 册亨县| 呼玛县| 天镇县| 介休市| 洪江市| 新沂市| 嵊泗县| 尼勒克县| 吴川市| 尉犁县| 大宁县| 潢川县| 兴文县| 玉溪市| 凌源市| 云霄县| 武威市| 田林县| 通河县| 江阴市| 龙里县| 张家港市| 闽清县| 临城县| 会宁县| 南投市| 泰宁县|