日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Achronix Speedster7t FPGA芯片中2D NoC的設計細節(jié)

Achronix ? 來源:Achronix ? 作者:Achronix ? 2022-04-21 09:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摘要

隨著旨在解決現(xiàn)代算法加速工作負載的設備越來越多,就必須能夠在高速接口之間和整個器件中有效地移動高帶寬數(shù)據(jù)流。Achronix的Speedster7t獨立FPGA芯片可以通過集成全新的、高度創(chuàng)新的二維片上網(wǎng)絡(2D NoC)來處理這些高帶寬數(shù)據(jù)流。Achronix的FPGA中特有的2D NoC實現(xiàn)是一種創(chuàng)新,它與用可編程邏輯資源來實現(xiàn)2D NoC的傳統(tǒng)方法相比,有哪些創(chuàng)新和價值呢?本白皮書討論了這兩種實現(xiàn)2D NoC的方法,并提供了一個示例設計,以展示與軟2D NoC實現(xiàn)相比,Achronix 2D NoC是如何去提高性能、減少面積并縮短設計時間。

介紹

Achronix為其Speedster7t系列FPGA完全重新設計了片上通信架構(gòu),通過集成創(chuàng)新的2D NoC來適應高帶寬數(shù)據(jù)流的需求。在該FPGA器件的外圍,這個2D NoC連接到所有高速接口:包括多個400G以太網(wǎng)、PCIe Gen5、GDDR6和DDR4/5端口。在該FPGA內(nèi)的可編程邏輯陣列上部署了一系列高速行和列通道,它們分別向FPGA可編程邏輯陣列的水平和垂直方向分配網(wǎng)絡流量。除了這些行和列之外,在NoC的每一行和每一列交叉的位置還有發(fā)送點和目標NoC訪問節(jié)點(NAP)。這些NAP充當NoC和位于可編程邏輯陣列中的資源之間的源或目的地。

為了將Achronix FPGA中內(nèi)置的2D NoC,與使用傳統(tǒng)方法在可編程邏輯陣列中創(chuàng)建的NoC進行比較,為此我們評估了幾種軟NoC設計;最后,基于同行評審和FPGA結(jié)構(gòu)的可移植性,我們選擇了米蘭理工學院的軟2D NoC(https://github.com/agalimberti/NoCRouter,2017)設計。這種軟NoC在單向網(wǎng)狀網(wǎng)絡(mesh)中實現(xiàn)了蟲洞前瞻預測切換。在實施時,它需要每個mesh節(jié)點上的多個存儲器來存儲和轉(zhuǎn)發(fā)流控制單元(flit)。

為了量化片上2D NoC實現(xiàn)模式和使用邏輯陣列資源的軟實現(xiàn)模式之間的差異,首先創(chuàng)建了一個實例化AlexNet 2D卷積的19個實例設計,然后在完整的2D NoC設計之間比較了三個主要指標:所需資源、設計性能和設計時間(創(chuàng)建設計的時間以及在工具中編譯設計的時間)。其結(jié)果是在所有三種情況下,集成Achronix 2D NoC的性能都明顯優(yōu)于軟實現(xiàn)。

2D NoC減少使用的資源

為了比較兩種不同的2D NoC設計,兩種2D NoC都與現(xiàn)有的2D卷積(conv2d)設計相結(jié)合。conv2d設計對輸入圖像執(zhí)行AlexNet 2D卷積。此conv2d設計需要一個或兩個AXI-4連接:一個用于從內(nèi)存讀取,一個用于寫入內(nèi)存,或者一個共享的AXI-4執(zhí)行讀取和寫入。為了實現(xiàn)與軟NoC的最佳集成,選擇了單個共享AXI-4接口,conv2d模塊的實例位于每個mesh節(jié)點。然后,軟NoC啟用了GDDR6存儲接口的數(shù)據(jù)入口和出口——在軟NoC中,內(nèi)存接口連接到第20個mesh節(jié)點上;而在內(nèi)置式NoC中,這種連接已經(jīng)存在。在整個設計中,從GDDR6到每個conv2d節(jié)點都存在節(jié)點到節(jié)點通信,但conv2d節(jié)點之間不通信。

Achronix 2D NoC的設計細節(jié)

該設計有19個conv2d模塊實例,每個實例都訪問GDDR6存儲器。第20個實例是空閑的,因為GDDR6接口直接連接到集成的2D NoC。80個可用的NoC接入點(NAP)中有38個用于連接到conv2d實例。每個conv2d實例使用64個機器學習處理器(MLP),它在垂直方向覆蓋兩個NAP。由于這種部署是針對內(nèi)置2D NoC,所以采用雙AXI-4方法連接conv2d模塊。下表列出了本設計中使用的資源。

表1:Achronix 2D NoC使用的資源

5d7288fa-c107-11ec-bce3-dac502259ad0.png

使用Achronix FPGA集成的2D NoC,可為設計布局產(chǎn)生了一種不凌亂的、可重復的結(jié)構(gòu),并且只消耗了不到一半的器件資源。下面是AC7t1500器件中資源使用的平面圖。

5d828e26-c107-11ec-bce3-dac502259ad0.png

圖1:在AC7t1500中使用Achronix 2D NoC布局實例

軟2D NoC的設計細節(jié)

該設計被配置為5 × 4規(guī)模mesh,具有19個conv2d模塊實例,每個實例都連接到一個軟NoC節(jié)點。其第20 mesh節(jié)點是為GDDR6接口預留的。因此,需要更多的邏輯資源來管理軟2D NoC結(jié)構(gòu)。此實現(xiàn)還需要每個節(jié)點上的存儲,以便存儲flit并將其轉(zhuǎn)發(fā)到下一個節(jié)點。結(jié)果是顯著提高了資源的使用量,以及在器件上的不規(guī)則布局。下表列出了使用的資源;下圖為AC7t1500所用資源的平面圖。

表2:軟2D NoC使用的資源

5db13e6a-c107-11ec-bce3-dac502259ad0.png

5dcaadd2-c107-11ec-bce3-dac502259ad0.jpg

圖2:使用軟2D NoC布局實例

2D NoC提高性能

如前所述,通過使用Achronix 2D NoC,conv2d設計產(chǎn)生了規(guī)則的資源布局,從而形成規(guī)則的布線。減少了邏輯資源使用就減少了擁塞,因為需要布線的邏輯更少。該解決方案實現(xiàn)了最高565 MHz的頻率,關鍵路徑包含在conv2d實例邏輯中。隨著更多conv2d節(jié)點添加到設計中,最大頻率不會降低。

下圖顯示了使用Achronix 2D NoC時產(chǎn)生的布線

5df57dc8-c107-11ec-bce3-dac502259ad0.jpg

圖3:使用Achronix 2D NoC的cnv2d設計布線

使用軟2D NoC解決方案會導致復雜且不規(guī)則的布線,同時時序也受到影響,因為需要深度LUT邏輯來選擇軟2D NoC中的適當路徑。

此外,性能會隨著mesh網(wǎng)絡大小的增加而降低。使用2 × 3 mesh的設計可以達到94 MHz,而5 × 4 mesh只能達到82 MHz。關鍵路徑包含在軟NoC mesh網(wǎng)絡中,而不是在conv2d邏輯中。如果花更多時間優(yōu)化設計以提高性能,則可以進一步優(yōu)化軟2D NoC的時序。

下圖顯示了使用軟2D NoC設計時生成的布線。

5e165732-c107-11ec-bce3-dac502259ad0.jpg

圖4:使用軟2D NoC時的cnv2d設計布線

2D NoC改善了帶寬

Achronix的2D NoC使用運行速度在2 GHz的256位雙向總線,每個conv2d實例連接到兩個NAP,從而在一個節(jié)點上與GDDR6接口之間的連接可實現(xiàn)的最大帶寬為512 Gbps。下面的框圖顯示了2D NoC和一個連接到本地conv2d實例的NAP的細節(jié)。

5e3e990e-c107-11ec-bce3-dac502259ad0.png

圖5:Achronix的2D NoC和NAP

軟2D NoC使用五路交叉開關(crossbar switch),其中一個端口與本地conv2d實例通信,而其他端口與網(wǎng)格中的下一個節(jié)點通信。該解決方案可以實現(xiàn)節(jié)點到節(jié)點連接的頻率為82 MHz,從而在一個節(jié)點上形成最高為21 Gbps的GDDR6接口帶寬。下面的框圖顯示了軟2D NoC mesh中的一個交叉開關。

5e5be860-c107-11ec-bce3-dac502259ad0.png

圖6:軟2D NoC交叉開關

2D NoC縮短了設計時間和工具運行時間

Achronix的2D NoC采用AXI-4標準與NAP通信,這是許多FPGA設計人員已經(jīng)熟悉的接口標準。此外,2D NoC包括內(nèi)置功能,例如跨時鐘域邏輯、流量控制和地址解碼等,這些功能不再需要包含在用戶邏輯中。Achronix的2D NoC的全功能實現(xiàn)為用戶省去了大量的設計工作,使設計人員能夠?qū)W⒂谶B接到2D NoC的加速器。

除了縮短設計時間外,使用Achronix片上2D NoC的設計比使用軟2D NoC的設計使用更少的資源。結(jié)果是需要布局和布線的邏輯更少,從而使得工具的編譯時間更短。例如,與使用軟2D NoC的實現(xiàn)相比,使用Achronix片上2D NoC的設計布局和布線所需的時間不到一半。

結(jié)論

集成2D NoC的Speedster7t器件創(chuàng)新地帶來了FPGA設計過程的根本轉(zhuǎn)變。Achronix是第一家集成2D NoC的FPGA公司,它連接所有系統(tǒng)接口和FPGA邏輯陣列。這種新架構(gòu)使Achronix FPGA器件特別適用于高帶寬應用,同時顯著提高了設計人員的工作效率。由于2D NoC管理著從設計在FPGA邏輯陣列中的數(shù)據(jù)加速器到高速數(shù)據(jù)接口之間的所有網(wǎng)絡功能,因此設計人員只需設計他們的數(shù)據(jù)加速器并將它們連接到NAP接入點。與使用軟2D NoC相比,設計人員可以受益于以下優(yōu)點:

● 降低邏輯資源占有率并提高FPGA的整體性能

● 增加帶寬

● 減少對存儲器的需求

● 更快的設計時間和更短的工具編譯時間

表3:Speedster7t 2D NoC與Soft 2D NoC的總結(jié)比較

5e6e40b4-c107-11ec-bce3-dac502259ad0.png

如希望進一步了解Achronix Speedster7t FPGA芯片及其2D NoC可以發(fā)揮的巨大效用。

原文標題:Achronix在其先進FPGA中集成2D NoC以支持高帶寬設計(WP028)

文章出處:【微信公眾號:Achronix】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1664

    文章

    22509

    瀏覽量

    639514
  • 芯片
    +關注

    關注

    463

    文章

    54463

    瀏覽量

    469660
  • NoC
    NoC
    +關注

    關注

    0

    文章

    43

    瀏覽量

    12220
  • Achronix
    +關注

    關注

    1

    文章

    78

    瀏覽量

    23046

原文標題:Achronix在其先進FPGA中集成2D NoC以支持高帶寬設計(WP028)

文章出處:【微信號:Achronix,微信公眾號:Achronix】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    TechWiz LCD 2D:液晶透鏡模擬

    TechWiz Ray 2D進行光程差和焦距的計算,并進行高級LC分析,包括LC指向矢隨外加電壓的分布。 1. 建模任務 1.1 模擬條件 模擬區(qū)域:0~200 邊界條件:Periodic 偏移角度:0° 單位
    發(fā)表于 03-20 08:56

    TechWiz LCD 2D應用:單疇IPS仿真

    對于IPS、FFS等結(jié)構(gòu)來說,其像素電極和公共電極在同一平面,因此不能用TechWiz LCD 1D軟件來仿真,需要至少能進行2維模擬的軟件,本案例使用TechWiz LCD 2D來模擬一下單疇
    發(fā)表于 03-19 08:38

    TMAG511x系列2D雙通道高靈敏度霍爾效應鎖存器技術解析

    TMAG511x系列2D雙通道高靈敏度霍爾效應鎖存器技術解析 在電子設備的設計中,傳感器的性能和適用性對整個系統(tǒng)的功能起著至關重要的作用。今天我們要深入探討的是德州儀器(TI)的TMAG5110
    的頭像 發(fā)表于 02-11 15:25 ?581次閱讀

    XS5018C:高性能2D/3D降噪ISP-TX 2K芯片電路圖資料

    HDcctv/CVBS, 支持多種制式 960H/720P/960P/1080P, ISP 最高支持 1080P@30FPS, 高性能 2D 降噪、 3D 降噪, 支持無極降幀。
    發(fā)表于 01-28 16:50 ?0次下載

    2D、2.5D與3D封裝技術的區(qū)別與應用解析

    半導體封裝技術的發(fā)展始終遵循著摩爾定律的延伸與超越。當制程工藝逼近物理極限,先進封裝技術成為延續(xù)芯片性能提升的關鍵路徑。本文將從技術原理、典型結(jié)構(gòu)和應用場景三個維度,系統(tǒng)剖析2D、2.5D及3
    的頭像 發(fā)表于 01-15 07:40 ?1276次閱讀
    <b class='flag-5'>2D</b>、2.5<b class='flag-5'>D</b>與3<b class='flag-5'>D</b>封裝技術的區(qū)別與應用解析

    探索TRAVEO? T2G Cluster 6M Lite Kit:功能、應用與編程指南

    ? T2G Cluster 6M Lite Kit,這是一款經(jīng)濟高效的評估套件,旨在幫助軟件和硬件工程師評估TRAVEO? T2G Cluster 2D系列的CYT4DN設備。 文件下載: Infineon
    的頭像 發(fā)表于 12-19 11:20 ?802次閱讀

    淺談2D封裝,2.5D封裝,3D封裝各有什么區(qū)別?

    集成電路封裝技術從2D到3D的演進,是一場從平面鋪開到垂直堆疊、從延遲到高效、從低密度到超高集成的革命。以下是這三者的詳細分析:
    的頭像 發(fā)表于 12-03 09:13 ?1406次閱讀

    NoC性能監(jiān)控器調(diào)試指南

    本篇博客展示了如何訪問 NPI 為 NoC(片上網(wǎng)絡)公開的 Performance Monitor(性能監(jiān)控器)寄存器,這些寄存器用于監(jiān)控 NoC 的性能。
    的頭像 發(fā)表于 12-01 14:38 ?1928次閱讀
    <b class='flag-5'>NoC</b>性能監(jiān)控器調(diào)試指南

    【CPKCOR-RA8D1】3、2D繪圖引擎(D/AVE)DRW

    一、前言 D/AVE 2D是 Renesas 微控制器中的硬件模塊,主要用于2D圖形加速。 硬件加速的2D圖形繪制操作 支持矩形填充、線條繪制、位圖傳輸?shù)?比軟件實現(xiàn)快得多的圖形渲染速
    發(fā)表于 10-11 12:09

    Achronix亮相2025全球AI芯片峰會

    在近日舉行的2025全球AI芯片峰會上,Achronix Speedster7t FPGA的大模型推理平臺展示獲得眾多業(yè)界人士的積極反響。
    的頭像 發(fā)表于 09-23 18:01 ?1510次閱讀

    Achronix邀您相約2025全球AI芯片峰會

    9月17,Achronix 將已展臺形式安排專業(yè)人員參加2025全球AI芯片峰會,期待與感興趣朋友現(xiàn)場交流,地點:上海浦東喜來登由由大酒店。
    的頭像 發(fā)表于 09-11 09:25 ?1233次閱讀

    如何使用MA35D1上的硬件2D加速功能?

    如何使用MA35D1上的硬件2D加速功能?
    發(fā)表于 09-03 07:46

    2D 到 3.5D 封裝演進中焊材的應用與發(fā)展

    2D 到 3.5D 封裝的演進過程中,錫膏、助焊劑、銀膠、燒結(jié)銀等焊材不斷創(chuàng)新和發(fā)展,以適應日益復雜的封裝結(jié)構(gòu)和更高的性能要求。作為焊材生產(chǎn)企業(yè),緊跟封裝技術發(fā)展趨勢,持續(xù)投入研發(fā),開發(fā)出更高效、更可靠、更環(huán)保的焊材產(chǎn)品,將是在半導體封裝市場中保持競爭力的關鍵。
    的頭像 發(fā)表于 08-11 15:45 ?1951次閱讀
    從 <b class='flag-5'>2D</b> 到 3.5<b class='flag-5'>D</b> 封裝演進中焊材的應用與發(fā)展

    TechWiz LCD 2D應用:不同結(jié)構(gòu)下的VT曲線

    :550nm 電壓條件:Pixel:0~8V,1V(步長); Com:0V 4. 生成結(jié)果 3.1 結(jié)構(gòu) 3.2 T-V 2D圖表
    發(fā)表于 06-13 08:44

    Techwiz LCD 2D應用:二維LC透鏡建模分析

    Techwiz LCD 2D新的Lens掩膜結(jié)構(gòu) 1. 摘要 Techwiz LCD 2D新增Lens掩膜結(jié)構(gòu),可以方便快捷的對LC 透鏡進行建模分析。LC透鏡由于體積小、焦距可變等優(yōu)點,被認為是
    發(fā)表于 05-30 08:47
    工布江达县| 怀集县| 厦门市| 荆州市| 怀仁县| 肇州县| 枝江市| 礼泉县| 宁乡县| 贵港市| 泌阳县| 峡江县| 嘉荫县| 区。| 永善县| 三门县| 乌苏市| 桂东县| 奉贤区| 河南省| 南安市| 皮山县| 张家口市| 丰县| 琼中| 江阴市| 永昌县| 贵阳市| 同江市| 璧山县| 饶阳县| 卫辉市| 高邮市| 淄博市| 磴口县| 拉萨市| 平舆县| 深水埗区| 固阳县| 图们市| 汉中市|