日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI引擎架構(gòu)和陣列編程要求

Xilinx賽靈思官微 ? 來源:Xilinx賽靈思官微 ? 作者:Xilinx賽靈思官微 ? 2022-12-08 09:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Versal AI Core 系列可借助 AI 引擎提供突破性的 AI 推斷加速。此系列應(yīng)用范圍廣泛,包括用于云端動態(tài)工作負(fù)載以及超高帶寬網(wǎng)絡(luò),同時還可提供高級安全性功能。AI 和數(shù)據(jù)科學(xué) 家以及軟硬件開發(fā)者均可充分利用高計算密度的優(yōu)勢來加速提升任何應(yīng)用的性能。

AI 引擎是超長指令字 (VLIW) 處理器陣列,具有高度優(yōu)化的單指令流多數(shù)據(jù)流 (SIMD) 矢量單元,專用于各種計算密集 型應(yīng)用,尤其是數(shù)字信號處理 (DSP)、5G 無線應(yīng)用和人工智能 (AI) 技術(shù)(如機(jī)器學(xué)習(xí) (ML))等。同時,AI 引擎還是硬化的塊,可提供多級并行處理能力,包括指令級并行處理和數(shù)據(jù)級并行處理。

本指南闡述了對 AI 引擎 graph 應(yīng)用進(jìn)行編譯與仿真、使用 Vitis 工具流程來集成應(yīng)用、使用 Vitis IDE、調(diào)試 AI 引擎應(yīng)用、映射器/布線器方法論、AI 引擎硬件剖析和調(diào)試方法論等內(nèi)容。

本文選取 AI 引擎架構(gòu)概述部分。

AI 引擎陣列編程要求充分理解要實現(xiàn)的算法、AI 引擎的功能以及各功能單元之間的整體數(shù)據(jù)流。AI 引擎陣列支持三種 級別的并行度:

SIMD:通過矢量寄存器,允許并行計算多個元素。

指令級別:通過 VLIW 架構(gòu),允許在單個時鐘周期內(nèi)執(zhí)行多項指令。

多核:通過 AI 引擎陣列,即可在其中并行執(zhí)行數(shù)百個 AI 引擎。

雖然對于 AI 引擎而言,大部分標(biāo)準(zhǔn) C 語言代碼均可編譯,但代碼可能需要大幅重構(gòu)才能在 AI 引擎陣列上實現(xiàn)最優(yōu)性能。AI 引擎的優(yōu)勢在于,它能夠在每個時鐘周期內(nèi)執(zhí)行矢量 MAC 運算、為下一項運算加載 2 個 256 位矢量、存儲來自上一項運算的單個 256 位矢量并遞增一個指針或執(zhí)行另一次標(biāo)量運算。AI 引擎編譯器不會執(zhí)行任何自動矢量化或基于編譯指示的矢量化。代碼必須重寫后才能使用 SIMD 內(nèi)部數(shù)據(jù)類型(例如,v8int32)和矢量內(nèi)部函數(shù)(例如, mac(…)),而這些都必須在單個流水打拍循環(huán)內(nèi)執(zhí)行,才能達(dá)成最優(yōu)性能。32 位標(biāo)量 RISC 處理器具有一個 ALU、 部分非線性函數(shù)和數(shù)據(jù)類型轉(zhuǎn)換。每個 AI 引擎所能訪問的存儲器量是有限的,這表示大型數(shù)據(jù)集需要分區(qū)。

AI 引擎內(nèi)核即 AI 引擎上運行的函數(shù),這些函數(shù)構(gòu)成數(shù)據(jù)流 graph 規(guī)范的基本構(gòu)建塊。數(shù)據(jù)流 graph 是 Kahn 進(jìn)程網(wǎng)絡(luò),具有確定性行為,不依賴于各種計算延遲或通信延遲。AI 引擎內(nèi)核聲明為空的 C/C++ 函數(shù),通過提取窗口實參或串流實參來建立 graph 連接。內(nèi)核還可包含靜態(tài)數(shù)據(jù)和運行時參數(shù)實參,包括異步實參或觸發(fā)實參。每個內(nèi)核都應(yīng)在其自己的源文件內(nèi)定義。

為了達(dá)成總體系統(tǒng)性能,必須廣泛閱讀了解有關(guān)架構(gòu)、分區(qū)、AI 引擎數(shù)據(jù)流 graph 生成和數(shù)據(jù)流連接最優(yōu)化等方面的 知識,積累相關(guān)經(jīng)驗。

AMD 賽靈思提供了 DSP 和通信庫,其中包含經(jīng)最優(yōu)化的代碼,可用于 AI 引擎,應(yīng)盡可能多加利用。其中提供的源代碼也提供了強(qiáng)大的資源,供用戶學(xué)習(xí)有關(guān) AI 引擎內(nèi)核編碼的信息。

AI 引擎組件

AI 引擎陣列由二維 AI 引擎拼塊 (tile) 陣列構(gòu)成,其中每個 AI 引擎拼塊均包含一個 AI 引擎、存儲器模塊和拼塊互連模 塊。

AI 引擎:每個 AI 引擎都是一個超長指令字 (VLIW) 處理器,其中包含一個標(biāo)量單元、一個矢量單元、兩個加載單元和一個存儲單元。

AI 引擎拼塊:每個 AI 引擎拼塊都包含一個 AI 引擎、一個本地存儲器模塊,搭配多條通信路徑以促進(jìn)拼塊間的數(shù)據(jù)交換。

AI 引擎陣列:AI 引擎陣列是指 AI 引擎拼塊的完整二維陣列。

AI 引擎程序:AI 引擎程序包含以 C/C++ 編寫的數(shù)據(jù)流 graph 規(guī)范。該程序是使用 AI 引擎工具鏈來編譯并執(zhí)行的。

AI 引擎內(nèi)核:內(nèi)核是使用 AI 引擎矢量數(shù)據(jù)類型和內(nèi)部函數(shù)以 C/C++ 編寫的。這些函數(shù)均為 AI 引擎上運行的計算函數(shù)。內(nèi)核構(gòu)成數(shù)據(jù)流 graph 規(guī)范的基本構(gòu)建塊。

ADF graph:ADF graph 是具有單個 AI 引擎內(nèi)核或多個 AI 引擎內(nèi)核(以數(shù)據(jù)串流連接)的網(wǎng)絡(luò)。它憑借如下特定構(gòu)造來與可編程邏輯、全局存儲器和處理器系統(tǒng)進(jìn)行交互,此類構(gòu)造有:PLIO(graph 編程中的端口屬性,用于建立往來可編程邏輯的串流連接)、GMIO(graph 編程中的端口屬性,用于建立往來全局存儲器的外部存儲器映射連接)和 RTP。

工具

Vitis 集成設(shè)計環(huán)境

Vitis 集成設(shè)計環(huán)境 (IDE) 可用于為賽靈思器件執(zhí)行系統(tǒng)編程,包括含多個 AI 引擎內(nèi)核的 Versal 器件。在此工具中,有下列功能特性可用。

最優(yōu)化 C/C++ 編譯器,用于編譯內(nèi)核與 graph 代碼,執(zhí)行所有必要的連接、布局和檢查以確保器件上的各項功能正常工作。

周期近似的仿真器、加速的功能仿真器和剖析工具。

調(diào)試環(huán)境,可在仿真環(huán)境和硬件環(huán)境下使用。

Vitis 命令行工具

命令行工具可用于構(gòu)建、仿真以及生成輸出文件和報告。捕獲由 IDE 生成的命令行輸出后,有助于后續(xù)集成到客戶構(gòu)建環(huán)境內(nèi)。Vitis 分析器 IDE 可用于查看報告并分析由命令行工具生成的輸出文件和報告。

Vitis Model Composer

Vitis Model Composer 可提供基于 MATLABSimulink 的高層次圖形輸入環(huán)境,用于包含 AI 引擎、HLS 和 RTL 組件的設(shè)計仿真與代碼生成。

將 AI 引擎內(nèi)核、graph、HLS 內(nèi)核與基于 RTL 的塊導(dǎo)入同一個 Simulink 設(shè)計,用于快速協(xié)同仿真。

從 Simulink 庫瀏覽器中,將經(jīng)過最優(yōu)化的 AI 引擎函數(shù)(例如,有限脈沖響應(yīng) (FIR) 和 FFT 濾波器)拖放到設(shè)計中。

使用 MATLAB 或 Simulink 中生成的激勵來驗證設(shè)計、直觀顯示結(jié)果并將結(jié)果與黃金參考結(jié)果進(jìn)行比較。生成 graph 代碼并測試矢量。

匯編導(dǎo)入的代碼和塊庫代碼以供饋送到下游工具中。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41315

    瀏覽量

    302701
  • 引擎
    +關(guān)注

    關(guān)注

    1

    文章

    369

    瀏覽量

    23514

原文標(biāo)題:AI 引擎工具和流程用戶指南

文章出處:【微信號:賽靈思,微信公眾號:Xilinx賽靈思官微】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    黑馬-Java+AI新版V16零基礎(chǔ)就業(yè)班百度云網(wǎng)盤下載+Java+AI全棧開發(fā)工程師

    巨大潛力。傳統(tǒng) Java 開發(fā)者大可不必恐慌轉(zhuǎn)型,而是應(yīng)主動將 AI 作為能力增強(qiáng)點,擴(kuò)展自身技術(shù)半徑。掌握上述六大實戰(zhàn)維度:架構(gòu)范式選擇、推理引擎優(yōu)化、特征管線構(gòu)建、模型熱加載、大模型整合、工程可觀
    發(fā)表于 05-01 11:29

    [完結(jié)15章]Java轉(zhuǎn) AI高薪領(lǐng)域必備-從0到1打通生產(chǎn)級AI Agent開發(fā)

    能力進(jìn)行深度融合,完成從“業(yè)務(wù)代碼實現(xiàn)者”向“AI系統(tǒng)工程架構(gòu)師”的硬核轉(zhuǎn)型。(搜星 課it。top) 一、 破除語言迷思:以Java生態(tài)構(gòu)建AI基礎(chǔ)設(shè)施 許多Java開發(fā)者的轉(zhuǎn)型誤區(qū)在于認(rèn)為“做
    發(fā)表于 04-30 13:46

    Vibe Coding AI全棧開發(fā)實戰(zhàn)

    Vibe Coding AI全棧:效率翻倍的開發(fā)新方式 在科技飛速發(fā)展的當(dāng)下,軟件開發(fā)領(lǐng)域正經(jīng)歷著一場深刻的變革。傳統(tǒng)的編程模式逐漸被一種新興的、以AI為核心的全棧開發(fā)方式所取代,其中Vibe
    發(fā)表于 04-15 16:02

    AI輔助編程設(shè)計之道:從Spec到Code工程實踐

    邏輯。 技術(shù)選型和約束。使用什么編程語言和框架?代碼分層遵循什么規(guī)范?有哪些性能或安全方面的約束?這些信息確保AI生成的代碼符合項目的技術(shù)棧要求。 四、人與AI的分工邊界 在
    發(fā)表于 03-16 13:33

    OrangePi RV2 深度技術(shù)評測:RISC-V AI融合架構(gòu)的先行者

    問題 4.獨特優(yōu)勢 4.1 RISC-V AI 融合架構(gòu) 不同于外掛NPU,AI 算力集成于 CPU 核內(nèi),編程模型統(tǒng)一,減少數(shù)據(jù)搬運開銷 為邊緣A
    發(fā)表于 03-03 20:19

    摩爾線程正式推出AI Coding Plan智能編程服務(wù)

    摩爾線程今日正式推出 AI Coding Plan 智能編程服務(wù)。作為首個基于國產(chǎn)全功能 GPU 算力底座構(gòu)建的智能開發(fā)解決方案,該服務(wù)以 MTT S5000 強(qiáng)勁的全精度計算能力為核心驅(qū)動,融合硅
    的頭像 發(fā)表于 02-03 16:46 ?1878次閱讀

    Cadence Conformal AI Studio三大核心引擎重塑IC驗證

    Cadence 以 Conformal AI Studio 結(jié)合強(qiáng)化學(xué)習(xí)與分布式架構(gòu),全面升級 LEC、低功耗驗證和 ECO,在 AI 設(shè)計時代開創(chuàng)新范式。
    的頭像 發(fā)表于 01-05 10:12 ?735次閱讀

    從游戲引擎AI動力核心

    顯卡技術(shù)演進(jìn):從游戲引擎AI動力核心 曾經(jīng)專為圖形渲染而生的顯卡,如今正成為推動人工智能、邊緣計算和科學(xué)模擬的關(guān)鍵驅(qū)動力。 近年來,顯卡技術(shù)已從單純的圖形處理單元演變?yōu)橥ㄓ糜嬎慵铀倨?。這一轉(zhuǎn)變不僅
    的頭像 發(fā)表于 10-30 11:08 ?435次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    連接定義了神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)。 不同神經(jīng)網(wǎng)絡(luò)的DNN: 一、基于大模型的AI芯片 1、Transformer 模型與引擎 1.1 Transformer 模型概述 Transformer 模型的出現(xiàn)
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    ②Transformer引擎③NVLink Switch系統(tǒng)④機(jī)密計算⑤HBM FPGA: 架構(gòu)的主要特點:可重構(gòu)邏輯和路由,可以快速實現(xiàn)各種不同形式的神經(jīng)網(wǎng)絡(luò)加速。 ASIC: 介紹了幾種ASIC AI芯片
    發(fā)表于 09-12 16:07

    AI 芯片浪潮下,職場晉升新契機(jī)?

    職場、渴望在專業(yè)領(lǐng)域更進(jìn)一步的人來說,AI 芯片與職稱評審之間,實則有著千絲萬縷的聯(lián)系,為職業(yè)晉升開辟了新的路徑。 AI 芯片領(lǐng)域細(xì)分與職稱對應(yīng) 目前,AI 芯片從技術(shù)架構(gòu)上主要分為
    發(fā)表于 08-19 08:58

    HarmonyOSAI編程DevEco AI輔助編程工具

    DevEco AI輔助編程工具(CodeGenie)基于BitFun Platform AI能力平臺,為開發(fā)者提供高效的應(yīng)用與服務(wù)AI編程
    發(fā)表于 08-18 14:54

    HarmonyOS AI輔助編程工具(CodeGenie)概述

    DevEco AI輔助編程工具(CodeGenie)基于BitFun Platform AI能力平臺,為開發(fā)者提供高效的應(yīng)用與服務(wù)AI編程
    發(fā)表于 08-11 14:31

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    DeepSeek-R1:強(qiáng)大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開發(fā)的新一代AI大模型。其核心優(yōu)勢在于強(qiáng)大的推理引擎能力,融合了自然語言處理(
    發(fā)表于 07-16 15:29

    AI芯片:加速人工智能計算的專用硬件引擎

    人工智能(AI)的快速發(fā)展離不開高性能計算硬件的支持,而傳統(tǒng)CPU由于架構(gòu)限制,難以高效處理AI任務(wù)中的大規(guī)模并行計算需求。因此,專為AI優(yōu)化的芯片應(yīng)運而生,成為推動深度學(xué)習(xí)、計算機(jī)視
    的頭像 發(fā)表于 07-09 15:59 ?1988次閱讀
    会泽县| 元阳县| 社会| 连山| 元阳县| 茶陵县| 衡阳县| 固原市| 利川市| 靖边县| 潍坊市| 虎林市| 霸州市| 和静县| 巴东县| 泗水县| 左云县| 崇仁县| 余干县| 济南市| 湖北省| 岐山县| 嘉荫县| 平泉县| 镇雄县| 墨脱县| 义马市| 泰顺县| 乐平市| 庐江县| 黄陵县| 会宁县| 稻城县| 姜堰市| 阿城市| 孟村| 永清县| 岫岩| 全椒县| 舒城县| 霍州市|