日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種用于AI視覺處理芯片的驗證加速方案

路科驗證 ? 來源:路科驗證 ? 作者:路科驗證 ? 2023-03-28 16:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

介紹

本文中所涉及的AI邊緣推斷視覺處理芯片的實際用例都較為復(fù)雜,而且也需要牽扯到多個模塊參與,例如攝像頭輸入、多通道數(shù)據(jù)的媒體編解碼、圖像處理、多顯示支持等。要去協(xié)調(diào)這么多的模塊,還要將它們與神經(jīng)網(wǎng)絡(luò)算法結(jié)合構(gòu)建用例。

由于對系統(tǒng)中各個硬件要素的協(xié)調(diào)調(diào)度要求較多,AI視覺處理芯片需要更多使用固件去進(jìn)行測試,這對于從IP/子系統(tǒng)層的測試用例到系統(tǒng)層的移植、以及在早期階段獲得較為準(zhǔn)確的性能數(shù)據(jù)和功耗數(shù)據(jù)都提出了要求。這篇論文提供了一個作者在功能、性能和功耗這三個方面的硬件加速驗證方案。

問題闡述

不同于常見的SoC在數(shù)據(jù)傳輸和控制上的測試方案,AI視覺處理芯片往往需要結(jié)合多個高帶寬的多媒體控制器發(fā)起多個數(shù)據(jù)幀,模擬真實應(yīng)用。而這么大的數(shù)據(jù)處理量,仿真往往會受制于仿真性能無法有較好的表現(xiàn),所以在AI芯片驗證方面,如果想要測試真實場景,那么就需要將固件在硬件加速器(emulator)上去處理。

由于功能、性能、功耗三個方面的驗證在工具層面都缺少統(tǒng)一的平臺做處理,而且不同形式的測試向量和方法學(xué)也讓這些測試場景無法做到自動化映射。從工程實現(xiàn)角度考慮,一個需求是把功能測試的數(shù)據(jù)能夠給到性能分析和功耗評估,另外一個需求是將IP/子系統(tǒng)層面的測試用例能夠給到SoC層面測試。

功能驗證方案

下方給出了在采用固件驗證的情況下的測試方案。固件在早期驗證中,可能使用的是例如SystemC/C++這類的純軟件測試平臺,在此基礎(chǔ)上他們可以提供早期的固件和十六進(jìn)制文件(在后期的硬件加速測試中使用)。同時,在IP/子系統(tǒng)硬件加速測試中,可以根據(jù)測試文件(二進(jìn)制文件和log文件)做后處理繼而獲得測試中的硬件配置數(shù)據(jù)和圖形文件。

在接下來的SoC emulation,可以將從早期軟件測試中固件、IP/子系統(tǒng)emulation中提取的硬件配置、圖形文件共同作為SoC測試中的元素,讓他們用來盡可能實現(xiàn)從IP/子系統(tǒng)到SoC的測試場景移植。 接下來可以利用emulator中的總線監(jiān)測組件,獲得總線傳輸數(shù)據(jù),并將這些數(shù)據(jù)信息交由Python腳本去做處理,以便達(dá)到數(shù)據(jù)比較、性能監(jiān)測等目的。

7a7f12dc-cd41-11ed-bfe3-dac502259ad0.png

這個方案意味著測試從大的層面來看,是以最終通過固件測試為目的,也就是說從一開始構(gòu)建測試場景時,就需要固件的人參與其中。這就不得不考慮在開發(fā)AI視覺芯片時的驗證分工協(xié)作的場景不單單是simulation、emulation參與在內(nèi),也同樣需要固件。盡管一開始硬件可能還不穩(wěn)定,需要simulation/emulation讓硬件逐步穩(wěn)定,但固件的人只要前期有SystemC/C++這樣的模型在的話也可以在早期做固件有關(guān)的測試準(zhǔn)備。

這一點挺重要的,如果固件的人直到emulation階段才參與進(jìn)來的話,那么也就沒有上面方案里的Software Testbench部分了,所有的信息都只能等到IP/子系統(tǒng)emulation階段得出。更甚至,如果在IP/子系統(tǒng)emulation階段沒有固件參與的話,那么在SoC層面去做固件相關(guān)的測試,從開發(fā)固件測試用例到做參考比較都會延緩測試進(jìn)度。更為推薦的是固件也有條件在某個測試平臺(software testbench、IP/subsys emulation testbench)完成測試。

還有一點,在IP/subsys階段的測試,方案中是通過測試中的bin文件、log文件來做后處理,繼而生成SoC層面可以使用的配置。這一點不同于我們以往所理解的將測試文件從IP/subsys到SoC階段的修改移植??赡苁菫榱藢崿F(xiàn)準(zhǔn)確的、自動化的配置參數(shù),它是按照后處理的方式,提取出來對目標(biāo)硬件做的各項配置,這些提取的信息可能按照某個格式做了中間信息的保存,并且結(jié)合SoC的結(jié)構(gòu)特征,做了自動化的配置測試生成。

在SoC emulation階段,利用的是內(nèi)置的總線監(jiān)測(可能有多個),周期性地獲得數(shù)據(jù),并完成數(shù)據(jù)完整性檢查(可能在測試中或者測試后通過Python腳本完成)。

性能分析方案

在性能分析時,也需要利用測試場景的移植(porting)和分析時的多個深度。從IP/subsys到SoC的移植,就性能分析而言分為了3個階段。 第1階段即是將IP/subsys的傳輸數(shù)據(jù)移植到SoC層面,這一點可以利用IP/subsys emulation過程中l(wèi)og文件的后處理來獲得。 第2階段是將IP/subsys的固件移植到SoC層面,這一點也可以利用“功能驗證方案”中已有的“software testbench”信息。 第3階段是為了讓多個多媒體控制器、接口的數(shù)據(jù)信息能夠并行運行以期達(dá)到真實的、大規(guī)模的數(shù)據(jù)吞吐。這種場景需要文中提到的一個特殊的混合方法(unique hybrid methodology),共同利用數(shù)據(jù)網(wǎng)絡(luò)(network)和固件,將多個多媒體控制器充分并行調(diào)動,構(gòu)建復(fù)雜的測試場景。

7aa67de0-cd41-11ed-bfe3-dac502259ad0.png ?

功耗估測方案

在功耗估測中,需要考慮的是相比于通常在仿真中收集功耗有關(guān)數(shù)據(jù),如何在emulation中收集數(shù)據(jù),并且做到準(zhǔn)確的、快速的功耗分析。在下面的方案中,利用了波形數(shù)據(jù)獲得開關(guān)信息文件SAIF,并結(jié)合power engine去獲得平均功耗和峰值功耗(論文并沒有就power engine給出詳細(xì)的信息)。 這里附贈一篇文章: 《Using Emulators For Power/Performance Tradeoffs》 https://semiengineering.com/using-emulators-for-power-performance-tradeoffs/

7ac2c7fc-cd41-11ed-bfe3-dac502259ad0.png

結(jié)果分析

受益于可以從IP/subsys層將測試用例有關(guān)的數(shù)據(jù)自動遷移到SoC級,使得與VPU(視覺處理單元)、DMA、ISP(Image Signal Processing)有關(guān)的測試用例能夠在4周的時間完成交付。這里的測試用例遷移我們應(yīng)該吸取文章中的經(jīng)驗,那就是它不是從測試用例自身文本的遷移去實現(xiàn)的,而是通過log/bin文件的后處理,獲得某種中間型的標(biāo)準(zhǔn)信息文件,再結(jié)合系統(tǒng)測試的環(huán)境配置數(shù)據(jù),最終生成SoC測試用例。

從發(fā)現(xiàn)的bug類型來看,有接近40%來自于固件級別的測試,這也突出了AI類芯片在測試時需要結(jié)合實際場景的需求,畢竟整個系統(tǒng)的調(diào)動牽扯很多模塊,需要固件人員在早期就能夠參與進(jìn)來。這也進(jìn)一步突出了如何規(guī)劃一個跨平臺的方案在系統(tǒng)級測試上面有多么重要,我們不應(yīng)該被SV/UVM/C所限制,也應(yīng)該考慮如何讓這個測試平臺能夠被更多的人所使用。

7adaf46c-cd41-11ed-bfe3-dac502259ad0.png

相比于SoC仿真動輒需要用2天左右的時間完成某一個固件級的測試用例,emulation僅需要大概90分鐘的時間即能夠完成測試,并且更快地將性能數(shù)據(jù)反饋給架構(gòu)組合設(shè)計組。在將simulation與emulation對比過程中,無論是固件測試用例數(shù)量、可支持?jǐn)?shù)據(jù)幀的數(shù)目還是數(shù)據(jù)保存時間窗口,emulation的優(yōu)勢都更為明顯。

7aea8a76-cd41-11ed-bfe3-dac502259ad0.png

而在功耗評估中,emualtion的功耗評估數(shù)據(jù)準(zhǔn)確度與傳統(tǒng)的功耗分析工具差別大致在5%以內(nèi),而所消耗的時間則顯著縮短(大致是傳統(tǒng)功耗分析工具的125倍)。論文這里仍然沒有給出消耗時間的計算方式,是否包含了每個測試用例在simulation與emulation的耗時差別,還是只是包含了兩種工具用于功耗評估的時間。如果是后者的話,那么文中的power engine可能是內(nèi)部開發(fā)的工具了,線索在文章的引文中(有一篇“pre-silicon power estimation methodology using emulation”,也一并在論文下載鏈接中提供)。

給出的參考論文來自于SNUG India 2020,而在2021年的時候Synopsys推出了業(yè)界第一款用來對運行真實軟件做功耗驗證(hardware+software)的工具ZeBu Empower。 https://www.synopsys.com/verification/emulation/zebu-empower.html

7b16ff3e-cd41-11ed-bfe3-dac502259ad0.png

7b2fd874-cd41-11ed-bfe3-dac502259ad0.png

Fastest Power Emulation for Hardware-Software Power Verification

7b3cfe28-cd41-11ed-bfe3-dac502259ad0.png






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 控制器
    +關(guān)注

    關(guān)注

    114

    文章

    17890

    瀏覽量

    195342
  • soc
    soc
    +關(guān)注

    關(guān)注

    40

    文章

    4636

    瀏覽量

    230313
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41370

    瀏覽量

    302741
  • 硬件加速器
    +關(guān)注

    關(guān)注

    0

    文章

    43

    瀏覽量

    13550
  • 視覺處理芯片
    +關(guān)注

    關(guān)注

    2

    文章

    12

    瀏覽量

    6763

原文標(biāo)題:DVCon文賞-2023w14 一種用于AI視覺處理芯片的驗證加速方案

文章出處:【微信號:Rocker-IC,微信公眾號:路科驗證】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    RZ/V2MA:高效能視覺AI芯片的技術(shù)剖析與應(yīng)用指南

    RZ/V2MA:高效能視覺AI芯片的技術(shù)剖析與應(yīng)用指南 在當(dāng)今科技飛速發(fā)展的時代,視覺AI技術(shù)在眾多領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力。RZ/V2MA
    的頭像 發(fā)表于 04-01 11:45 ?187次閱讀

    京微齊力推出全新高性能AI視覺處理FPGA芯片產(chǎn)品

    2026 年 3 月 30 日,中國·北京,國內(nèi)自主研發(fā)高端通用 FPGA 芯片及新代異構(gòu)可編程計算芯片的供應(yīng)商京微齊力宣布,正式推出其飛馬 P 系列全新高性能 AI
    的頭像 發(fā)表于 03-31 15:39 ?241次閱讀

    NVIDIA 發(fā)布開放物理 AI 數(shù)據(jù)工廠 Blueprint,加速機(jī)器人、視覺 AI 智能體和智能汽車開發(fā)

    新聞?wù)?該藍(lán)圖支持大規(guī)模數(shù)據(jù)處理與整理、合成數(shù)據(jù)生成、強(qiáng)化學(xué)習(xí)以及物理 AI 模型的評估,適用于視覺 AI 智能體、機(jī)器人和智能汽車。
    的頭像 發(fā)表于 03-17 11:03 ?357次閱讀
    NVIDIA 發(fā)布開放物理 <b class='flag-5'>AI</b> 數(shù)據(jù)工廠 Blueprint,<b class='flag-5'>加速</b>機(jī)器人、<b class='flag-5'>視覺</b> <b class='flag-5'>AI</b> 智能體和智能汽車開發(fā)

    Cadence 推出 ChipStack? AI Super Agent,開辟芯片設(shè)計與驗證新紀(jì)元

    全球首個 AI 驅(qū)動的超級智能體,能夠根據(jù)規(guī)格和高層次描述自主創(chuàng)建并驗證設(shè)計 楷登電子(美國 Cadence 公司,NASDAQ:CDNS)近日宣布,推出用于前端芯片設(shè)計與
    的頭像 發(fā)表于 03-02 13:40 ?346次閱讀

    瑞芯微SOC智能視覺AI處理

    能力。核心升級: 增加了高規(guī)格的視頻編碼能力,支持H.264/H.265格式的4K@60fps編碼。目標(biāo): 解決了RK1126只能“分析”不能“錄制”的短板,成為個集視頻采集、AI智能分析、高質(zhì)量編碼錄制于體的完整解決
    發(fā)表于 12-19 13:44

    RK3576驅(qū)動高端顯控系統(tǒng)升級:多屏拼控與AI視覺融合解決方案

    多節(jié)點融合分析,實現(xiàn)全方位、立體化安防監(jiān)控 開發(fā)驗證平臺:加速顯控方案落地在顯控系統(tǒng)應(yīng)用驗證與快速原型設(shè)計階段,米爾電子的 MYD-LR3576 開發(fā)板是理想的硬件平臺。該開發(fā)板集成
    發(fā)表于 11-21 17:51

    AI眼鏡視覺處理芯片:從圖像感知到智能增強(qiáng)的技術(shù)躍遷

    ,而到2028年,隨著AR功能普及與視覺交互成為標(biāo)配,出貨量有望逼近4億臺。在這爆發(fā)性增長背后,視覺處理能力已成為AI眼鏡的核心競爭力,而
    的頭像 發(fā)表于 11-16 01:23 ?1.3w次閱讀
    <b class='flag-5'>AI</b>眼鏡<b class='flag-5'>視覺</b><b class='flag-5'>處理</b><b class='flag-5'>芯片</b>:從圖像感知到智能增強(qiáng)的技術(shù)躍遷

    極細(xì)同軸線在AI+FPGA視覺加速方案中的應(yīng)用

    極細(xì)同軸線束憑借其高帶寬、柔性結(jié)構(gòu)與優(yōu)異的電氣性能,正在成為 AI+FPGA 視覺系統(tǒng)中不可或缺的信號通道。它不僅優(yōu)化了高速數(shù)據(jù)傳輸?shù)姆€(wěn)定性,也為設(shè)備的小型化、輕量化提供了重要支持。隨著 AI
    的頭像 發(fā)表于 10-20 15:35 ?2071次閱讀
    極細(xì)同軸線在<b class='flag-5'>AI</b>+FPGA<b class='flag-5'>視覺</b><b class='flag-5'>加速</b><b class='flag-5'>方案</b>中的應(yīng)用

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    、現(xiàn)階段更智能、更接近AGI的6中算法與模型 1、MoE模型 MoE模型作為Transfomer模型的后繼者,代表著AI技術(shù)的項重大創(chuàng)新和發(fā)展。 優(yōu)勢: 在于能處理龐大的參數(shù)規(guī)模,顯著減少內(nèi)存占用
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用

    一種快速反應(yīng)能力,是直接的感知;靈感是一種通過思考和探索獲得的創(chuàng)造性想法,是一種創(chuàng)意。 AI怎么模擬直覺與靈感呢?四、AI代替人類的假說
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+化學(xué)或生物方法實現(xiàn)AI

    的憶阻器、MAC計算單元及存儲器 可以利用液體的流體力學(xué)特征做個納米級微流體系統(tǒng),用水柱來實現(xiàn)邏輯門。 ①用有機(jī)聚合物溶液實現(xiàn)互連、憶阻器和神經(jīng)網(wǎng)絡(luò) 有機(jī)聚合物計算通常被歸類為化學(xué)計算。 有一種有機(jī)
    發(fā)表于 09-15 17:29

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    Transformer和視覺Transformer模型。 ViTA是一種高效數(shù)據(jù)流AI加速器,用于在邊緣設(shè)備上部署計算密集型
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    的我我們講解了這幾種芯片的應(yīng)用場景,設(shè)計流程、結(jié)構(gòu)等。 CPU: 還為我們講解了一種算法:哈希表算法 GPU: 介紹了英偉達(dá)H100GPU芯片。使用了下關(guān)鍵技術(shù): ①張量
    發(fā)表于 09-12 16:07

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    :科技探索與 AGI 愿景》。 這本新書針對大模型技術(shù)浪潮,詳細(xì)講解了AI芯片的主流技術(shù)、挑戰(zhàn)與創(chuàng)新解決方案,并介紹了下芯片工藝和顛覆性
    發(fā)表于 07-28 13:54

    星宸芯片:中國AI視覺芯片的隱形冠軍

    在全球半導(dǎo)體產(chǎn)業(yè)競爭日益激烈的背景下,中國芯片企業(yè)正加速突圍,而 星宸科技(SigmaStar) 憑借其在 AI視覺芯片 領(lǐng)域的深耕,成為行
    的頭像 發(fā)表于 07-25 12:49 ?2953次閱讀
    蒙阴县| 辉南县| 东乡县| 石泉县| 高州市| 英吉沙县| 昂仁县| 武汉市| 洞口县| 昭苏县| 神农架林区| 兰考县| 大荔县| 庐江县| 滦平县| 扎赉特旗| 呈贡县| 宾川县| 长海县| 洮南市| 玉溪市| 鹰潭市| 梅州市| 辰溪县| 沂南县| 安阳县| 黄陵县| 方城县| 苍梧县| 自贡市| 南郑县| 敖汉旗| 铜梁县| 梁山县| 两当县| 井陉县| 都安| 台中市| 涡阳县| 揭阳市| 姚安县|