日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大規(guī)模人工智能(AI)處理器的功耗分析方法

天數(shù)智芯 ? 來(lái)源:天數(shù)智芯 ? 作者:天數(shù)智芯 ? 2022-01-17 16:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,來(lái)自天數(shù)智芯公司Power團(tuán)隊(duì)的三位工程師闕詩(shī)璇、孫凌、甘振華合作發(fā)表的技術(shù)論文《左移:大規(guī)模人工智能(AI)處理器的功耗分析方法》順利入選第58屆(國(guó)際設(shè)計(jì)自動(dòng)化會(huì)議,Design Automation Conference),并做poster presentation。

文章主要內(nèi)容如下:

AI芯片最重要的設(shè)計(jì)指標(biāo)之一就是單位功耗每瓦算力(TOPS/W),因此低功耗設(shè)計(jì)對(duì)于AI芯片的設(shè)計(jì)實(shí)現(xiàn),在市場(chǎng)中具備競(jìng)爭(zhēng)力都十分重要。然而原有的功耗分析方法存在一定的不足,對(duì)新的需求也無(wú)法滿(mǎn)足:

1.原有方法只是對(duì)功能驗(yàn)證的場(chǎng)景,而缺乏真實(shí)的應(yīng)用場(chǎng)景,跟真實(shí)的軟件應(yīng)用有一定的差距;

2.傳統(tǒng)的功耗分析需要綜合后的網(wǎng)表和門(mén)級(jí)的向量,這在項(xiàng)目早期很難獲取,太晚介入會(huì)讓功耗優(yōu)化受限;

3.對(duì)于仿真時(shí)間長(zhǎng)的向量,尤其是要按時(shí)間分析功耗時(shí),所需的運(yùn)行時(shí)間和資源都是巨大的;

4.自適應(yīng)電壓頻率縮放等需要有實(shí)時(shí)的功耗才能進(jìn)行軟硬件控制,這是原有方法無(wú)法實(shí)現(xiàn)的;

5.為了搶占市場(chǎng),需要更快的迭代設(shè)計(jì),因此設(shè)計(jì)人員希望每周甚至每天都可以對(duì)低功耗功能進(jìn)行驗(yàn)證,原有方法很難趕上驗(yàn)證迭代的速度;

為了解決這些挑戰(zhàn)跟需求,天數(shù)智芯提出了一種創(chuàng)新的功耗分析方案:利用一種功耗分析工具對(duì)所給的仿真向量進(jìn)行高性能的按時(shí)間分析功耗的分布,從而得到平均功耗和峰值功耗等參數(shù)。這種方法在RTL階段就進(jìn)行分析,有利于對(duì)AI處理器進(jìn)行優(yōu)化功耗的迭代,最終實(shí)現(xiàn)項(xiàng)目功耗目標(biāo)。與之前的方法相比較,它在某些實(shí)驗(yàn)中,可以達(dá)到100甚至1000倍的加速。

接下來(lái)將展開(kāi)描述該方案在實(shí)際工作中的一個(gè)應(yīng)用:通過(guò)機(jī)器學(xué)習(xí)的訓(xùn)練得到實(shí)時(shí)功耗預(yù)測(cè)模型。

現(xiàn)在所用的新的功耗分析方法和原有的按時(shí)間分析網(wǎng)表的功耗分析方法,具有很好的相關(guān)一致性。所以利用它超高倍加速的分析能力,可以用于各種應(yīng)用場(chǎng)景激勵(lì)產(chǎn)生訓(xùn)練模型所需要的充足的數(shù)據(jù)集。當(dāng)訓(xùn)練數(shù)據(jù)集達(dá)到百萬(wàn)甚至是上億級(jí)別,通過(guò)機(jī)器學(xué)習(xí)算法得到的模型就比較準(zhǔn)確。這是依賴(lài)新的分析方法才能得到的,傳統(tǒng)的分析方法無(wú)法產(chǎn)生這么大的數(shù)據(jù)量。

我們用機(jī)器學(xué)習(xí)的算法對(duì)各個(gè)模塊進(jìn)行參數(shù)訓(xùn)練,從而得到最佳的預(yù)測(cè)模型,這樣就可以用于預(yù)測(cè)實(shí)時(shí)功耗,從而實(shí)現(xiàn)軟硬件的控制。

經(jīng)過(guò)幾天的訓(xùn)練,我們最終得到的預(yù)測(cè)模型與真實(shí)的功耗之間的誤差只有不到5%。

總的來(lái)看,創(chuàng)新的功耗分析方法與傳統(tǒng)流程相比,能在項(xiàng)目早期介入,所需要的運(yùn)行時(shí)間跟內(nèi)存消耗大大減少,可以在設(shè)計(jì)階段進(jìn)行快速的迭代。它不僅僅可以對(duì)原有的功能驗(yàn)證激勵(lì)進(jìn)行分析,對(duì)于原型驗(yàn)證的真實(shí)的應(yīng)用場(chǎng)景向量也可以進(jìn)行分析,從而得到更真實(shí)的功耗相關(guān)指標(biāo),且與項(xiàng)目最終簽核時(shí)的數(shù)據(jù)具有一致性。利用它的快速和節(jié)省資源特性,能夠?yàn)閷?shí)時(shí)功耗的預(yù)測(cè)模型提供大量充足的數(shù)據(jù)樣本,最終得到誤差5%以?xún)?nèi)的預(yù)測(cè)模型。

關(guān)于DAC

DAC(國(guó)際設(shè)計(jì)自動(dòng)化會(huì)議,Design Automation Conference)與ICCAD(國(guó)際計(jì)算機(jī)輔助設(shè)計(jì)會(huì)議,International Conference on Computer Aided Design)、DATE(歐洲設(shè)計(jì)自動(dòng)化與測(cè)試學(xué)術(shù)會(huì)議,Design, Automation and Test in Europe)、ASP-DAC(亞太地區(qū)設(shè)計(jì)自動(dòng)化會(huì)議,Asia and South Pacific Design Automation Conference)一起被公認(rèn)為電子設(shè)計(jì)自動(dòng)化領(lǐng)域水平最高的四大國(guó)際會(huì)議。

關(guān)于天數(shù)智芯

上海天數(shù)智芯半導(dǎo)體有限公司(簡(jiǎn)稱(chēng)“天數(shù)智芯”)于2018年正式啟動(dòng)7納米通用并行(GPGPU)云端計(jì)算芯片設(shè)計(jì),是中國(guó)第一家通用并行(GPGPU)云端計(jì)算芯片及高性能算力系統(tǒng)提供商。公司以“成為智能社會(huì)的賦能者”為使命,專(zhuān)注于云端服務(wù)器級(jí)的通用并行高性能云端計(jì)算芯片,瞄準(zhǔn)以云計(jì)算、人工智能、數(shù)字化轉(zhuǎn)型為代表的數(shù)據(jù)驅(qū)動(dòng)技術(shù)市場(chǎng),解決核心算力瓶頸問(wèn)題。重點(diǎn)打造自主可控、國(guó)際一流的通用、標(biāo)準(zhǔn)、高性能云端計(jì)算GPGPU芯片,從芯片端解決算力問(wèn)題。

原文標(biāo)題:天數(shù)智芯技術(shù)論文入選第58屆DAC

文章出處:【微信公眾號(hào):天數(shù)智芯】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 參數(shù)
    +關(guān)注

    關(guān)注

    11

    文章

    1870

    瀏覽量

    34044
  • 自動(dòng)化
    +關(guān)注

    關(guān)注

    31

    文章

    5989

    瀏覽量

    90696
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50367

    瀏覽量

    267062

原文標(biāo)題:天數(shù)智芯技術(shù)論文入選第58屆DAC

文章出處:【微信號(hào):IluvatarCoreX,微信公眾號(hào):天數(shù)智芯】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    嵌入式人工智能課程(華清遠(yuǎn)見(jiàn))

    嵌入式 AI 編譯優(yōu)化:華清遠(yuǎn)見(jiàn)課程,解鎖極致端側(cè)性能 隨著人工智能從云端全面向邊緣側(cè)和終端側(cè)下沉,“萬(wàn)物智聯(lián)”的時(shí)代已經(jīng)悄然到來(lái)。然而,在這股浪潮背后,隱藏著一個(gè)巨大的技術(shù)鴻溝:在算力受限
    發(fā)表于 04-16 18:47

    自然智能與人工智能融合如何重塑芯片設(shè)計(jì)

    人類(lèi)大腦是所有處理器中最復(fù)雜的,能夠構(gòu)思出不可思議的創(chuàng)意,解決復(fù)雜、微妙的問(wèn)題。相比之下,人工智能擅長(zhǎng)快速分析海量數(shù)據(jù)并高效執(zhí)行任務(wù)。當(dāng)自然智能
    的頭像 發(fā)表于 01-15 13:58 ?712次閱讀

    Magna AI加入NVIDIA Inception計(jì)劃,推動(dòng)生產(chǎn)級(jí)人工智能規(guī)模化發(fā)展

    智能交付的頂尖人工智能機(jī)構(gòu)行列。 Magna AI的加入,體現(xiàn)了其與NVIDIA人工智能平臺(tái)之間高度契合的技術(shù)協(xié)同關(guān)系。這一合作基于Magna A
    的頭像 發(fā)表于 01-12 15:46 ?284次閱讀

    瑞芯微SOC智能視覺(jué)AI處理器

    需要連接多種外設(shè)的產(chǎn)品。顯示: 支持雙屏異顯,最高4K@60fps輸出。 RK1126B: 一款集成自研NPU的智能視覺(jué)AI處理器,專(zhuān)注于視頻輸入端的AI
    發(fā)表于 12-19 13:44

    瑞薩電子RZ/V系列微處理器助力邊緣AI開(kāi)發(fā)

    邊緣AI越來(lái)越多地應(yīng)用于諸如工業(yè)攝像頭和公共設(shè)施攝像頭等嵌入式設(shè)備中,并要求嵌入式產(chǎn)品小型化且具有低功耗。瑞薩電子RZ/V系列微處理器(MPU)內(nèi)置AI加速
    的頭像 發(fā)表于 09-23 10:31 ?1141次閱讀
    瑞薩電子RZ/V系列微<b class='flag-5'>處理器</b>助力邊緣<b class='flag-5'>AI</b>開(kāi)發(fā)

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    nRF52805),只占用幾千字節(jié)的非易失性存儲(chǔ)(NVM)。這使得以前被認(rèn)為不可能的應(yīng)用也能增加 ML 功能。例如,您現(xiàn)在可以在廣泛的傳感網(wǎng)絡(luò)的每個(gè)節(jié)點(diǎn)上進(jìn)行人工智能處理,而在這
    發(fā)表于 08-31 20:54

    AI 芯片浪潮下,職場(chǎng)晉升新契機(jī)?

    方向,就明確涵蓋了人工智能芯片的研發(fā)、部署與優(yōu)化技術(shù)崗位 。如果你從事 GPU 相關(guān)研發(fā)工作,在申報(bào)職稱(chēng)時(shí),就需著重突出在圖形處理加速、大規(guī)模并行計(jì)算等方面的成果,因?yàn)?GPU 的高并行結(jié)構(gòu)及強(qiáng)大浮點(diǎn)
    發(fā)表于 08-19 08:58

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    和生態(tài)體系帶到使用者身邊 ,讓我們?cè)诩夹g(shù)學(xué)習(xí)和使用上不再受制于人。 三、多模態(tài)實(shí)驗(yàn),解鎖AI全流程 它嵌入了2D視覺(jué)、深度視覺(jué)、機(jī)械手臂、語(yǔ)音識(shí)別、嵌入式傳感等多種類(lèi)AI模塊,涵蓋人工智能
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    和生態(tài)體系帶到使用者身邊 ,讓我們?cè)诩夹g(shù)學(xué)習(xí)和使用上不再受制于人。 三、多模態(tài)實(shí)驗(yàn),解鎖AI全流程 它嵌入了2D視覺(jué)、深度視覺(jué)、機(jī)械手臂、語(yǔ)音識(shí)別、嵌入式傳感等多種類(lèi)AI模塊,涵蓋人工智能
    發(fā)表于 08-07 14:23

    關(guān)于人工智能處理器的11個(gè)誤解

    本文轉(zhuǎn)自:TechSugar編譯自ElectronicDesign人工智能浪潮已然席卷全球,將人工智能加速處理器整合到各類(lèi)應(yīng)用中也變得愈發(fā)普遍。然而,圍繞它們是什么、如何運(yùn)作、能如
    的頭像 發(fā)表于 08-07 13:21 ?1277次閱讀
    關(guān)于<b class='flag-5'>人工智能</b><b class='flag-5'>處理器</b>的11個(gè)誤解

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    DeepSeek-R1:強(qiáng)大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開(kāi)發(fā)的新一代AI大模型。其核心優(yōu)勢(shì)在于強(qiáng)大的推理引擎能力,融合了自然語(yǔ)言處理
    發(fā)表于 07-16 15:29

    迅為RK3588開(kāi)發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能

    迅為RK3588開(kāi)發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能
    發(fā)表于 07-14 11:23

    格羅方德擬收購(gòu)人工智能處理器IP供應(yīng)商MIPS

    近日,格羅方德(GlobalFoundries)宣布達(dá)成一項(xiàng)最終協(xié)議,擬收購(gòu)人工智能AI)和處理器IP領(lǐng)域的領(lǐng)先供應(yīng)商MIPS。此次戰(zhàn)略收購(gòu)將拓展格羅方德可定制IP產(chǎn)品的陣容,使其能夠借助IP和軟件能力,進(jìn)一步凸顯工藝技術(shù)的差
    的頭像 發(fā)表于 07-09 18:03 ?1352次閱讀

    AI芯片:加速人工智能計(jì)算的專(zhuān)用硬件引擎

    人工智能AI)的快速發(fā)展離不開(kāi)高性能計(jì)算硬件的支持,而傳統(tǒng)CPU由于架構(gòu)限制,難以高效處理AI任務(wù)中的大規(guī)模并行計(jì)算需求。因此,專(zhuān)為
    的頭像 發(fā)表于 07-09 15:59 ?1991次閱讀

    如何構(gòu)建邊緣人工智能基礎(chǔ)設(shè)施

    隨著人工智能的不斷發(fā)展,其爭(zhēng)議性也越來(lái)越大;而在企業(yè)和消費(fèi)者的眼中,人工智能價(jià)值顯著。如同許多新興科技一樣,目前人工智能的應(yīng)用主要聚焦于大規(guī)模、基礎(chǔ)設(shè)施密集且高
    的頭像 發(fā)表于 06-09 09:48 ?1228次閱讀
    安顺市| 醴陵市| 大城县| 临城县| 临邑县| 江门市| 嘉鱼县| 横山县| 高碑店市| 嘉义市| 高青县| 监利县| 永吉县| 苗栗市| 福建省| 舞钢市| 望奎县| 铅山县| 饶阳县| 宣恩县| 益阳市| 浦北县| 广西| 泗阳县| 都兰县| 托里县| 尤溪县| 泸州市| 黑河市| 射阳县| 敦煌市| 望奎县| 治县。| 唐河县| 宁化县| 东光县| 嘉禾县| 洛浦县| 邹平县| 沐川县| 洪洞县|