日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Nature:人工智能芯片!

旺材芯片 ? 來(lái)源:納米人 ? 2023-09-05 16:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

具有數(shù)十億參數(shù)的人工智能AI)模型可以在一系列任務(wù)中實(shí)現(xiàn)高精度,但它們加劇了傳統(tǒng)通用處理器(例如圖形處理單元或中央處理單元)的低能效。模擬內(nèi)存計(jì)算(模擬 AI)可以通過(guò)在“內(nèi)存塊”上并行執(zhí)行矩陣向量乘法來(lái)提供更好的能源效率。然而,模擬人工智能尚未在需要許多此類圖塊以及圖塊之間神經(jīng)網(wǎng)絡(luò)激活的有效通信的模型上證明軟件等效(SWeq)準(zhǔn)確性。

有鑒于此,美國(guó)IBM 研究中心S. Ambrogio(一作兼通訊)等人展示了一款14 nm的模擬 AI 芯片,該芯片結(jié)合了跨 34 個(gè)區(qū)塊的 3500 萬(wàn)個(gè)相變存儲(chǔ)器件、大規(guī)模并行區(qū)塊間通信和模擬低功耗外圍電路,可實(shí)現(xiàn)12.4 萬(wàn)億次 / 秒 / 瓦運(yùn)算性能,能效是傳統(tǒng)數(shù)字計(jì)算機(jī)芯片的14倍。作者展示了小型關(guān)鍵字識(shí)別網(wǎng)絡(luò)的完全端到端 SWeq 精度,以及更大的 MLPerf 循環(huán)神經(jīng)網(wǎng)絡(luò)傳感器 (RNNT) 上接近 SWeq 的精度,其中超過(guò)4500萬(wàn)個(gè)權(quán)重映射到跨越5個(gè)芯片的1.4億個(gè)相變存儲(chǔ)器件上。

芯片架構(gòu)

作者展示了芯片的顯微照片,突出顯示了34個(gè)模擬塊的 2D 網(wǎng)格,每個(gè)塊都有512×2048PCM 交叉陣列。當(dāng)持續(xù)時(shí)間向量從模擬快發(fā)送到OLP時(shí),芯片有效地實(shí)現(xiàn)了基于斜坡的模數(shù)轉(zhuǎn)換器ADC)。所有權(quán)重配置、MAC操作和路由方案均由每個(gè)圖塊上可用的用戶可配置本地控制器(LC) 定義。本地SRAM存儲(chǔ)定義數(shù)百個(gè)控制信號(hào)的時(shí)間序列的所有指令,從而實(shí)現(xiàn)高度靈活的測(cè)試并簡(jiǎn)化設(shè)計(jì)驗(yàn)證,與預(yù)定義狀態(tài)機(jī)相比,面積損失較小。作者驗(yàn)證了持續(xù)時(shí)間可以在整個(gè)芯片上可靠地傳輸,最大誤差等于5ns(較短持續(xù)時(shí)間為 3ns)。

d0bbf1c2-4bba-11ee-a25d-92fbcf53809c.png

圖 芯片架構(gòu)

d10ba60e-4bba-11ee-a25d-92fbcf53809c.png

圖 可重構(gòu)架構(gòu)和路由

KWS任務(wù)

為了演示芯片在端到端網(wǎng)絡(luò)中的性能,實(shí)現(xiàn)了多類KWS任務(wù)。作者采用了 FC網(wǎng)絡(luò),實(shí)現(xiàn)了 86.75% 的分類準(zhǔn)確度。為了在芯片上實(shí)現(xiàn)完全端到端的傳輸,作者進(jìn)行了一系列修改,最終端到端實(shí)現(xiàn)總共使用四個(gè)圖塊。為了提高M(jìn)AC精度并補(bǔ)償外圍電路的不對(duì)稱性,引入了MAC不對(duì)稱平衡(AB)方法,測(cè)得的KWS精度為86.14%,完全在 MLPerf SWeq“等精度”極限 85.88%之內(nèi)。

d15d399c-4bba-11ee-a25d-92fbcf53809c.png

圖 端到端 KWS 任務(wù)

芯片上的 RNNT 映射

作者實(shí)施了MLPerf數(shù)據(jù)中心網(wǎng)絡(luò)RNNT作為行業(yè)相關(guān)的工作負(fù)載演示。當(dāng) RNNT等大型DNN以降低的數(shù)字精度實(shí)現(xiàn)時(shí),整個(gè)網(wǎng)絡(luò)的最佳精度選擇可能會(huì)有所不同。研究表明即使使用激進(jìn)的量化,不易受影響的層或整個(gè)網(wǎng)絡(luò)塊仍將提供較低的 WER,而高度敏感的塊即使對(duì)于少量的權(quán)重量化也將表現(xiàn)出較高的 WER。對(duì)每個(gè)單獨(dú)的層重復(fù)此過(guò)程以識(shí)別最敏感的層,接著將 MLPerf 權(quán)重映射到分布在5個(gè)芯片上的142個(gè)圖塊上。在總共 45,321,309 個(gè)網(wǎng)絡(luò)權(quán)重和偏差參數(shù)中,45,261,568 個(gè)被映射到模擬存儲(chǔ)器(權(quán)重的 99.9%)。

d1a90020-4bba-11ee-a25d-92fbcf53809c.png

圖 用于語(yǔ)音轉(zhuǎn)錄的 MLPerf RNNT 網(wǎng)絡(luò)

準(zhǔn)確度結(jié)果

作者展示了2513個(gè)音頻查詢的完整 Librispeech 驗(yàn)證數(shù)據(jù)集的權(quán)重映射和編程后的實(shí)驗(yàn)WER。總WER為9.475%,與SW 基線相比總體下降了 2.02%。在本實(shí)驗(yàn)中,通過(guò)芯片推斷完整的Librispeech驗(yàn)證數(shù)據(jù)集并保存輸出結(jié)果。然后將這些輸入到芯片 2 中,依此類推,輸入到所有 5 個(gè)芯片中。即使在PCM漂移超過(guò)1周后重復(fù)進(jìn)行,且沒(méi)有任何重新校準(zhǔn)或重量重新編程,RNNT WER 也僅下降了 0.4%。

d1eebab6-4bba-11ee-a25d-92fbcf53809c.png

圖 在 MLPerf RNNT上使用Librispeech進(jìn)行WER實(shí)驗(yàn)

電源和系統(tǒng)性能

作者還測(cè)量了推理操作期間每個(gè)芯片的全部功耗。所有控制和通信電路均以 0.8V 驅(qū)動(dòng)。芯片最佳功率性能 為12.40 TOPS/W。通過(guò)將積分時(shí)間減半,芯片的 TOPS/W 可以再提高 25%,但 WER 會(huì)額外降低1%。隨著重量的增加,使用本文報(bào)道的芯片的模擬人工智能系統(tǒng)可以在3.57W的功率下實(shí)現(xiàn)6.704TOPS/W,比MLPerf的最佳能效提高了14 倍,WER 為 9.258%。

d1f4fde0-4bba-11ee-a25d-92fbcf53809c.png

圖 MLPerf RNNT功率和系統(tǒng)性能

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54475

    瀏覽量

    469795
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50376

    瀏覽量

    267090
  • 存儲(chǔ)器件
    +關(guān)注

    關(guān)注

    1

    文章

    34

    瀏覽量

    10016

原文標(biāo)題:Nature:人工智能芯片!

文章出處:【微信號(hào):wc_ysj,微信公眾號(hào):旺材芯片】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    嵌入式人工智能課程(華清遠(yuǎn)見)

    嵌入式 AI 編譯器優(yōu)化:華清遠(yuǎn)見課程,解鎖極致端側(cè)性能 隨著人工智能從云端全面向邊緣側(cè)和終端側(cè)下沉,“萬(wàn)物智聯(lián)”的時(shí)代已經(jīng)悄然到來(lái)。然而,在這股浪潮背后,隱藏著一個(gè)巨大的技術(shù)鴻溝:在算力受限
    發(fā)表于 04-16 18:47

    人工智能五大核心:芯片、算力、數(shù)據(jù)、算法、能源 !

    在全球科技革命的浩蕩浪潮中,人工智能已成為重塑人類文明形態(tài)的核心驅(qū)動(dòng)力。那么,人工智能究竟由何構(gòu)成?支撐其持續(xù)迭代進(jìn)化的內(nèi)在技術(shù)體系又是什么?本文聚焦人工智能發(fā)展的五大核心支柱:芯片
    的頭像 發(fā)表于 04-16 12:47 ?725次閱讀
    <b class='flag-5'>人工智能</b>五大核心:<b class='flag-5'>芯片</b>、算力、數(shù)據(jù)、算法、能源 !

    淺談人工智能(2)

    接前文《淺談人工智能(1)》。 (5)什么是弱人工智能、強(qiáng)人工智能以及超人工智能? 弱人工智能(Weak AI),也稱限制領(lǐng)域
    的頭像 發(fā)表于 02-22 08:24 ?385次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    維信諾與清華北大合作成果亮相國(guó)際頂級(jí)期刊Nature

    1月28日,清華大學(xué)聯(lián)合北京大學(xué)與維信諾合作開發(fā)的世界首款柔性存算芯片——FLEXI,在國(guó)際頂級(jí)期刊《自然》(Nature)上發(fā)表。這標(biāo)志著我國(guó)在柔性電子與邊緣人工智能硬件領(lǐng)域取得重要突破,填補(bǔ)了高性能柔性AI計(jì)算
    的頭像 發(fā)表于 02-11 14:31 ?653次閱讀

    開發(fā)智能體配置-內(nèi)容合規(guī)

    智能體上架前,需完成“人工智能生成合成內(nèi)容標(biāo)識(shí)”和“大模型備案信息”填寫 ,以供平臺(tái)審核;可在智能體【配置】-【內(nèi)容合規(guī)】中填寫。 人工智能生成合成內(nèi)容標(biāo)識(shí) “
    發(fā)表于 02-07 11:44

    自然智能與人工智能融合如何重塑芯片設(shè)計(jì)

    人類大腦是所有處理器中最復(fù)雜的,能夠構(gòu)思出不可思議的創(chuàng)意,解決復(fù)雜、微妙的問(wèn)題。相比之下,人工智能擅長(zhǎng)快速分析海量數(shù)據(jù)并高效執(zhí)行任務(wù)。當(dāng)自然智能人工智能融合的結(jié)果,就是芯片設(shè)計(jì)領(lǐng)域正
    的頭像 發(fā)表于 01-15 13:58 ?717次閱讀

    人工智能+消費(fèi):技術(shù)賦能與芯片驅(qū)動(dòng)未來(lái)

    電子發(fā)燒友網(wǎng)站提供《人工智能+消費(fèi):技術(shù)賦能與芯片驅(qū)動(dòng)未來(lái).pptx》資料免費(fèi)下載
    發(fā)表于 11-26 14:50 ?41次下載

    墨芯人工智能亮相2025外灘大會(huì)

    9月10日至13日,墨芯人工智能在2025外灘大會(huì)盛大亮相,成為"數(shù)據(jù)與計(jì)算展區(qū)"備受矚目的焦點(diǎn)之一。作為深耕稀疏計(jì)算的AI芯片企業(yè),墨芯在此次展會(huì)上全方位展示了其人工智能芯片、高性能
    的頭像 發(fā)表于 09-11 14:04 ?975次閱讀

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹這對(duì)開發(fā)人員意味著什么,以及使用 Neuton 模型如何改進(jìn)您的開發(fā)和終端
    發(fā)表于 08-31 20:54

    人工智能+”,走老路難賺到新錢

    昨天的“人工智能+”刷屏了,這算是官方第一次對(duì)“人工智能+”這個(gè)名稱定性吧?今年年初到現(xiàn)在,涌現(xiàn)出了一大批基于人工智能的創(chuàng)業(yè)者,這已經(jīng)算是AI2.0時(shí)代的第三波創(chuàng)業(yè)潮了,第一波是基礎(chǔ)大模型,第二波
    的頭像 發(fā)表于 08-27 13:21 ?920次閱讀
    “<b class='flag-5'>人工智能</b>+”,走老路難賺到新錢

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來(lái)給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學(xué),便捷拉滿 這個(gè)實(shí)驗(yàn)箱真的是為使用者
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來(lái)給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學(xué),便捷拉滿 這個(gè)實(shí)驗(yàn)箱真的是為使用者
    發(fā)表于 08-07 14:23

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級(jí)芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競(jìng)爭(zhēng)對(duì)手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹
    發(fā)表于 07-31 11:38

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能
    發(fā)表于 07-14 11:23

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會(huì)發(fā)展的當(dāng)下,無(wú)論是探索未來(lái)職業(yè)方向,還是更新技術(shù)儲(chǔ)備,掌握大模型知識(shí)都已成為新時(shí)代的必修課。從職場(chǎng)上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10
    乌拉特后旗| 教育| 青海省| 新竹县| 大荔县| 日喀则市| 霸州市| 蕲春县| 嘉义市| 陆良县| 观塘区| 商都县| 宁化县| 舒兰市| 区。| 汝州市| 桦川县| 建水县| 咸丰县| 司法| 鞍山市| 平乐县| 富宁县| 罗平县| 明光市| 铁岭县| 湖州市| 万载县| 延边| 庆云县| 定兴县| 全州县| 乐平市| 泽普县| 阿克苏市| 庄河市| 凉城县| 乌拉特中旗| 龙南县| 太仓市| 兰溪市|