日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

聚焦 | 什么是AI芯片“存儲(chǔ)墻”的解決方案?

SSDFans ? 來(lái)源:YXQ ? 2019-06-18 15:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在2016年威海參加中國(guó)體系結(jié)構(gòu)年會(huì)的時(shí)候,孫所也說(shuō)了一句調(diào)侃的話:“現(xiàn)在的AI很火,大家都往那邊去,沒(méi)有人太關(guān)心體系結(jié)構(gòu)了,我要告訴那些追AI熱點(diǎn)的,它都死了三回了!” 的確,作為從小學(xué)馬列的中國(guó)人,我們最熟悉螺旋式上升的概念。對(duì)于計(jì)算和I/O來(lái)講,和中國(guó)經(jīng)濟(jì)調(diào)控一樣,都是“ 水多了加面,面多了加水”螺旋式上升。

Google在2017年發(fā)布了TPU V1之后,現(xiàn)在已經(jīng)有越來(lái)越多的AI startup的芯片出現(xiàn),大家基本上都是用標(biāo)準(zhǔn)的Resnet50,Googlenetv3 等網(wǎng)絡(luò)為benchmark, 一次一次地刷新性能和功耗比,個(gè)人覺(jué)得很有可能在一天,AI芯片的性能和功耗比在特定的imagenet的任務(wù)上超過(guò)人腦,現(xiàn)在AI在準(zhǔn)確率和性能上都超過(guò)了。對(duì)于AI的芯片來(lái)講,有一個(gè)指標(biāo)也是大家討論比較多的。Roofline model

Y軸是P,代表算力,用來(lái)FLOP/s來(lái)表示,現(xiàn)在新出的AI ASIC往往在FLOP/s并不發(fā)力,因?yàn)閺墓谋鹊慕嵌壬希懔隙ú皇窃礁咴胶?,而且大家都很難高過(guò)老黃的核彈。

代表了一個(gè)特定的計(jì)算平臺(tái)的peak performance,就是最大算力。

就是特定的計(jì)算平臺(tái)的I內(nèi)存/O帶寬,這個(gè)和該計(jì)算平臺(tái)使用的DDR類型有關(guān)。

X軸是I,代表計(jì)算強(qiáng)度,就是在一個(gè)Byte上的計(jì)算量。因?yàn)閷?duì)于一個(gè)特定的平臺(tái),我可以知道它的最大算力和帶寬,我們就可以知道它的最大的計(jì)算強(qiáng)度。

因此,和圖上顯示的一樣,在點(diǎn)(Imax,),這個(gè)計(jì)算平臺(tái)達(dá)到了完美。在它的左邊,說(shuō)明memory受限,在它的右邊說(shuō)明計(jì)算受限。

因此,對(duì)于我們之前分析的Alexnet這個(gè)網(wǎng)絡(luò),我們就知道了它的總的計(jì)算量就是:

內(nèi)存訪問(wèn)量 計(jì)算量
Conv1 770235 105415200
Maxpool1 430368
Conv2 1057632 223948800
Maxpool2 273152
Conv3 1057792 149520384
Conv4 1521792 112140288
Conv5 1036160 74760192
Maxpool3 61696
FC1 37766144 37748736
FC2 16789504 16777216
FC3 4102096 4096000
SUM 65021158 724406816

因?yàn)閷?duì)于每一次訪存都是32位的Float Point,因此整個(gè)內(nèi)存的占用就是 260MB左右,而計(jì)算量是724MFLOPs,因此Alexnet的計(jì)算強(qiáng)度就是724/260=2.7 operation/byte。

對(duì)于一個(gè)特定的平臺(tái),比如老黃家的新的GTX2080Ti 系列來(lái)講:

對(duì)于計(jì)算性能,先不管老黃加各種Tensor Core,RTcore,從CUDA Core本身來(lái)講,他是100TLOP/s,

它的內(nèi)存帶寬如下:

因此,作為2080Ti, 它的Imax就是166Operation/Byte.

可能到這個(gè),就可以看出,對(duì)于Alex的2.7 來(lái)講,遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到2080ti的計(jì)算強(qiáng)度,主要是受限于內(nèi)存帶寬了。

在Google的TPU中,有一個(gè)圖經(jīng)常被大家引用。

大家基本上可以看到,google的Imax差不多在1000左右,基本上沒(méi)有什么網(wǎng)絡(luò)可以完全用滿TPU的peak performance。

怎么辦,內(nèi)存帶寬的解決方案就是HBM,HBM2, HBM3不斷加大帶寬。記得在2017年的CNCC上,謝源教授講,他在2010年左右提出了HBM的概念,他很快就看到了AMD,Nvidia以及Xilinx和Intel都在芯片上使用了HBM,證明了這條道路的正確性。他認(rèn)為目前應(yīng)該在AI芯片上擺脫這種”水多了加面,面多了加水“,in-memory 計(jì)算應(yīng)該是下一個(gè)方向。

這個(gè)就引出了在Memory+會(huì)議上來(lái)自平頭哥的段立德博士的topic,”P(pán)rocessing Near or In memory for deep learning".

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54484

    瀏覽量

    469830
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41430

    瀏覽量

    302761

原文標(biāo)題:什么是AI芯片“存儲(chǔ)墻”的解決方案?

文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    德明利亮相2026環(huán)球資源香港展,聚焦消費(fèi)電子全場(chǎng)景存儲(chǔ)應(yīng)用

    2026年4月11-14日,環(huán)球資源電子展在香港順利舉辦。本屆展會(huì)集中呈現(xiàn)了產(chǎn)業(yè)鏈圍繞AI應(yīng)用演進(jìn)的技術(shù)方向,德明利以“全棧AI+存儲(chǔ)解決方案”為核心,
    的頭像 發(fā)表于 04-20 16:44 ?1853次閱讀
    德明利亮相2026環(huán)球資源香港展,<b class='flag-5'>聚焦</b>消費(fèi)電子全場(chǎng)景<b class='flag-5'>存儲(chǔ)</b>應(yīng)用

    得一微電子攜全場(chǎng)景AI存力芯片解決方案亮相CFMS MemoryS 2026

    技術(shù)革新,全面展現(xiàn)了行業(yè)正從價(jià)格周期向價(jià)值周期深度轉(zhuǎn)型的蓬勃圖景。在這場(chǎng)產(chǎn)業(yè)變革的浪潮中,得一微電子(YEESTOR)攜覆蓋移動(dòng)終端、智能汽車、智慧工業(yè)及數(shù)據(jù)中心的全場(chǎng)景AI存力芯片解決方案亮相,深刻詮釋了存力作為
    的頭像 發(fā)表于 04-08 15:31 ?531次閱讀

    Atmel AT88SC0104CA CryptoMemory芯片:高性能安全存儲(chǔ)解決方案

    Atmel AT88SC0104CA CryptoMemory芯片:高性能安全存儲(chǔ)解決方案 在電子設(shè)計(jì)領(lǐng)域,安全存儲(chǔ)一直是至關(guān)重要的環(huán)節(jié)。Atmel的AT88SC0104CA作為
    的頭像 發(fā)表于 04-05 15:40 ?734次閱讀

    德明利亮相CFMS 2026,全棧AI+存儲(chǔ)方案拓展智能場(chǎng)景應(yīng)用邊界

    2026年3月27日,MemoryS 2026峰會(huì)在深圳圓滿落幕。本屆峰會(huì)匯聚全球存儲(chǔ)產(chǎn)業(yè)鏈的核心廠商,德明利圍繞“全棧AI+存儲(chǔ)解決方案”,以面向
    的頭像 發(fā)表于 04-03 17:42 ?1578次閱讀
    德明利亮相CFMS 2026,全棧<b class='flag-5'>AI</b>+<b class='flag-5'>存儲(chǔ)</b>解<b class='flag-5'>方案</b>拓展智能場(chǎng)景應(yīng)用邊界

    慧榮科技攜全系列主控芯片及創(chuàng)新存儲(chǔ)解決方案亮相CFMS MemoryS 2026

    科技重磅展出了面向三大核心產(chǎn)品領(lǐng)域的全系列主控芯片及創(chuàng)新存儲(chǔ)解決方案,全面展示了在AI浪潮下的深厚技術(shù)沉淀與前瞻布局。同時(shí),慧榮科技總經(jīng)理茍嘉章(Wallace C. Kou)先生受邀
    的頭像 發(fā)表于 03-31 14:20 ?1836次閱讀

    海康存儲(chǔ)亮相CFMS 2026 全場(chǎng)景解決方案賦能AI存儲(chǔ)新生態(tài)

    與生態(tài)重構(gòu)等多重挑戰(zhàn)。海康存儲(chǔ)攜覆蓋消費(fèi)級(jí)、企業(yè)級(jí)、工規(guī)級(jí)、車規(guī)級(jí)的全場(chǎng)景存儲(chǔ)解決方案亮相,并重點(diǎn)展示其在數(shù)據(jù)中心、工業(yè)控制、智能汽車、智慧終端等領(lǐng)域的創(chuàng)新技術(shù)與落地實(shí)踐。
    的頭像 發(fā)表于 03-28 11:28 ?673次閱讀
    ???b class='flag-5'>存儲(chǔ)</b>亮相CFMS 2026 全場(chǎng)景<b class='flag-5'>解決方案</b>賦能<b class='flag-5'>AI</b><b class='flag-5'>存儲(chǔ)</b>新生態(tài)

    美光內(nèi)存和存儲(chǔ)解決方案驅(qū)動(dòng)智能未來(lái)

    從端側(cè)到云端,美光內(nèi)存和存儲(chǔ)解決方案廣泛覆蓋智駕、移動(dòng)端應(yīng)用、機(jī)器人、生成式AI和數(shù)據(jù)中心等領(lǐng)域,驅(qū)動(dòng)智能未來(lái)。
    的頭像 發(fā)表于 03-23 10:37 ?324次閱讀

    慧榮科技于Embedded World 2026展示AI優(yōu)化的啟動(dòng)存儲(chǔ)與企業(yè)級(jí)解決方案

    的啟動(dòng)存儲(chǔ)(Boot Storage)解決方案。與會(huì)者可前往1號(hào)館385號(hào)展位,了解其面向工業(yè)、嵌入式、汽車及數(shù)據(jù)中心應(yīng)用的啟動(dòng)存儲(chǔ)和主控芯片解決方
    的頭像 發(fā)表于 03-11 14:09 ?284次閱讀
    慧榮科技于Embedded World 2026展示<b class='flag-5'>AI</b>優(yōu)化的啟動(dòng)<b class='flag-5'>存儲(chǔ)</b>與企業(yè)級(jí)<b class='flag-5'>解決方案</b>

    如何突破AI存儲(chǔ)?深度解析ONFI 6.0高速接口與Chiplet解耦架構(gòu)

    1. 行業(yè)核心痛點(diǎn):AI存儲(chǔ)”危機(jī)在大模型訓(xùn)練與推理場(chǎng)景中,算力演進(jìn)速度遠(yuǎn)超存儲(chǔ)帶寬,計(jì)算與存儲(chǔ)之間的性能鴻溝(
    發(fā)表于 01-29 17:32

    國(guó)內(nèi)分布式AI存儲(chǔ)方案商港股IPO!

    據(jù)港交所1月27日披露,北京星辰天合科技股份有限公司(簡(jiǎn)稱“星辰天合”)向港交所主板遞交上市申請(qǐng)書(shū)。 ? 星辰天合專注于提供企業(yè)級(jí)AI存儲(chǔ)解決方案,助力企業(yè)大規(guī)模高效整合數(shù)據(jù)、決策及運(yùn)營(yíng)。兩類主要
    的頭像 發(fā)表于 01-29 13:44 ?8929次閱讀
    國(guó)內(nèi)分布式<b class='flag-5'>AI</b><b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>方案</b>商港股IPO!

    VS680 HDMI AI分析解決方案 #目標(biāo)識(shí)別 #視頻翻譯 #AI #芯片

    AI
    深蕾半導(dǎo)體
    發(fā)布于 :2025年11月12日 10:29:33

    佰維存儲(chǔ)AI時(shí)代的存儲(chǔ)解決方案

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)在GMIF2025大會(huì)上,佰維存儲(chǔ)CEO何瀚表示,端側(cè)AI對(duì)存儲(chǔ)的尺寸和功耗有著更為極致的要求。隨著在端側(cè)部署更大參數(shù)規(guī)模的AI模型成為趨勢(shì),需要更大容量
    的頭像 發(fā)表于 09-30 08:40 ?1.2w次閱讀
    佰維<b class='flag-5'>存儲(chǔ)</b>:<b class='flag-5'>AI</b>時(shí)代的<b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>解決方案</b>

    聚焦AI挑戰(zhàn)!MPS、安謀科技、Imagination及長(zhǎng)江存儲(chǔ)分享創(chuàng)新解決方案

    計(jì)算需求、能效優(yōu)化及技術(shù)快速迭代成為行業(yè)面臨的主要挑戰(zhàn)。在會(huì)上,MPS、安謀科技、Imagination Technologies以及長(zhǎng)江存儲(chǔ)等企業(yè)從不同角度分享了他們的創(chuàng)新解決方案。 ? MPS:高密度電源模塊,AI算力的隱形
    的頭像 發(fā)表于 08-26 21:39 ?5682次閱讀
    <b class='flag-5'>聚焦</b><b class='flag-5'>AI</b>挑戰(zhàn)!MPS、安謀科技、Imagination及長(zhǎng)江<b class='flag-5'>存儲(chǔ)</b>分享創(chuàng)新<b class='flag-5'>解決方案</b>

    AI 芯片浪潮下,職場(chǎng)晉升新契機(jī)?

    、新架構(gòu)不斷涌現(xiàn)。能夠在工作中提出創(chuàng)新性的解決方案,推動(dòng) AI 芯片性能、功耗、成本等關(guān)鍵指標(biāo)的優(yōu)化,將極大提升在職稱評(píng)審中的競(jìng)爭(zhēng)力。例如,在芯片設(shè)計(jì)中引入新的計(jì)算范式,如存算一體技術(shù)
    發(fā)表于 08-19 08:58

    【書(shū)籍評(píng)測(cè)活動(dòng)NO.64】AI芯片,從過(guò)去走向未來(lái):《AI芯片:科技探索與AGI愿景》

    :科技探索與 AGI 愿景》。 這本新書(shū)針對(duì)大模型技術(shù)浪潮,詳細(xì)講解了AI芯片的主流技術(shù)、挑戰(zhàn)與創(chuàng)新解決方案,并介紹了下一代芯片工藝和顛覆性AI
    發(fā)表于 07-28 13:54
    松桃| 晋宁县| 广宗县| 曲沃县| 沁源县| 若尔盖县| 德令哈市| 嘉义市| 康定县| 嘉荫县| 梅州市| 锡林郭勒盟| 河东区| 广昌县| 苗栗市| 三河市| 莆田市| 莱西市| 利津县| 遂川县| 宁津县| 巫山县| 砚山县| 玉田县| 曲周县| 北票市| 闽侯县| 泰来县| 高安市| 浙江省| 兴城市| 乌苏市| 武功县| 仁布县| 石台县| 鸡泽县| 厦门市| 江津市| 尖扎县| 大田县| 宜丰县|