日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

特斯拉的下一代AI芯片:存算一體

佐思汽車研究 ? 來源:佐思汽車研究 ? 2023-03-09 09:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

ChatGPT的火爆預(yù)示了自動(dòng)駕駛的方向:大模型(至少超過100億個(gè)參數(shù))和高算力(至少1000TOPS@FP16)。ChatGPT完美展示了大模型的優(yōu)勢,也讓英偉達(dá)欣喜若狂,英偉達(dá)、AMD英特爾是最大受益者(英偉達(dá)最頂級(jí)的DGX-H100中的CPU是英特爾的W3495X,國內(nèi)售價(jià)高達(dá)每片8萬人民幣),還有幾乎壟斷高端服務(wù)器市場的中國臺(tái)灣企業(yè)廣達(dá)和英業(yè)達(dá),科技巨頭每年需要花費(fèi)數(shù)百億乃至上千億美元購買新的服務(wù)器來處理越來越大的AI模型,并且會(huì)持續(xù)數(shù)十年。

高算力讓存儲(chǔ)墻愈加明顯,存儲(chǔ)系統(tǒng)的成本也持續(xù)攀升,AI芯片價(jià)格越來越高,未來10萬美元甚至百萬美元級(jí)AI芯片也極有可能。要完美解決存儲(chǔ)墻問題是不可能的,折中的辦法是存算一體。這雖然無法解決芯片成本趨高的問題,但是可以解決1000TOPS算力的問題。

根據(jù)存儲(chǔ)與計(jì)算的距離遠(yuǎn)近,將廣義存算一體的技術(shù)方案分為三大類,分別是近存計(jì)算 (Processing Near Memory,PNM)、存內(nèi)處理(Processingln Memory,PIM) 和存內(nèi)計(jì)算(Computing in Memory, CIM)。其中,存內(nèi)計(jì)算即狹義的存算一體。

存內(nèi)計(jì)算面臨的最大挑戰(zhàn)是內(nèi)存和高性能計(jì)算都是高度集中的行業(yè),巨頭們出于利潤的考量,不會(huì)允許革命性的存內(nèi)計(jì)算顛覆其所屬的壟斷行業(yè)。內(nèi)存行業(yè),美光、三星和SK Hynix在高性能存儲(chǔ)領(lǐng)域市占率達(dá)100%。高性能計(jì)算領(lǐng)域,英特爾、AMD和英偉達(dá)的市場占有率也接近100%。臺(tái)積電和三星聯(lián)合壟斷了高性能芯片代工領(lǐng)域。7納米以下晶圓廠產(chǎn)能是最具話語權(quán)的武器,沒有這個(gè),高性能計(jì)算便是空中樓閣。

PNM已經(jīng)非常常見,即HBM與CPU一體,所有高性能計(jì)算芯片都是如此,采用HBM堆疊,2.5D封裝,硅中介層(Interposer)內(nèi)聯(lián)在基板上。也可以反推,沒有采用HBM就不是高性能計(jì)算芯片。特斯拉二代FSD已經(jīng)用上了GDDR6,下一代基本可以肯定是HBM3了。

d7ecdc00-be15-11ed-bfe3-dac502259ad0.png

PIM則是再下一階段熱點(diǎn)

圖片來源:Planet

d81b9c0c-be15-11ed-bfe3-dac502259ad0.png

PIM已經(jīng)有商業(yè)化的實(shí)例,最早的實(shí)例是Xilinx的Alveo U280

圖片來源:Planet

d836f1c8-be15-11ed-bfe3-dac502259ad0.png

PIM可以大幅度降低存取功耗

圖片來源:Planet

d855242c-be15-11ed-bfe3-dac502259ad0.png

圖片來源:三星

AMD收購Xilinx,其中最看中的就是PIM堆疊技術(shù),AMD后來將其用在InstinctMI100/MI250/MI150/MI210系列GPU上,這也是美國商務(wù)部禁止向中國出售的芯片。MI100的性能能夠超越英偉達(dá)的上一代旗艦A100,功耗較A100降低約25%,價(jià)格也低于A100約30%。MI250與英偉達(dá)新旗艦H100持平,在FP32和FP64上,MI250更強(qiáng);在FP16上,H100遠(yuǎn)超MI250。

PIM的主角還是三星,配角是AMD,三星Aquabolt-XLHBM2-PIM是目前唯一PIM內(nèi)存。

Aquabolt-XL HBM2-PIM架構(gòu)

d86e5050-be15-11ed-bfe3-dac502259ad0.png

圖片來源:三星

PIM非常簡單,就是用硅通孔(Through Silicon Via, TSV)技術(shù)將計(jì)算單元塞進(jìn)內(nèi)存上下BANK之間。TSV技術(shù)人類2010年就掌握了,只不過迄今還不算特別成熟,價(jià)格還是有點(diǎn)高。

d888ef46-be15-11ed-bfe3-dac502259ad0.png

圖片來源:三星

計(jì)算單元很簡單,一個(gè)FP16矩陣乘法,一個(gè)FP16矩陣加法。輸入命令解碼和行列地址即可。

PIM運(yùn)作模式

d8b32180-be15-11ed-bfe3-dac502259ad0.png

圖片來源:三星

PIM的軟件棧

d8cb9292-be15-11ed-bfe3-dac502259ad0.png

圖片來源:三星

在2023CES消費(fèi)電子展上,AMD推出了MI300,PIM似乎升級(jí)到了HBM3。

d8e0dc1a-be15-11ed-bfe3-dac502259ad0.png

圖片來源:AMD

國人一心打破美國的科技?jí)艛?,由于缺乏先進(jìn)2.5D和3D封裝產(chǎn)能和技術(shù),中國企業(yè)對(duì)PNM和PIM完全不感興趣,聚焦的是真正的存算一體,即存內(nèi)計(jì)算。

其本質(zhì)是利用不同存儲(chǔ)介質(zhì)的物理特性,對(duì)存儲(chǔ)電路進(jìn)行重新設(shè)計(jì)使其同時(shí)具備計(jì)算和存儲(chǔ)能力,直接消除“存〞“算〞界限,使計(jì)算能效達(dá)到數(shù)量級(jí)提升的目標(biāo)。在存儲(chǔ)原位上實(shí)現(xiàn)計(jì)算,是真正的存算一體。存算一體理論上完美,但目前離實(shí)用至少還有10年距離。

存內(nèi)計(jì)算主要包含數(shù)字和模擬兩種實(shí)現(xiàn)方式,二者適用于不同應(yīng)用場景。模擬存內(nèi)計(jì)算能效高,但誤差較大,適用于低精度、低功耗計(jì)算場景,如端側(cè)可穿戴設(shè)備等。模擬存內(nèi)計(jì)算還涉及復(fù)雜的模數(shù)轉(zhuǎn)換器ADC)、數(shù)模轉(zhuǎn)換器DAC)、跨阻放大器(TIA) 等模塊。ADC和DAC領(lǐng)域需要幾十年經(jīng)驗(yàn)長期摸索,全球精通ADC和DAC的僅有ADI、德州儀器NXP三家,其中ADI最強(qiáng),正是牽涉大量模擬部分,存內(nèi)計(jì)算無法使用EDA工具,導(dǎo)致芯片開發(fā)成本高、周期長、規(guī)模小、算力低。

一直以來,主流的存內(nèi)計(jì)算大多采用模擬計(jì)算實(shí)現(xiàn),近兩年數(shù)字存內(nèi)計(jì)算的研究熱度也有所提升。模擬存內(nèi)計(jì)算主要基于物理定律(歐姆定律和基爾霍夫定律),在存算陣列上實(shí)現(xiàn)乘加運(yùn)算。數(shù)字存內(nèi)計(jì)算通過在存儲(chǔ)陣列內(nèi)部加入邏輯計(jì)算電路,如與門和加法器等,使數(shù)字存內(nèi)計(jì)算陣列具備存儲(chǔ)及計(jì)算能力。數(shù)字存內(nèi)計(jì)算精度高,但是其存儲(chǔ)單元只能存儲(chǔ)單比特?cái)?shù)據(jù),而目前主流人工智能訓(xùn)練是32或64比特?cái)?shù)據(jù),這嚴(yán)重限制了其應(yīng)用范圍,并且數(shù)字存內(nèi)計(jì)算需增加加法樹邏輯電路,很大程度上限制了面積及能效優(yōu)勢。也就是目前存內(nèi)計(jì)算在高算力領(lǐng)域沒有容身之地的原因。

存內(nèi)計(jì)算最重要的部分就是存儲(chǔ)器件本身,算法之類的軟件部分幾乎可以忽略。目前存儲(chǔ)器主要有易失性存儲(chǔ)器和非易失存儲(chǔ)器件。易失性存儲(chǔ)器在設(shè)備掉電之后數(shù)據(jù)丟失,如SRAM等。非易失性存儲(chǔ)器在設(shè)備掉電后數(shù)據(jù)可保持不變,如NOR Flash、可變電阻隨機(jī)存儲(chǔ)器 (Resistive Random Access Memory, RRAM或ReRAM)、磁性隨機(jī)存儲(chǔ)器(Magnetoresistive Random Access Memory, MRAM)、相變存儲(chǔ)器 (Phase ChangeMemory, PCM)等。中國企業(yè)或機(jī)構(gòu)主要研究的是鐵電晶體管FeFET。傳統(tǒng)的SRAM、DRAM、NAND被三星、美光和SK Hynix壟斷,因此基于傳統(tǒng)存儲(chǔ)的存內(nèi)計(jì)算無論如何都無法對(duì)抗這三大巨頭,大部分機(jī)構(gòu)或企業(yè)都選擇另辟蹊徑。

幾種新興存儲(chǔ)器的技術(shù)對(duì)比

d909b07c-be15-11ed-bfe3-dac502259ad0.jpg

需要指出,目前存儲(chǔ)器制造也需要EUV***了,而EUV***被ASML壟斷,又聽命于美國政府。通常認(rèn)為,DRAM的天花板是10nm。其原因是在傳統(tǒng)1T1C架構(gòu)下,單位元件面積不斷減小,如何保證電容能夠存儲(chǔ)足夠的電荷、防止相鄰存儲(chǔ)單元之間的耦合,是DRAM推進(jìn)到10nm以下的無解難題,而EUV是用來做7nm以下的,DRAM目前主流是14納米。14納米理論上完全可以用DUV來完成,不需要EUV。

但實(shí)際情況并非如此,三星電子的1Znm節(jié)點(diǎn)DRAM量產(chǎn)結(jié)果表明,相比于DUV浸沒式光學(xué)***,EUV***極大簡化了制造流程,不僅可以大幅度提高光刻分辨率和DRAM性能,而且可以減少所使用的掩模數(shù)量,從而減少流程步驟的數(shù)量,減少缺陷、提高存儲(chǔ)密度,并大幅降低DRAM生產(chǎn)成本,縮短生產(chǎn)周期。也就是說,即使EUV掩模費(fèi)用(達(dá)數(shù)百萬美元)遠(yuǎn)高于DUV掩模費(fèi)用,使用EUV***量產(chǎn)DRAM也具有更高的性價(jià)比。三星電子和SK海力士公司將EUV***引入1Znm節(jié)點(diǎn)DRAM的量產(chǎn)進(jìn)展順利,并一路高歌到第五代1β節(jié)點(diǎn),令DRAM三巨頭中最為保守的美光公司很無奈。美光一度宣稱自己用DUV也做到了11納米,然而進(jìn)入2023年后的DDR5時(shí)代,韓國雙雄再一次依靠EUV***碾壓了美光。美光在DDR5方面嚴(yán)重落后韓國雙雄。

全球智能汽車領(lǐng)域,特斯拉是第一個(gè)用上GDDR6的企業(yè),特斯拉也很可能第一個(gè)用上HBM2或HBM3,當(dāng)然代價(jià)是芯片成本超過1000美元以上,不過以特斯拉的溢價(jià)能力,消費(fèi)者愿意為高價(jià)買單。要想超越特斯拉,不如一步到位,直接上HBM3。當(dāng)然了,對(duì)中國企業(yè)來說最困難的不是技術(shù),而是供應(yīng)鏈,晶圓級(jí)2.5D封裝HBM的產(chǎn)能95%都在臺(tái)積電手中,5%在三星手中。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)器
    +關(guān)注

    關(guān)注

    39

    文章

    7758

    瀏覽量

    172271
  • 存儲(chǔ)
    +關(guān)注

    關(guān)注

    13

    文章

    4897

    瀏覽量

    90311
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2166

    瀏覽量

    36869

原文標(biāo)題:特斯拉的下一代AI芯片:存算一體

文章出處:【微信號(hào):zuosiqiche,微信公眾號(hào):佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    安克創(chuàng)新發(fā)布Thus?芯片一體架構(gòu)重塑AI音頻新生態(tài)

    2026年4月22日,安克創(chuàng)新在深圳舉辦技術(shù)溝通會(huì),正式推出全球首款基于NOR Flash技術(shù)的神經(jīng)網(wǎng)絡(luò)一體(CIM)AI音頻芯片Thu
    的頭像 發(fā)表于 04-23 09:59 ?1776次閱讀

    新思科技AI+EDA推動(dòng)下一代SoC發(fā)展

    模式。新思科技產(chǎn)品管理資深副總裁 Sanjay Bali 表示:AI 正在從輔助工具,躍升為芯片研發(fā)團(tuán)隊(duì)真正的協(xié)作伙伴,推動(dòng)下一代 SoC 的創(chuàng)新方式發(fā)生根本變化。
    的頭像 發(fā)表于 04-03 09:26 ?658次閱讀

    偉創(chuàng)力攜手博通,推進(jìn)下一代AI液冷解決方案落地

    近日,偉創(chuàng)力宣布旗下先進(jìn)液冷解決方案公司 JetCool 與 博通(Broadcom)展開合作,為博通 下一代 AI XPU(定制化 AI 計(jì)算加速芯片) 提供創(chuàng)新液冷解決方案,助力高
    的頭像 發(fā)表于 03-17 10:44 ?758次閱讀
    偉創(chuàng)力攜手博通,推進(jìn)<b class='flag-5'>下一代</b><b class='flag-5'>AI</b>液冷解決方案落地

    進(jìn)迭時(shí)空再獲數(shù)億元融資,下一代 RISC-V AI 芯片 K3 即將發(fā)布

    進(jìn)迭時(shí)空再獲數(shù)億元融資,下一代 RISC-V AI 芯片 K3 即將發(fā)布
    的頭像 發(fā)表于 01-15 19:07 ?613次閱讀
    進(jìn)迭時(shí)空再獲數(shù)億元融資,<b class='flag-5'>下一代</b> RISC-V <b class='flag-5'>AI</b> <b class='flag-5'>芯片</b>  K3 即將發(fā)布

    AI一體,這家ReRAM新型存儲(chǔ)受關(guān)注

    及相關(guān)芯片產(chǎn)品的研發(fā),涵蓋AI一體(Computing in Memory, CIM)IP及大模型加速方案、高性
    的頭像 發(fā)表于 12-25 09:43 ?2425次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>,這家ReRAM新型存儲(chǔ)受關(guān)注

    科技王紹迪:AI可穿戴需求爆發(fā),一體成主流AI芯片架構(gòu)

    集中在AI驅(qū)動(dòng)的細(xì)分場景需求釋放,知科技聚焦的一體芯片具備高技術(shù)壁壘,同時(shí)在
    的頭像 發(fā)表于 12-23 09:34 ?1.1w次閱讀
    知<b class='flag-5'>存</b>科技王紹迪:<b class='flag-5'>AI</b>可穿戴需求爆發(fā),<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>成主流<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>架構(gòu)

    Telechips與Arm合作開發(fā)下一代IVI芯片Dolphin7

    Telechips宣布,將在與 Arm的戰(zhàn)略合作框架下,正式開發(fā)下一代車載信息娛樂系統(tǒng)(IVI)系統(tǒng)級(jí)芯片(SoC)“Dolphin7”。
    的頭像 發(fā)表于 10-13 16:11 ?1478次閱讀

    一體AI芯片公司九天睿芯完成超億元B輪融資

    全球領(lǐng)先的一體AI芯片公司九天睿芯(英文:Reexen Technology)近日宣布,公司已完成B輪融資,規(guī)模超億元人民幣。
    的頭像 發(fā)表于 10-10 11:41 ?1519次閱讀

    后摩爾定律時(shí)代,3D-CIM+RISC-V打造國產(chǎn)一體新范式

    力、能效與帶寬瓶頸成為行業(yè)前行的關(guān)鍵阻礙,而美西方的技術(shù)禁運(yùn)更讓中國芯片產(chǎn)業(yè)面臨嚴(yán)峻挑戰(zhàn)。 ? 在這大背景下,
    發(fā)表于 09-17 09:31 ?6268次閱讀
    后摩爾定律時(shí)代,3D-CIM+RISC-V打造國產(chǎn)<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>新范式

    芯動(dòng)科技與知科技達(dá)成深度合作

    隨著3D堆疊方案憑借低功耗、高帶寬特性,有望成為下一代移動(dòng)端高端熱門技術(shù)。芯動(dòng)科技瞄準(zhǔn)3DIC市場,與全球領(lǐng)先的一體芯片企業(yè)知
    的頭像 發(fā)表于 08-27 17:05 ?1544次閱讀

    文看懂“一體

    今天這篇文章,我們來聊個(gè)最近幾年很火的概念——一體。為什么會(huì)提出“
    的頭像 發(fā)表于 08-18 12:15 ?1678次閱讀
    <b class='flag-5'>一</b>文看懂“<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>”

    一體技術(shù)加持!后摩智能 160TOPS 端邊大模型AI芯片正式發(fā)布

    ,同步推出力擎?系列M.2卡、力謀?系列加速卡及計(jì)算盒子等硬件組合,形成覆蓋移動(dòng)終端與邊緣場景的完整產(chǎn)品矩陣。這系列動(dòng)作標(biāo)志著后摩智能在一體技術(shù)領(lǐng)域的突破性進(jìn)展,更預(yù)示著端邊智能
    的頭像 發(fā)表于 07-30 07:57 ?8981次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>技術(shù)加持!后摩智能 160TOPS 端邊大模型<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>正式發(fā)布

    2025端側(cè)AI芯片爆發(fā):一體、非Transformer架構(gòu)誰主浮沉?邊緣計(jì)算如何選型?

    各位技術(shù)大牛好!最近WAIC 2025上端側(cè)AI芯片密集發(fā)布,徹底打破傳統(tǒng)力困局。各位大佬在實(shí)際項(xiàng)目中都是如何選型的呢?
    發(fā)表于 07-28 14:40

    緩解高性能一體芯片IR-drop問題的軟硬件協(xié)同設(shè)計(jì)

    在高性能計(jì)算與AI芯片領(lǐng)域,基于SRAM的一體(Processing-In-Memory, PIM)架構(gòu)因兼具計(jì)算密度、能效和精度優(yōu)勢成
    的頭像 發(fā)表于 07-11 15:11 ?1639次閱讀
    緩解高性能<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b><b class='flag-5'>芯片</b>IR-drop問題的軟硬件協(xié)同設(shè)計(jì)

    蘋芯科技 N300 一體 NPU,開啟端側(cè) AI 新征程

    隨著端側(cè)人工智能技術(shù)的爆發(fā)式增長,智能設(shè)備對(duì)本地力與能效的需求日益提高。而傳統(tǒng)馮·諾依曼架構(gòu)在數(shù)據(jù)處理效率上存在瓶頸,“內(nèi)存墻”問題成為制約端側(cè)AI性能突破的關(guān)鍵掣肘。在這背景下,
    的頭像 發(fā)表于 05-06 17:01 ?1371次閱讀
    蘋芯科技 N300 <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b> NPU,開啟端側(cè) <b class='flag-5'>AI</b> 新征程
    军事| 聂拉木县| 论坛| 吉首市| 公安县| 博白县| 云安县| 金溪县| 昌江| 新安县| 高青县| 宜城市| 永靖县| 密山市| 吉安市| 安吉县| 昔阳县| 奈曼旗| 乐东| 祁门县| 哈尔滨市| 柘城县| 玉山县| 察雅县| 吴江市| 保靖县| 新疆| 宣武区| 千阳县| 高淳县| 三明市| 平舆县| 塔河县| 稻城县| 四会市| 平遥县| 环江| 洛宁县| 屯留县| 青海省| 平远县|