日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Armv9架構中SME和SME2的關鍵用例

Arm社區(qū) ? 來源:Arm社區(qū) ? 作者:Arm社區(qū) ? 2024-09-03 11:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Arm 為在各類技術領域運行無處不在的人工智能 (AI) 奠定了堅實的技術基礎。這得益于我們行業(yè)領先的架構可在全球數(shù)十億臺多樣化設備上支持各種計算工作負載。

Arm 始終專注于快速地進行架構演進,確保我們領先的生態(tài)系統(tǒng)能夠適應未來的技術趨勢和不斷變化的計算需求。雖然 AI 的迅猛崛起似乎是最近才出現(xiàn)的現(xiàn)象,但過去二十多年來,Arm 一直致力于為 AI 創(chuàng)新奠定基礎,先是在 Armv7 架構中引入了高級單指令多數(shù)據(jù) (SIMD) 擴展,初探機器學習 (ML) 工作負載,再是如今的 Armv9 架構,我們在 Arm CPU 上集成了用于加速和保護如大語言模型 (LLM) 等先進的生成式 AI 工作負載的特性。

可伸縮矩陣擴展 (SME) 就是其中的一項創(chuàng)新特性,旨在滿足當今 AI 和 ML 工作負載日益增長的復雜性和功耗需求。除了加速當今的 AI 發(fā)展之外,SME 還為 Arm 架構提供了靈活性,便于管理不斷發(fā)展的生成式 AI 工作負載。

可伸縮矩陣擴展及其特性

SME 是 Armv9-A 架構中引入的指令集架構 (ISA) 擴展,可加速 AI 和 ML 工作負載,并為 Arm CPU 上運行的 AI 和 ML 應用提供更高的性能、能效和靈活性。具體而言是通過以下特性實現(xiàn)的:

顯著提升 Arm CPU 上的矩陣和矢量處理吞吐量和效率;

通過引入外積指令,減少內(nèi)存帶寬壓力,盡可能地復用寄存器中加載的數(shù)據(jù);

擴展壓縮用戶數(shù)據(jù),在不增加內(nèi)存負載帶寬的情況下提高輸入元素的吞吐量;

支持多種存儲和計算數(shù)據(jù)類型,使其成為適用于當前和未來多種用例的靈活解決方案;

允許在實現(xiàn)中選擇介于 128 至 2048 位的 Streaming Vector Length (SVL),從而實現(xiàn) SVL^2 的矩陣-矩陣乘法吞吐量。

SME2 在 SME 的基礎上增加了多矢量指令,允許在矩陣和矢量運算中復用架構狀態(tài) (ZA Array),并具有更高吞吐量的矢量處理能力。這有助于通過壓縮 AI 格式來減少內(nèi)存帶寬并節(jié)省功耗,從而實現(xiàn)矢量和矩陣加速的平衡。SME2 還能夠靈活地動態(tài)去量化,并解壓縮 2 位和 4 位權重,以節(jié)省內(nèi)存帶寬。在生成式 AI 工作負載日益復雜和耗電加劇的背景下,這些特性非常重要,同時也彰顯了 Arm 致力于應對 AI 無止盡的能源需求。

SME 和 SME2 的關鍵用例

SME 可加速如生成式 AI 和經(jīng)典 ML 網(wǎng)絡,以及計算機視覺 (CV) 等各種類型的 AI 和 ML 工作負載。具體的實現(xiàn)途徑是 SME 能夠處理矩陣乘矩陣、矩陣乘矢量和多個矢量乘矢量運算,以及 ML 執(zhí)行過程中所需的前處理和后處理階段。我們預計,SME 將有益于不同市場的各種 AI 用例,包括:

結合了 ML 和經(jīng)典 CV/DSP 方法的應用,例如電影攝影、媒體處理、駕駛員監(jiān)控、數(shù)字化座艙、音頻處理、先進駕駛輔助系統(tǒng) (ADAS) L2+ 和實時語音助手等。

利用小語言模型和 LLM 的用例,包括聊天機器人、對話摘要和虛擬助手等。

矢量處理、矩陣處理和量化

要了解 SME 的工作原理,有必要解釋一下它所支持的不同 AI 處理技術,以及 SME 和 Armv9 架構為每種技術帶來的好處。其中包括:

矢量處理

矩陣處理

矩陣乘法

量化

矢量處理

在 AI 和 ML 語境中,矢量代表數(shù)值和數(shù)據(jù)點的一維數(shù)組,通常用于對神經(jīng)網(wǎng)絡中的特征、輸入或權重進行編碼。矢量處理常用于現(xiàn)代 AI 框架和庫,例如 TensorFlow 和 PyTorch 等。利用此方法,AI 算法可以高效應對復雜計算,更快地處理大型數(shù)據(jù)集,從而縮短訓練時間,提高性能。SME 包含矢量指令,可并行計算多個值,而不是按順序處理每個值,從多方面大大加快了 AI 計算。

矩陣處理

矩陣是數(shù)值和數(shù)據(jù)點的二維數(shù)組,在包括 ML 和深度學習在內(nèi)的各種 AI 技術中發(fā)揮著至關重要的作用。通過 SME 進行矩陣處理需要對這些矩陣進行運算,以提高基于 AI 的核心工作負載的性能和效率,包括線性代數(shù)運算(如矩陣乘法)和神經(jīng)網(wǎng)絡。

矩陣乘法

矩陣乘法是 AI 和 ML 工作負載以及科學模擬和計算機視覺等其他計算工作負載的重要組成部分。矩陣-矩陣乘法運算對 CPU 上的 AI 加速越來越重要,并顯著受益于 SME。Arm 架構隨時間推移不斷演進,通過引入新特性提高了這些運算的性能和效率。例如:

Armv7 增加了高級 SIMD 擴展,也稱為 Arm Neon 指令。

Armv8.4-A 支持 8 位整數(shù)點積指令。

Armv8.6-A 支持各種數(shù)據(jù)類型的矢量內(nèi)整數(shù)和浮點矩陣乘法指令,包括新的 BFloat16 數(shù)據(jù)類型。

Armv9-A 包括可伸縮矢量擴展 2 (SVE2),用于數(shù)字信號處理器 (DSP)、媒體和通用矢量化。

Armv9.2-A 引入了 SME。

量化

量化涉及降低數(shù)值的精度,通常是從浮點表示法轉換為定點表示法。SME 使用該過程來減少 AI 和 ML 模型的內(nèi)存帶寬、占用空間以及計算復雜性,進而提高其效率,這對計算密集型生成式 AI 工作負載非常重要。這意味著它們可以部署在資源受限的設備上,如智能手機、移動設備、嵌入式系統(tǒng)物聯(lián)網(wǎng)設備等。

Arm 架構長期致力支持 AI 特性

過去二十年來,Arm 一直致力于在架構上添加 AI 特性、規(guī)范和指令。2003 年首次發(fā)布的 Armv7 架構增加了高級 SIMD 擴展,也稱為 Arm Neon 指令。Neon 將寄存器視為由相同數(shù)據(jù)類型的元素組成的一維矢量,指令可同時對多個元素進行操作。隨后 Armv8 架構增加了一系列 AI 的規(guī)范和指令,包括點積指令、矢量內(nèi)矩陣乘法指令和 BFloat16 支持。它還改進了高級 SIMD 擴展,將矢量寄存器的數(shù)量增加了一倍,并增加了浮點支持。所有這些改進和新增特性的目的都是用于加速 AI 和 ML 性能,以應對不斷發(fā)展的 AI 工作負載。除了 SVE2、SME 和新的 SME2 之外,Armv9 架構還集成包含了所有這些特性、規(guī)范和指令。

SME 的核心優(yōu)勢

Armv9 架構上的 SME 顯著提高了 Arm CPU 對現(xiàn)有 AI 和 ML 工作負載的處理能力,從而在各種 AI 驅(qū)動的設備和應用中帶來速度更快、響應更靈敏的用戶體驗。它還能加速一系列使用矩陣運算的應用,如 DSP、科學計算、增強現(xiàn)實 (AR)、虛擬現(xiàn)實 (VR) 和圖像處理等等,AI 和 ML 在所有這些應用中都扮演著日益重要的角色。

與能夠以多種不同數(shù)據(jù)格式運行各種神經(jīng)網(wǎng)絡的 Arm CPU 類似,SME 也提供了靈活性,旨在滿足不斷發(fā)展的 AI 和 ML 工作負載日益復雜的要求。這將確保 Arm 架構在快速發(fā)展的 AI 時代及未來仍適用于至關重要的計算工作負載。展望未來,我們將繼續(xù)在指令集中添加更多 AI 功能,以助益 Arm 領先的生態(tài)系統(tǒng),讓我們的合作伙伴能夠為其 AI 解決方案提供更高的性能、創(chuàng)新特性和可擴展性。

基于 AI 的 Arm 架構創(chuàng)新

SME 體現(xiàn)了 Arm 在架構方面的不斷創(chuàng)新。隨著 AI 的不斷發(fā)展壯大,SME 將確保 Arm CPU 能夠高效地處理新的高能耗生成式 AI 工作負載,從而在數(shù)十億臺 Arm 技術驅(qū)動的設備上提供更好的 AI 體驗。這將夯實 Arm 持續(xù)作為全球 AI 基石的地位。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    135

    文章

    9589

    瀏覽量

    393791
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11332

    瀏覽量

    225984
  • AI
    AI
    +關注

    關注

    91

    文章

    41315

    瀏覽量

    302691
  • SME
    SME
    +關注

    關注

    0

    文章

    9

    瀏覽量

    7312

原文標題:Armv9 SME 賦能 AI 創(chuàng)新

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Arm下一代指令架構Armv9”已經(jīng)問世

    表示,安全性增強是最重要的關鍵。Arm在Armv8.3之后的階段擴展中專注于安全性,并被視為邁向Armv9的一步。 Arm的指令集架構的發(fā)展對于當前的IT行業(yè)至關重要。這是因為高性能C
    的頭像 發(fā)表于 11-13 11:55 ?4.5w次閱讀

    十年來最大技術革新!Arm發(fā)布Armv9架構!不受美國EAR約束,華為可獲授權!

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)當?shù)貢r間3月30日,Arm宣布正式推出Armv9架構,以應對全球?qū)o處不在的專業(yè)化處理的需求,這種處理具有越來越強大的安全性和人工智能(AI)能力。Armv9是ARM
    的頭像 發(fā)表于 03-31 16:57 ?8329次閱讀

    安謀科技:十年磨一劍的Armv9架構,下半年將有終端面市

    第九屆EEVIA年度中國電子ICT媒體論壇暨2021產(chǎn)業(yè)和技術展望研討會上表示,基于Armv9架構的處理器終端將于今年下半年面市。 ? Armv9架構特色 ?
    的頭像 發(fā)表于 08-11 08:01 ?4990次閱讀

    基于ARMv7架構的Cortex系列

    基于ARMv7架構的Cortex系列由ARM公司在2006年推出,Cortex系列的推出滿足人們對性能日漸復雜的設計要求,根據(jù)不同需求,Cortex系列共三個不同的子系列...
    發(fā)表于 08-09 06:37

    armv8架構Arch32切換到Arch64是如何運作的

    各位大神,armv8架構,如果Arch32要去切換到Arch64,是如何運作的?狀態(tài)會清空嗎?
    發(fā)表于 06-06 16:13

    淺析Armv9-A構架上的可伸縮矩陣擴展(SME)

    Armv9-A構架擴展的早期技術細節(jié),這個擴展就是可伸縮矩陣擴展(Scalable Matrix Extension, SME)。SME是一序列增強CPU構架對矩陣運算支持的最新更新。這次公開
    發(fā)表于 08-05 15:02

    重磅!Arm正式推出Armv9架構

    當?shù)貢r間3月30日,Arm宣布正式推出Armv9架構,以應對全球?qū)o處不在的專業(yè)化處理的需求,這種處理具有越來越強大的安全性和人工智能(AI)能力。Armv9是ARM公司十年來的最大技術革新。上一代
    發(fā)表于 03-31 09:43 ?3121次閱讀
    重磅!Arm正式推出<b class='flag-5'>Armv9</b><b class='flag-5'>架構</b>

    淺談ARM發(fā)布Armv9的三大改進

    英國芯片設計公司Arm周二發(fā)布了Armv9,這是其在2011年發(fā)布Armv8之后十年來首次推出新的芯片架構。Arm表示,與以前的架構相比,Armv9
    的頭像 發(fā)表于 04-01 15:17 ?3112次閱讀

    Arm公司正式發(fā)布了該公司的新一代Armv9架構的首個細節(jié)

    今天,作為Arm的Vision Day活動的一部分,該公司正式發(fā)布了該公司的新一代Armv9架構的首個細節(jié),為Arm未來十年內(nèi)成為下一個3000億芯片的計算平臺奠定了基礎。
    的頭像 發(fā)表于 04-13 14:45 ?3546次閱讀
    Arm公司正式發(fā)布了該公司的新一代<b class='flag-5'>Armv9</b><b class='flag-5'>架構</b>的首個細節(jié)

    淺談Armv9的三個技術特性及引發(fā)的市場競爭力

    十年轉瞬,Armv9架構終于露出廬山真面目,適用于Arm全系列芯片的Armv9架構,這次的升級瞄準的則是日益強大的安全、人工智能(AI)和無處不在的專用處理的需求。
    的頭像 發(fā)表于 04-15 18:08 ?4451次閱讀

    ARMv9架構能否解決中國“缺芯”之急?

    近日,ARM正式宣布推出ARMv9架構。據(jù)ARM官方稱,這是10年來最重要的創(chuàng)新,是未來3000億ARM芯片的基礎。
    發(fā)表于 05-02 17:06 ?2810次閱讀

    Arm推出三款基于Armv9架構的全新CPU內(nèi)核

    從全面升級到Armv9架構,到公布Neoverse V1和N2平臺技術細節(jié),再到推出三款基于Armv9架構的全新CPU內(nèi)核,短短兩個月時間里
    的頭像 發(fā)表于 06-12 09:11 ?5235次閱讀

    Armv8架構Armv9架構的區(qū)別分析

    新的Armv9兼容CPU所承諾的最大的新功能可能是開發(fā)人員和用戶可以立即看到的——SVE2作為NEON的后繼產(chǎn)品。
    發(fā)表于 03-10 14:02 ?7711次閱讀

    移動端芯片性能提升,Armv9架構新升級引發(fā)關注

    “數(shù)碼博主”5月17日的最新爆料指出,聯(lián)發(fā)科積極推進Armv9新一代IP BLACKHAWK“黑鷹”的架構設計,預計天璣9400芯片將采用這一架構,有望以“全大核”設計再度領跑移動SoC CPU性能榜單。
    的頭像 發(fā)表于 05-17 16:51 ?2061次閱讀

    Armv9 CPUSVE2的實際

    隨著每一代新產(chǎn)品的推出,Arm CPU 都會實現(xiàn)代際性能提升,并引入架構改進,以滿足不斷演進的計算工作負載的需求。本文將重點介紹三個,以展示 Armv9 CPU 的
    的頭像 發(fā)表于 10-21 09:54 ?2230次閱讀
    <b class='flag-5'>Armv9</b> CPU<b class='flag-5'>中</b>SVE<b class='flag-5'>2</b>的實際<b class='flag-5'>用</b><b class='flag-5'>例</b>
    奇台县| 珲春市| 偃师市| 新龙县| 邻水| 沙雅县| 霍州市| 米脂县| 湟源县| 青海省| 秭归县| 呼伦贝尔市| 台东市| 木兰县| 扶绥县| 龙川县| 锦州市| 峡江县| 广东省| 华阴市| 客服| 调兵山市| 洛宁县| 龙胜| 宁海县| 杂多县| 读书| 霍邱县| 韶山市| 特克斯县| 莫力| 会理县| 措勤县| 岚皋县| 玉林市| 临朐县| 米脂县| 泰州市| 乐东| 泸溪县| 葫芦岛市|