日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm Performance Libraries 26.01新特性一覽

Arm社區(qū) ? 來源:Arm社區(qū) ? 2026-05-06 10:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 工程部主任軟件工程師 Nick Dingle

Arm Performance Libraries(Arm 性能庫)為運行在 64 位 Arm 架構(gòu) (AArch64) 處理器上的數(shù)值計算應(yīng)用提供經(jīng)過優(yōu)化的標準核心數(shù)學庫。該庫包含對稀疏與稠密線性代數(shù)函數(shù)的優(yōu)化實現(xiàn),涵蓋 BLAS 和 LAPACK、快速傅里葉變換 (FFT) 以及隨機數(shù)生成 (RNG) 函數(shù)。這些實現(xiàn)均基于 OpenMP 并行機制構(gòu)建,可在多處理器環(huán)境中充分釋放性能。此外,Arm Performance Libraries 還通過 libamath 庫提供高性能的標量和向量 math.h 例程。

Arm Performance Libraries 26.01 新增了稀疏三角求解功能,擴展了 RNG 分布類型,在 libamath 中新增可復(fù)現(xiàn)的數(shù)學計算選項,同時全面提升 BLAS、LAPACK 及稀疏計算例程的運行性能。如需查看完整更新內(nèi)容(含 LAPACK 3.12.1 支持詳情),請查閱完整發(fā)布說明。

發(fā)布說明:https://developer.arm.com/documentation/109681/latest

你可以通過包管理器安裝,或下載相應(yīng)的安裝程序,開始使用 Arm Performance Libraries 26.01。

包管理器:https://learn.arm.com/install-guides/armpl

安裝程序:

https://developer.arm.com/Tools%20and%20Software/Arm%20Performance%20Libraries#Downloads

矩陣乘法性能提升

在搭載 M 系列芯片的 macOS 設(shè)備上,通過采用 SME 指令替代 Neon 指令,顯著提升了單精度和雙精度實數(shù)矩陣乘法的性能(例如 BLAS SGEMM 和 DGEMM 調(diào)用)。下方圖表對比了 Arm Performance Libraries 26.01 與 25.07 版本在不同方陣尺寸下的 DGEMM 性能表現(xiàn)。結(jié)果顯示,速度提升最高可達七倍。

2211f13a-43b0-11f1-90a1-92fbcf53809c.png

用于超節(jié)點矩陣的稀疏三角求解

Arm Performance Libraries 26.01 新增了對采用超節(jié)點矩陣格式的稀疏三角系統(tǒng)求解的支持,推出了全新、完全并行化的 armpl_spsv_exec_* 系列函數(shù)。同時,我們還提供了新的 C 函數(shù),用于創(chuàng)建超節(jié)點矩陣 (armpl_spmat_create_supernodal_*)。有關(guān)超節(jié)點格式的說明以及這些新例程的完整文檔,可參見在線參考指南。還可查看 Arm Performance Libraries 26.01 隨附的示例程序,進一步了解如何在上三角和下三角輸入矩陣的場景下使用這些函數(shù)。

參考指南:

https://developer.arm.com/documentation/101004/2601/Sparse-Linear-Algebra

下圖展示了四種問題規(guī)模、不同線程配置下,Arm Performance Libraries 26.01 中 armpl_spsv_exec_d 相較于 25.07 版本的性能提升幅度。每個問題都是在 LDL? 分解過程中求解的一個方陣系統(tǒng),其中矩陣維度 n 等于 Grid 的平方(例如,Grid 為 1024 時,對應(yīng) n = 10242)。

230e4b38-43b0-11f1-90a1-92fbcf53809c.png

該類矩陣均具備典型超節(jié)點結(jié)構(gòu)。Arm Performance Libraries 26.01 采用全新超節(jié)點接口 armpl_spmat_create_supernodal_d 初始化稀疏矩陣,替代 25.07 版本的 CSC 稀疏矩陣構(gòu)建接口 armpl_spmat_create_csc_d。超節(jié)點格式可實現(xiàn)擴展性更強的多線程三角求解運算,性能最高提升七倍。目前,Arm 系統(tǒng)上的 Panua-Pardiso 已采用該全新超節(jié)點稀疏矩陣格式,來加速大規(guī)模稀疏線性方程組求解。

隨機數(shù)生成功能擴展

Arm Performance Libraries 26.01新增多項分布整數(shù)隨機變量生成接口 viRngMultinomial;新增伽馬分布隨機數(shù)接口,分別通過 vsRngGamma、vdRngGamma 實現(xiàn)單精度、雙精度數(shù)值生成。泊松分布計算接口 viRngPoisson 新增 POISNORM 算法支持,可通過反演法或基于正態(tài)分布數(shù)值換算兩種方式求解泊松分布。這些新增功能的源代碼可在 Arm GitLab 上的 OpenRNG 26.01 中獲取。

Arm GitLab:https://gitlab.arm.com/libraries/openrng

可復(fù)現(xiàn)的 libamath

Arm Performance Libraries 26.01 新增了僅適用于 Linux 平臺的可復(fù)現(xiàn)版 libamath,可一定程度直接替換默認 3.5 ULP 精度標準庫。對于已適配函數(shù),該版本可確保標量運算與 Neon、SVE 向量化運算輸出結(jié)果完全一致,適用于要求在不同向量化路徑下具有確定性數(shù)值計算需求的應(yīng)用。需注意:并非全部 libamath 函數(shù)都提供可復(fù)現(xiàn)版本,且該庫不提供 GNU ABI 標準符號,詳見在線參考指南。

參考指南:https://developer.arm.com/documentation/101004/2601/Arm-Performance-Libraries-Math-Functions

Arm Performance Libraries 26.01 最新版本現(xiàn)已正式發(fā)布。如有疑問或建議,歡迎前往論壇留言反饋。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20343

    瀏覽量

    255357
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9596

    瀏覽量

    393834
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4423

    瀏覽量

    67878

原文標題:Arm Performance Libraries 26.01 新特性一覽

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    新品速|樂鑫ESP32-H21重磅登場!

    ESP32-H21芯片!核心參數(shù)一覽亮點速看極低功耗,續(xù)航無憂ESP32-H21在DeepSleep模式下電流可低至5μA,LightSleep模式僅9μA。無論是周期喚醒的傳
    的頭像 發(fā)表于 04-14 18:03 ?645次閱讀
    新品速<b class='flag-5'>覽</b>|樂鑫ESP32-H21重磅登場!

    2026年3月開放原子開源基金會新增孵化項目一覽

    電鴻物聯(lián)操作系統(tǒng)是南方電網(wǎng)公司以開源鴻蒙和開源歐拉為底座,結(jié)合電力行業(yè)業(yè)務(wù)特性,在國家開源體系下定制開發(fā)的電力統(tǒng)物聯(lián)操作系統(tǒng),主要面向新型電力系統(tǒng)和新型能源體系應(yīng)用,助力構(gòu)建互聯(lián)互通、開放共享的能源工業(yè)物聯(lián)體系。
    的頭像 發(fā)表于 04-03 17:41 ?2688次閱讀

    深入剖析LMKDB系列PCIe時鐘緩沖器:特性、應(yīng)用與設(shè)計要點

    。本文將對該系列產(chǎn)品進行詳細剖析,探討其特性、應(yīng)用場景以及設(shè)計過程中的關(guān)鍵要點。 文件下載: lmkdb1108.pdf 產(chǎn)品特性一覽 廣泛的PCIe兼容性 該系
    的頭像 發(fā)表于 02-06 15:10 ?264次閱讀

    高性能RF放大器TRF1208:特性、應(yīng)用與設(shè)計要點

    的性能和豐富的特性,在眾多領(lǐng)域得到了廣泛應(yīng)用。本文將深入探討TRF1208的特性、應(yīng)用場景以及設(shè)計過程中的關(guān)鍵要點。 文件下載: trf1208.pdf 、TRF1208特性
    的頭像 發(fā)表于 01-26 16:00 ?409次閱讀

    探索TI LMH系列SDI串行器:特性、應(yīng)用與設(shè)計要點

    和LMH0340系列SDI串行器,憑借其出色的性能和豐富的特性,成為了眾多視頻應(yīng)用的理想選擇。今天,我們就來深入探討這些器件的特點、應(yīng)用場景以及設(shè)計過程中的關(guān)鍵要點。 文件下載: lmh0070.pdf 器件特性一覽 接口與時鐘
    的頭像 發(fā)表于 12-26 09:10 ?585次閱讀

    Arm 2025財年可持續(xù)發(fā)展商業(yè)報告一覽

    Arm 2025 財年可持續(xù)發(fā)展商業(yè)報告梳理了 Arm 在環(huán)境、人類與社會等方面塑造更可持續(xù)未來方面所取得的顯著進展。
    的頭像 發(fā)表于 11-11 11:43 ?895次閱讀

    RT-Thread_FRDM-MCXA346上手指南

    核心亮點一覽: 超強內(nèi)核: Arm Cortex-M33,最高180MHz主頻 精準模擬: 4×16位ADC + 4×運算放大器,模擬信號處理專家 萬能連接: 支持CAN FD、I3C、多路UART/SPI/I2C 開箱即用: 兼容Arduino、mikroBUS
    的頭像 發(fā)表于 11-06 09:23 ?6353次閱讀
    RT-Thread_FRDM-MCXA346上手指南

    劃重點!圖速浦江開源鴻蒙生態(tài)大會金句

    劃重點!圖速浦江開源鴻蒙生態(tài)大會金句
    的頭像 發(fā)表于 10-16 17:29 ?1076次閱讀
    劃重點!<b class='flag-5'>一</b>圖速<b class='flag-5'>覽</b>浦江開源鴻蒙生態(tài)大會金句

    什么是ARM架構(gòu)?你需要知道的

    深入探討ARM?架構(gòu)的真正含義、其核心特性、與NVIDIAJetson?等平臺的差異,以及與傳統(tǒng)x86系統(tǒng)的比較。什么是ARM架構(gòu)?ARM(AdvancedRISC
    的頭像 發(fā)表于 09-11 14:48 ?1753次閱讀
    什么是<b class='flag-5'>ARM</b>架構(gòu)?你需要知道的<b class='flag-5'>一</b>切

    硅襯底的清洗步驟一覽

    溶液體系。隨后用去離子水(DIW)噴淋沖洗,配合氮氣槍吹掃表面以去除溶劑痕跡,完成基礎(chǔ)脫脂操作。標準RCA清洗協(xié)議實施第步:堿性過氧化氫混合液處理(SC-1)配
    的頭像 發(fā)表于 09-03 10:05 ?1259次閱讀
    硅襯底的清洗步驟<b class='flag-5'>一覽</b>

    濕法刻蝕的主要影響因素一覽

    濕法刻蝕是半導(dǎo)體制造中的關(guān)鍵工藝,其效果受多種因素影響。以下是主要影響因素及詳細分析:1.化學試劑性質(zhì)與濃度?種類選擇根據(jù)被刻蝕材料的化學活性匹配特定溶液(如HF用于SiO?、KOH用于硅襯底)。例如,緩沖氧化物刻蝕液(BOE)通過添加NH?F穩(wěn)定反應(yīng)速率。復(fù)合酸體系(如HNO?+HF+HAc)可實現(xiàn)各向異性刻蝕,適用于形成特定角度的溝槽結(jié)構(gòu)。?濃度控制濃度
    的頭像 發(fā)表于 08-04 14:59 ?2272次閱讀
    濕法刻蝕的主要影響因素<b class='flag-5'>一覽</b>

    【技術(shù)干貨】使用干簧繼電器進行高壓線束測試

    您將了解: 如何在復(fù)雜線束中精準檢測短路 高壓干簧繼電器如何實現(xiàn)高隔離和可靠的快速切換 電動汽車、醫(yī)療設(shè)備與工業(yè)系統(tǒng)中的真實應(yīng)用案例 系列產(chǎn)品深度解析 關(guān)鍵性能指標一覽
    發(fā)表于 07-29 15:13

    智慧能源物聯(lián)網(wǎng)解決方案一覽

    在當今數(shù)字化與能源管理深度融合的時代,智慧能源物聯(lián)網(wǎng)解決方案成為實現(xiàn)高效能源利用、降低能耗成本的關(guān)鍵。物通博聯(lián)能源采集網(wǎng)關(guān)作為這體系的核心樞紐,發(fā)揮著數(shù)據(jù)采集、傳輸與初步處理的重要功能,為不同場景
    的頭像 發(fā)表于 07-16 10:52 ?963次閱讀
    智慧能源物聯(lián)網(wǎng)解決方案<b class='flag-5'>一覽</b>

    wafer清洗和濕法腐蝕區(qū)別一覽

    在半導(dǎo)體制造中,wafer清洗和濕法腐蝕是兩個看似相似但本質(zhì)不同的工藝步驟。為了能讓大家更好了解,下面我們就用具體來為大家描述下其中的區(qū)別: Wafer清洗和濕法腐蝕是半導(dǎo)體制造中的兩個關(guān)鍵工藝
    的頭像 發(fā)表于 06-03 09:44 ?1068次閱讀

    世界各國&地區(qū)常見電壓/頻率/插頭/插座一覽

    電子發(fā)燒友網(wǎng)站提供《世界各國&地區(qū)常見電壓/頻率/插頭/插座一覽表.pdf》資料免費下載
    發(fā)表于 05-30 16:27 ?9次下載
    古丈县| 张家川| 定安县| 高安市| 平遥县| 武城县| 丹巴县| 舟曲县| 东城区| 威宁| 华亭县| 安阳市| 兴安县| 东阳市| 淮滨县| 永德县| 永吉县| 潮州市| 宾川县| 永和县| 南康市| 同心县| 晋中市| 句容市| 临高县| 余干县| 文昌市| 馆陶县| 柳河县| 临西县| 开阳县| 济阳县| 高密市| 遵义县| 玉溪市| 迭部县| 响水县| 梁河县| 碌曲县| 时尚| 河南省|