日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm編譯器現(xiàn)在基于LLVM 13

安芯教育科技 ? 來源:極術(shù)社區(qū) ? 作者:Ashok Bhat ? 2022-06-15 09:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Arm編譯器Linux 22.0版現(xiàn)在提供了改進(jìn)的編譯器和庫。Arm編譯器Linux版(ACfL)是Arm C/C++編譯器(armclang)、Arm Fortran編譯器(armflang)和Arm性能庫(ArmPL)的組合。在本博客中,我們將探討此版本的新增功能。

Arm編譯器現(xiàn)在基于LLVM 13

Arm編譯器現(xiàn)在基于LLVM 13,這提高了性能。

db2122e6-ec47-11ec-ba43-dac502259ad0.png

我們看到SPEC CPU 2017的許多次級(jí)基準(zhǔn)得到了改進(jìn),geomean總分比之前的21.1版本提高了2.2%。該基準(zhǔn)測(cè)試在AWS c6g.metal(帶Arm Neoverse-N1核心)上運(yùn)行。

針對(duì)Neoverse-V1進(jìn)行了更好的調(diào)整

(AWS Graviton 3核心)

22.0版本的Arm編譯器為Neoverse-V1提供了一個(gè)優(yōu)化的成本模型,并提供了許多與SVE代碼生成相關(guān)的改進(jìn)。這包括(1)優(yōu)化使用SVE的Gather/Scatter功能(2)將循環(huán)(loop)填充對(duì)齊,以更好地利用指令緩存(3)在將向量的一個(gè)元素插入另一個(gè)元素時(shí),優(yōu)化使用SVE拼接操作。

db2ae59c-ec47-11ec-ba43-dac502259ad0.png

這些優(yōu)化的累積效應(yīng)可以在前面的圖中看到。我們?cè)谶@里將Neoverse-V1優(yōu)化的SVE代碼和為Neoverse-V1優(yōu)化的Neon代碼做一個(gè)對(duì)比。我們的基準(zhǔn)是在開發(fā)SVE架構(gòu)擴(kuò)展時(shí)使用的一組具有代表性的微基準(zhǔn)(micro-benchmarks)。您可以看到,22.0(橙色條)中的編譯器優(yōu)于21.1版(藍(lán)色條)。通過這些改進(jìn),22.0版本已準(zhǔn)備好在AWS Graviton 3上開發(fā)HPC應(yīng)用程序。

GCC 11更新

該軟件包現(xiàn)在提供GCC 11系列編譯器,并有許多性能改進(jìn)https://community.arm.com/arm-community-blogs/b/tools-software-ides-blog/posts/performance-improvements-in-gcc-11

具有CPU運(yùn)行時(shí)檢測(cè)的單個(gè)ArmPL

Arm性能庫不再為SVE和非SVE內(nèi)核打包為單獨(dú)的庫。我們現(xiàn)在提供一個(gè)庫,其中包含所有受支持內(nèi)核(包括SVE)的優(yōu)化版本。在運(yùn)行時(shí),庫通過檢測(cè)核的類型,來選擇最佳的例程和配置。作為用戶,您可以自動(dòng)受益于庫中最快的調(diào)整,而無需重新鏈接到特定于核的庫。

更快的BLAS、LAPACK和FFT

ArmPL 22.0進(jìn)一步改進(jìn)了BLAS和LAPACK例程。

db4d41dc-ec47-11ec-ba43-dac502259ad0.png

db655f9c-ec47-11ec-ba43-dac502259ad0.png

上圖顯示了22.0版本比21.0版本的改進(jìn)(2021年初發(fā)布)。這些數(shù)據(jù)來自5000多個(gè)個(gè)案的基準(zhǔn)測(cè)試,涵蓋:廣泛BLAS例程的基準(zhǔn)測(cè)試,一系列重要的LAPACK例程,用于串行(1線程)和并行(8線程)執(zhí)行中的小O(10)、中O(100)和大O(1000)不同的問題場(chǎng)景。

數(shù)學(xué)函數(shù)的改進(jìn)

在22.0中,我們改進(jìn)了許多數(shù)學(xué)函數(shù)的性能。其中包括標(biāo)量函數(shù)(atan、atan2、atan2f、cos、exp、sin和erf)和向量函數(shù)(atanf、atan2f、cosf、erfcf、expo、logf、pow、sinf和tanf)的改進(jìn)。在下圖中,您可以看到Elefunt benchmark在AWS Graviton 2(Neoverse N1)系統(tǒng)上運(yùn)行時(shí)的影響。

db7cbd2c-ec47-11ec-ba43-dac502259ad0.png

模塊名稱變更

該包提供模塊文件,以便輕松加載所需的編譯器或庫。對(duì)于22.0版本,請(qǐng)使用以下模塊命令。

db958514-ec47-11ec-ba43-dac502259ad0.png

結(jié)論

Arm編譯器Linux 22.0版與前21.x系列版相比有許多改進(jìn)和變化。我們將繼續(xù)進(jìn)行進(jìn)一步的改進(jìn),并計(jì)劃在2022年9月/10月發(fā)布下一版本22.1。

最新版本下載地址:

https://developer.arm.com/downloads/-/arm-compiler-for-linux

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Linux
    +關(guān)注

    關(guān)注

    88

    文章

    11824

    瀏覽量

    219611
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1673

    瀏覽量

    51971

原文標(biāo)題:技術(shù)分享 | Arm編譯器Linux版:22.0版本中的新增功能有哪些?

文章出處:【微信號(hào):Ithingedu,微信公眾號(hào):安芯教育科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    ARM 編譯器 6.21 一起使用時(shí),LPC43XX I2C_CON_SI不會(huì)激活,如何解決?

    我遇到了有關(guān) LPC43XX I2C 傳輸?shù)膯栴}。在 ARM 編譯器 5.06 中,單字節(jié)寫入和所有其他 I2C 事務(wù)在 MCU 到 MCU 之間都能正常工作。但是,在選擇ARM編譯器
    發(fā)表于 04-28 07:03

    性能突破 | SpacemiT-X60 在 LLVM 編譯器上實(shí)現(xiàn) 16% 顯著提升

    2025年10月,在北美RISC-V峰會(huì)上,Igalia編譯器工程師Mikhail發(fā)表專題演講《Unlocking15%MorePerformance
    的頭像 發(fā)表于 11-21 18:04 ?9143次閱讀
    性能突破 | SpacemiT-X60 在 <b class='flag-5'>LLVM</b> <b class='flag-5'>編譯器</b>上實(shí)現(xiàn) 16% 顯著提升

    開源鴻蒙技術(shù)大會(huì)2025丨編譯器與編程語言分論壇:語言驅(qū)動(dòng)系統(tǒng)創(chuàng)新,編譯賦能生態(tài)繁榮

    在萬物智聯(lián)的時(shí)代背景下,操作系統(tǒng)底層能力的構(gòu)建離不開編程語言與編譯器的關(guān)鍵支撐。作為開源鴻蒙生態(tài)的核心技術(shù),語言設(shè)計(jì)與編譯器、虛擬機(jī)實(shí)現(xiàn)的進(jìn)步直接關(guān)系到開發(fā)效率、運(yùn)行性能與系統(tǒng)安全。本次分論壇聚焦
    的頭像 發(fā)表于 11-20 17:24 ?1194次閱讀
    開源鴻蒙技術(shù)大會(huì)2025丨<b class='flag-5'>編譯器</b>與編程語言分論壇:語言驅(qū)動(dòng)系統(tǒng)創(chuàng)新,<b class='flag-5'>編譯</b>賦能生態(tài)繁榮

    【CPKCOR-RA8D1】AI人臉檢測(cè)(安裝對(duì)應(yīng)版本的FSP及LLVM

    本文主要聚焦于Flexible Software Package (FSP) v5.3.0 與LLVM Embedded Toolchain for Arm v17.0.1 安裝上面 由于現(xiàn)在直接
    發(fā)表于 10-31 11:22

    GCC編譯器,怎么才能實(shí)現(xiàn)c文件中未被調(diào)用的函數(shù),不會(huì)被編譯呢?

    GCC編譯器,怎么才能實(shí)現(xiàn)c文件中未被調(diào)用的函數(shù),不會(huì)被編譯?有什么編譯選項(xiàng)可以設(shè)置嗎? 移植代碼,有些函數(shù)沒被調(diào)用的函數(shù)想留在代碼里,但不想被編譯,
    發(fā)表于 09-28 12:25

    請(qǐng)問如何在keil μVision 5上進(jìn)行ARM編譯器的代碼優(yōu)化?

    如何在keil μVision 5上進(jìn)行ARM編譯器的代碼優(yōu)化?
    發(fā)表于 08-20 07:37

    如何在Keil中將NuMicro BSP從Arm編譯器5遷移到編譯器6?

    在Keil中將NuMicro BSP從Arm編譯器5遷移到編譯器6!
    發(fā)表于 08-20 06:29

    求助,關(guān)于NanoEdge AI Studio生成的庫交叉編譯器版本疑問求解

    20231009\", 那么問題來了,怎么在NanoEdge AI Studio設(shè)定交叉編譯器呢,比如設(shè)置為armcc、armclang、iccram,因?yàn)槲倚枰獙旒拥絢eil或者iar工程里面。 看樣子這個(gè)軟件生成的庫是arm-gcc
    發(fā)表于 08-08 07:25

    進(jìn)迭時(shí)空同構(gòu)融合RISC-V AI CPU的Triton算子編譯器實(shí)踐

    Triton是由OpenAI開發(fā)的一個(gè)開源編程語言和編譯器,旨在簡(jiǎn)化高性能GPU內(nèi)核的編寫。它提供了類似Python的語法,并通過高級(jí)抽象降低了GPU編程的復(fù)雜性,同時(shí)保持了高性能。目前
    的頭像 發(fā)表于 07-15 09:04 ?2262次閱讀
    進(jìn)迭時(shí)空同構(gòu)融合RISC-V AI CPU的Triton算子<b class='flag-5'>編譯器</b>實(shí)踐

    邊緣設(shè)備AI部署:編譯器如何實(shí)現(xiàn)輕量化與高性能?

    電子發(fā)燒友網(wǎng)綜合報(bào)道 AI編譯器是專門為人工智能(AI)和機(jī)器學(xué)習(xí)(ML)模型設(shè)計(jì)的編譯器,其核心目標(biāo)是將高級(jí)的AI模型描述(如計(jì)算圖、神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu))轉(zhuǎn)換為特定硬件平臺(tái)(如CPU、GPU、FPGA
    的頭像 發(fā)表于 07-06 05:49 ?6979次閱讀

    編譯器功能安全驗(yàn)證的關(guān)鍵要素

    在汽車、工業(yè)、醫(yī)療等安全關(guān)鍵型應(yīng)用中,確保功能安全合規(guī)性需要嚴(yán)格的工具鏈驗(yàn)證。開發(fā)安全關(guān)鍵型軟件的企業(yè)必須遵守ISO 26262、IEC 61508、ISO 62304等國(guó)際標(biāo)準(zhǔn)對(duì)編譯器工具鏈進(jìn)行全面的驗(yàn)證。
    的頭像 發(fā)表于 07-05 13:37 ?1721次閱讀

    兆松科技發(fā)布高性能RISC-V編譯器ZCC 4.0.0版本

    近日,兆松科技(武漢)有限公司(以下簡(jiǎn)稱“兆松科技”)宣布正式發(fā)布高性能 RISC-V 編譯器 ZCC 4.0.0 版本。新版本在性能優(yōu)化、廠商自定義指令支持和軟件庫等方面實(shí)現(xiàn)全面升級(jí),并同步推出
    的頭像 發(fā)表于 06-27 14:48 ?3906次閱讀
    兆松科技發(fā)布高性能RISC-V<b class='flag-5'>編譯器</b>ZCC 4.0.0版本

    兆松科技ZCC編譯器全面支持芯來科技NA系列處理

    近日,兆松科技(武漢)有限公司(以下簡(jiǎn)稱“兆松科技”)宣布正式發(fā)布高性能RISC-V編譯器ZCC 4.0.0版本。
    的頭像 發(fā)表于 06-11 09:56 ?2034次閱讀

    RISC-V架構(gòu)下的編譯器自動(dòng)向量化

    進(jìn)迭時(shí)空專注于研發(fā)基于RISC-V的高性能新AICPU,對(duì)于充分發(fā)揮CPU核的性能而言,編譯器是不可或缺的一環(huán),而在AI時(shí)代,毫無疑問向量算力將發(fā)揮越來越重要的作用。進(jìn)迭時(shí)空非常重視RISC-V
    的頭像 發(fā)表于 06-06 16:59 ?1460次閱讀
    RISC-V架構(gòu)下的<b class='flag-5'>編譯器</b>自動(dòng)向量化

    RVCT編譯器是否比GNU的編譯器的代碼執(zhí)行速度更快?

    使用FX3S遇到了RVCT編譯器的問題。 1、在SDK的release note中有支持RVCT的描述, 但是在EZ USB Suite的設(shè)置中沒有找到RVCT的選項(xiàng), 請(qǐng)問支持的具體版本
    發(fā)表于 05-08 07:49
    出国| 济源市| 抚松县| 屏东县| 天峻县| 永宁县| 四平市| 安多县| 西华县| 都昌县| 浦县| 昔阳县| 泉州市| 同德县| 文安县| 北川| 平湖市| 额敏县| 霍邱县| 江永县| 宜城市| 民乐县| 石棉县| 奉贤区| 英德市| 垣曲县| 梧州市| 伊宁市| 绍兴市| 嘉峪关市| 师宗县| 太保市| 博罗县| 巴彦县| 宁明县| 鹤庆县| 法库县| 武川县| 石阡县| 宣恩县| 湘阴县|