日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

性能突破 | SpacemiT-X60 在 LLVM 編譯器上實(shí)現(xiàn) 16% 顯著提升

進(jìn)迭時(shí)空 ? 2025-11-21 18:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2025年10月,在北美RISC-V峰會(huì)上,Igalia編譯器工程師Mikhail發(fā)表專題演講《Unlocking 15% More Performance: A Case Study in LLVM Optimization for RISC-V》。演講基于在進(jìn)迭時(shí)空 SpacemiT-X60 RISC-V 處理器上開(kāi)展的十個(gè)月優(yōu)化實(shí)踐,系統(tǒng)闡述如何通過(guò)上游 LLVM 的多項(xiàng)改進(jìn),顯著提升 RISC-V 處理器性能,并在 SPEC CPU 2017 基準(zhǔn)測(cè)試中實(shí)現(xiàn)最高達(dá) 16% 的性能提升。

本次優(yōu)化的重點(diǎn)涵蓋三大方面:

為 SpacemiT-X60 引入定制調(diào)度模型

增強(qiáng)向量化在跨函數(shù)調(diào)用場(chǎng)景下的分析能力

支持過(guò)程間寄存器分配(IPRA)以優(yōu)化寄存器使用

SPEC 測(cè)試

SPEC CPU 2017 是業(yè)界公認(rèn)的 CPU 性能評(píng)估標(biāo)準(zhǔn),通過(guò)運(yùn)行一系列計(jì)算密集型任務(wù)(如代碼編譯、科學(xué)計(jì)算、AI 推理等),全面測(cè)量處理器的整數(shù)與浮點(diǎn)運(yùn)算性能。其測(cè)試結(jié)果能夠客觀反映 CPU 在實(shí)際應(yīng)用中的執(zhí)行效率,是衡量服務(wù)器、工作站及高端 PC 處理器性能的關(guān)鍵基準(zhǔn)。

調(diào)度模型:性能提升的關(guān)鍵


調(diào)度模型的引入是本次性能提升的關(guān)鍵。SpacemiT-X60作為一款按序雙發(fā)射CPU核心,其執(zhí)行效率高度依賴于編譯器生成的指令序列能否充分適配硬件特性。以LOAD指令為例,在等待數(shù)據(jù)就緒的周期內(nèi),通過(guò)智能調(diào)度插入其他可執(zhí)行指令,可有效避免流水線空等——這正如點(diǎn)外賣后,在送達(dá)前處理其他事務(wù),而非一味守在門口。


通過(guò)引入針對(duì) X60 的調(diào)度模型,多個(gè) SPEC 2017 子項(xiàng)目均實(shí)現(xiàn)性能提升,其中最高達(dá) 16.8%,整體性能平均提升 4.75%。由于該調(diào)度優(yōu)化作用于指令序列層面,不依賴特定程序邏輯,因此大多數(shù)軟件均可受益于該項(xiàng)改進(jìn)。


6767517e-c6c1-11f0-8ce9-92fbcf53809c.png


目前,LLVM 中的 RISC-V 后端尚缺乏一個(gè)默認(rèn)的調(diào)度模型。此次為 SpacemiT-X60 開(kāi)發(fā)的模型,有望成為L(zhǎng)LVM RISC-V 目標(biāo)默認(rèn)的調(diào)度模型,為更多RISC-V場(chǎng)景提供優(yōu)化支持。

突破難點(diǎn):跨函數(shù)調(diào)用的向量化優(yōu)化


SpacemiT-X60 支持 256 位寬的 RISC-V Vector (RVV) 1.0 擴(kuò)展。在數(shù)據(jù)并行度高的任務(wù)中,正確使用向量指令可大幅提升程序性能,因此自動(dòng)向量化始終是編譯器優(yōu)化的重點(diǎn)之一。然而,自動(dòng)向量化的關(guān)鍵難點(diǎn)在于代價(jià)評(píng)估:編譯器需準(zhǔn)確判斷在何種場(chǎng)景下向量化能帶來(lái)性能提升,又在哪些情況下可能帶來(lái)性能回退。


Mikhail 在報(bào)告中重點(diǎn)分析了跨函數(shù)調(diào)用這一典型場(chǎng)景。最終落地的 SLP fix 方案取得了顯著優(yōu)化效果,在測(cè)試中實(shí)現(xiàn)單個(gè)用例最高11.9%的性能提升,整體平均提升幅度也接近 1%。


67762582-c6c1-11f0-8ce9-92fbcf53809c.png


減少冗余:過(guò)程間寄存器分配(IPRA)


報(bào)告同時(shí)介紹了對(duì)過(guò)程間寄存器分配(IPRA,Inter-Procedural Register Allocation)的技術(shù)支持。在函數(shù)調(diào)用過(guò)程中,為確保程序正確執(zhí)行,需對(duì)寄存器進(jìn)行保存與恢復(fù)。傳統(tǒng)編譯方式下,由于編譯器無(wú)法預(yù)知被調(diào)用函數(shù)的具體寄存器使用情況,往往采取保守策略,對(duì)所有可能涉及的寄存器執(zhí)行保存與恢復(fù)操作,造成不必要的性能開(kāi)銷。


而 IPRA 技術(shù)通過(guò)過(guò)程間分析,使編譯器能夠精確掌握被調(diào)用函數(shù)的寄存器使用情況。當(dāng)確認(rèn)某些寄存器不會(huì)被破壞時(shí),即可省略相應(yīng)的保存與恢復(fù)指令,從而減少內(nèi)存訪問(wèn)、提升執(zhí)行效率。目前IPRA還有bug尚在修復(fù),暫未默認(rèn)啟用,但在Spec上的測(cè)試已經(jīng)顯示出0.5%的穩(wěn)定性能提升,其優(yōu)化效果已經(jīng)得到驗(yàn)證。


67834d16-c6c1-11f0-8ce9-92fbcf53809c.png


結(jié)語(yǔ)


從報(bào)告展示的最終數(shù)據(jù)來(lái)看,當(dāng)前 GCC 與 LLVM 兩大開(kāi)源編譯器在 RISC-V 平臺(tái)上的表現(xiàn)各有優(yōu)勢(shì),在不同測(cè)試項(xiàng)目中互有領(lǐng)先,這也表明未來(lái)仍有廣闊的協(xié)同優(yōu)化空間。


678f5624-c6c1-11f0-8ce9-92fbcf53809c.png


6799fd86-c6c1-11f0-8ce9-92fbcf53809c.png


本次優(yōu)化工作獲RISE(RISC-V Software Ecosystem)項(xiàng)目RP009課題支持。RISE是由Linux基金會(huì)托管的全球合作計(jì)劃,匯聚行業(yè)領(lǐng)導(dǎo)者共同推動(dòng)RISC-V開(kāi)源軟件發(fā)展。作為RISE成員,進(jìn)迭時(shí)空榮幸見(jiàn)證 SpacemiT-X60被選用于 RISC-V 的編譯器性能優(yōu)化研究并取得顯著成果,特此感謝 Mikhail 及所有開(kāi)發(fā)者的貢獻(xiàn)。


截至目前,進(jìn)迭時(shí)空 8 核 RISC-V AI CPU 芯片 K1 累計(jì)量產(chǎn)交付量突破 13 萬(wàn)顆,已成為量產(chǎn)速度最快的 RISC-V 高算力芯片。同時(shí),公司通過(guò) Bianbu Cloud 等云服務(wù)方式,為開(kāi)發(fā)者提供便捷、即時(shí)的 RISC-V 算力服務(wù)。我們堅(jiān)信,隨著更多行業(yè)伙伴與開(kāi)發(fā)者的加入,RISC-V 生態(tài)將加速邁向成熟。


附錄


1.RISC-V Summit 2025:

https://riscvsummit2025.sched.com/event/28OTp/unlocking-15-more-performance-a-case-study-in-llvm-optimization-for-risc-v-mikhail-r-gadelha-igalia

2.RISE RP009:

https://blogs.igalia.com/compilers/2025/05/05/boosting-risc-v-application-performance-an-8-month-llvm-journey/

3.RISE BLOG :

https://riseproject.dev/2025/05/08/project-rp009-llvm-spec-optimization/

4.Igalia BLOG :

https://blogs.igalia.com/compilers/2025/05/05/boosting-risc-v-application-performance-an-8-month-llvm-journey/

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1673

    瀏覽量

    51953
  • RISC-V處理器
    +關(guān)注

    關(guān)注

    0

    文章

    86

    瀏覽量

    11131
  • 進(jìn)迭時(shí)空
    +關(guān)注

    關(guān)注

    0

    文章

    70

    瀏覽量

    634
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    PIC16(L)F170X/171X:高性價(jià)比8位智能模擬閃存微控制的卓越之選

    PIC16(L)F170X/171X:高性價(jià)比8位智能模擬閃存微控制的卓越之選 電子設(shè)計(jì)領(lǐng)域,選擇一款合適的微控制
    的頭像 發(fā)表于 04-29 17:05 ?585次閱讀

    開(kāi)源鴻蒙技術(shù)大會(huì)2025丨編譯器與編程語(yǔ)言分論壇:語(yǔ)言驅(qū)動(dòng)系統(tǒng)創(chuàng)新,編譯賦能生態(tài)繁榮

    萬(wàn)物智聯(lián)的時(shí)代背景下,操作系統(tǒng)底層能力的構(gòu)建離不開(kāi)編程語(yǔ)言與編譯器的關(guān)鍵支撐。作為開(kāi)源鴻蒙生態(tài)的核心技術(shù),語(yǔ)言設(shè)計(jì)與編譯器、虛擬機(jī)實(shí)現(xiàn)的進(jìn)步直接關(guān)系到開(kāi)發(fā)效率、運(yùn)行
    的頭像 發(fā)表于 11-20 17:24 ?1187次閱讀
    開(kāi)源鴻蒙技術(shù)大會(huì)2025丨<b class='flag-5'>編譯器</b>與編程語(yǔ)言分論壇:語(yǔ)言驅(qū)動(dòng)系統(tǒng)創(chuàng)新,<b class='flag-5'>編譯</b>賦能生態(tài)繁榮

    Altera發(fā)布 Quartus? Prime 專業(yè)版和 FPGA AI 套件 25.3 版:編譯更快,智能更強(qiáng)

    投產(chǎn)以來(lái)編譯時(shí)間縮短多達(dá) 27%,同時(shí)顯著提升了 AI 工具的易用性; 得益于增強(qiáng)型編譯器和架構(gòu)優(yōu)化,設(shè)計(jì)人員平均可節(jié)省
    的頭像 發(fā)表于 11-13 09:24 ?7.6w次閱讀
    Altera發(fā)布 Quartus? Prime 專業(yè)版和 FPGA AI 套件 25.3 版:<b class='flag-5'>編譯</b>更快,智能更強(qiáng)

    【CPKCOR-RA8D1】AI人臉檢測(cè)(安裝對(duì)應(yīng)版本的FSP及LLVM

    \\\\toolchains\\\\llvm_arm\\\\LLVMEmbeddedToolchainForArm-17.0.1-Windows-x86_64)。 確認(rèn)添加成功: e2 studio
    發(fā)表于 10-31 11:22

    GCC編譯器,怎么才能實(shí)現(xiàn)c文件中未被調(diào)用的函數(shù),不會(huì)被編譯呢?

    GCC編譯器,怎么才能實(shí)現(xiàn)c文件中未被調(diào)用的函數(shù),不會(huì)被編譯?有什么編譯選項(xiàng)可以設(shè)置嗎? 移植代碼,有些函數(shù)沒(méi)被調(diào)用的函數(shù)想留在代碼里,但不想被編譯
    發(fā)表于 09-28 12:25

    如何在Keil中將NuMicro BSP從Arm編譯器5遷移到編譯器6?

    Keil中將NuMicro BSP從Arm編譯器5遷移到編譯器6!
    發(fā)表于 08-20 06:29

    【HZ-T536開(kāi)發(fā)板免費(fèi)體驗(yàn)】2 - 交叉編譯倉(cāng)頡編程語(yǔ)言程序到開(kāi)發(fā)板運(yùn)行

    AARCH64的編譯器(我使用的是WSL2): sudo apt install gcc-aarch64-linux-gnu 然后需要拷貝aarch64開(kāi)發(fā)包中以下三個(gè)目錄的文件到x86_64的Linux軟件包
    發(fā)表于 07-16 21:27

    邊緣設(shè)備AI部署:編譯器如何實(shí)現(xiàn)輕量化與高性能?

    、ASIC等)上高效執(zhí)行的機(jī)器代碼。AI編譯器AI模型的部署和優(yōu)化中扮演著關(guān)鍵角色,能夠顯著提升模型的運(yùn)行效率和性能。 ? AI
    的頭像 發(fā)表于 07-06 05:49 ?6973次閱讀

    編譯器功能安全驗(yàn)證的關(guān)鍵要素

    汽車、工業(yè)、醫(yī)療等安全關(guān)鍵型應(yīng)用中,確保功能安全合規(guī)性需要嚴(yán)格的工具鏈驗(yàn)證。開(kāi)發(fā)安全關(guān)鍵型軟件的企業(yè)必須遵守ISO 26262、IEC 61508、ISO 62304等國(guó)際標(biāo)準(zhǔn)對(duì)編譯器工具鏈進(jìn)行全面的驗(yàn)證。
    的頭像 發(fā)表于 07-05 13:37 ?1714次閱讀

    兆松科技發(fā)布高性能RISC-V編譯器ZCC 4.0.0版本

    近日,兆松科技(武漢)有限公司(以下簡(jiǎn)稱“兆松科技”)宣布正式發(fā)布高性能 RISC-V 編譯器 ZCC 4.0.0 版本。新版本性能優(yōu)化、廠商自定義指令支持和軟件庫(kù)等方面
    的頭像 發(fā)表于 06-27 14:48 ?3864次閱讀
    兆松科技發(fā)布高<b class='flag-5'>性能</b>RISC-V<b class='flag-5'>編譯器</b>ZCC 4.0.0版本

    兆松科技ZCC編譯器全面支持芯來(lái)科技NA系列處理

    近日,兆松科技(武漢)有限公司(以下簡(jiǎn)稱“兆松科技”)宣布正式發(fā)布高性能RISC-V編譯器ZCC 4.0.0版本。
    的頭像 發(fā)表于 06-11 09:56 ?2028次閱讀

    RISC-V架構(gòu)下的編譯器自動(dòng)向量化

    性能算力生態(tài)的建設(shè),正投入編譯器自動(dòng)向量化優(yōu)化等多項(xiàng)關(guān)鍵技術(shù),全面助力RISC-V的高性能發(fā)展。RISC-V向量設(shè)計(jì)SpacemiT現(xiàn)代
    的頭像 發(fā)表于 06-06 16:59 ?1455次閱讀
    RISC-V架構(gòu)下的<b class='flag-5'>編譯器</b>自動(dòng)向量化

    先楫 x 兆松:打造國(guó)產(chǎn)高性能 RISC-V MCU生態(tài)里程碑

    2025年06月06日,兆松科技(武漢)有限公司(以下簡(jiǎn)稱“兆松科技”)宣布正式發(fā)布高性能RISC-V編譯器ZCC4.0.0版本。新版本性能優(yōu)化、廠商自定義指令支持和軟件庫(kù)等方面
    的頭像 發(fā)表于 06-06 15:53 ?2492次閱讀
    先楫 <b class='flag-5'>x</b> 兆松:打造國(guó)產(chǎn)高<b class='flag-5'>性能</b> RISC-V MCU生態(tài)里程碑

    不借助Linux系統(tǒng),Windows下如何搭建ZMC900E交叉編譯環(huán)境

    嵌入式Linux系統(tǒng),由于系統(tǒng)資源的匱乏,通常無(wú)法安裝本地編譯器進(jìn)行本地開(kāi)發(fā),而需要在借助一臺(tái)主機(jī)進(jìn)行交叉開(kāi)發(fā)。一般情況下,主機(jī)安裝相應(yīng)的交叉編譯器,將在主機(jī)編
    的頭像 發(fā)表于 05-21 11:34 ?1115次閱讀
    不借助Linux系統(tǒng),<b class='flag-5'>在</b>Windows下如何搭建ZMC900E交叉<b class='flag-5'>編譯</b>環(huán)境

    RVCT編譯器是否比GNU的編譯器的代碼執(zhí)行速度更快?

    使用FX3S遇到了RVCT編譯器的問(wèn)題。 1、SDK的release note中有支持RVCT的描述, 但是EZ USB Suite的設(shè)置中沒(méi)有找到RVCT的選項(xiàng), 請(qǐng)問(wèn)支持的具體版本
    發(fā)表于 05-08 07:49
    通榆县| 静海县| 高州市| 玉溪市| 阿坝| 南投市| 乌什县| 丹江口市| 吉林市| 湄潭县| 鄂托克旗| 台前县| 石屏县| 苍南县| 礼泉县| 余姚市| 腾冲县| 兴隆县| 容城县| 海淀区| 稻城县| 育儿| 高邮市| 新化县| 林州市| 东阿县| 察雅县| 腾冲县| 西乡县| 论坛| 枞阳县| 台安县| 监利县| 高邑县| 克山县| 耒阳市| 腾冲县| 安西县| 佛学| 郎溪县| 揭东县|