日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

NumPy完成RISC-V向量擴展適配,SG2044平臺驗證RVV浮點性能優(yōu)勢

算能開發(fā)者社區(qū) ? 2026-05-15 09:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在中國科學院軟件研究所智能軟件研究中心與如意 RISC-V 軟件生態(tài)的持續(xù)推動下,國際主流開源科學計算庫NumPy正式完成對RISC-V Vector(RVV)向量擴展的優(yōu)化適配,并在算能第二代服務器級RISC-V處理器SG2044平臺上完成了系統(tǒng)性性能驗證。在與同等向量寬度的 ARM NEON 平臺對比中,SG2044 在多數(shù)浮點算子場景下,實現(xiàn)最高23%性能領先。

該成果由標志著NumPy正式融入RISC-V高性能基礎軟件生態(tài)體系,為科學計算、數(shù)據(jù)分析、機器學習與工程仿真等關鍵應用場景提供了堅實的軟件基礎。

這一進展不僅是RISC-V基礎軟件生態(tài)的重要里程碑,也充分驗證了算能SG2044在服務器級高性能向量計算場景下的性能潛力

打通NumPy到RVV的端到端優(yōu)化路徑

本次適配工作的核心在于,在NumPy中引入基于Highway庫的RVV向量化支持,打通了從高層NumPy算子到底層RISC-V向量指令的完整優(yōu)化鏈路。通過這一方式NumPy在保持跨平臺可移植性的同時,能夠充分利用RVV的并行計算能力,為數(shù)據(jù)分析、機器學習、工程仿真等典型科學計算負載提供穩(wěn)定且可持續(xù)的性能提升。這一實踐為RISC-V在高性能數(shù)值計算領域的規(guī)?;瘧玫於岁P鍵的軟件基礎。

適配思路:面向工程化的分層遞進

dcbf0c2a-4ff9-11f1-ab55-92fbcf53809c.png


1. RVV CPU特性檢測先行突破

聚焦NumPy的底層架構支持,率先引入了RISC-V CPU特性檢測機制。通過擴展系統(tǒng)配置和構建框架,實現(xiàn)了對RISC-V Vector(RVV)擴展的原生識別與支持,為后續(xù)在RISC-V架構上進行SIMD指令級優(yōu)化奠定了基礎。

2. NumPy算子RVV優(yōu)化

通過深入研究Highway庫的函數(shù)接口與向量抽象機制,并嚴格遵循其編程規(guī)范,結(jié)合支持RVV的CPU硬件環(huán)境,成功實現(xiàn)了NumPy算子的向量化加速。該工作不僅驗證了Highway在可伸縮向量架構上的適配能力,也為后續(xù)在RISC-V平臺開展系統(tǒng)性性能優(yōu)化奠定了關鍵技術基礎。

3. NumPy RVV單元測試模塊

在完成NumPy算子的RVV優(yōu)化后,為確保功能正確性,新增了對CPU調(diào)度器工具和硬件特性檢測模塊的專項單元測試,推動NumPy對RISC-V架構的支持從"能跑"邁向"可靠、可測、可維護"的工程化階段。

圍繞NumPy的底層架構,項目團隊對構建系統(tǒng)與CPU特性檢測機制進行了系統(tǒng)性完善,使其在RISC-V架構下能夠原生識別并啟用RVV擴展能力。在算子實現(xiàn)層面,既保證了性能,又兼顧了代碼的可維護性與擴展性。同時,對部分底層實現(xiàn)進行了重構,為后續(xù)持續(xù)優(yōu)化提供了良好的工程基礎。

貢獻上游推動生態(tài)協(xié)同演進

目前,相關成果已向NumPy上游社區(qū)提交19個PR,累計代碼改動8689行,完成了邏輯判斷、基礎數(shù)學運算、數(shù)學函數(shù)、比較操作以及ArgMax / ArgMin等多類核心算子的RVV向量化優(yōu)化,并同步完善了針對RISC-V平臺的單元測試體系。這些工作推動NumPy對RISC-V的支持從“可運行”邁向“可驗證、可維護”的工程化階段,也為后續(xù)更多科學計算庫在RISC-V平臺上的適配提供了可參考的實踐路徑。

dcd2a4a6-4ff9-11f1-ab55-92fbcf53809c.png


多平臺測試驗證RVV性能潛力

項目團隊在多款支持 RVV 1.0 的硬件平臺上對優(yōu)化效果進行了評估。測試結(jié)果顯示,RVV優(yōu)化在多類 NumPy 算子上均帶來了顯著性能提升,尤其是在ArgMax/ ArgMin等典型歸約算子中,不同數(shù)據(jù)類型均實現(xiàn)穩(wěn)定加速,且數(shù)據(jù)位寬越小,加速效果越明顯。

dce76b34-4ff9-11f1-ab55-92fbcf53809c.pngdcf1e3ac-4ff9-11f1-ab55-92fbcf53809c.pngdd0cd4c8-4ff9-11f1-ab55-92fbcf53809c.png

進一步的對比測試中,算能SG2044(RVV 1.0,128-bit 向量寬度)與 ARM(NEON,128-bit 向量寬度)在相同算子負載下進行了性能對比。結(jié)果顯示,SG2044在浮點算子場景中表現(xiàn)突出,float32與float64類型在多數(shù)測試條件下均實現(xiàn)性能領先,最高提升幅度達到23%,充分體現(xiàn)了RISC-V向量擴展在高精度科學計算和服務器級應用場景中的架構優(yōu)勢。

dd17d9fe-4ff9-11f1-ab55-92fbcf53809c.png


SG2044 RISC-V 服務器處理器

●64 核 RISC-V,最高主頻 2.6GHz,支持 RVV 1.0 向量擴展

●片內(nèi)集成自研 TPU,支持 FP8 / BF16 / FP16 / FP32 等多精度計算

●128GB LPDDR5X,最高 8533 MT/s,帶寬最高 546GB/s

●40 lane PCIe 5.0,支持高性能外設擴展

●支持 8K 視頻編解碼(最高 128 路 1080P 解碼 / 64 路編碼)

●支持 AES、SM 系列加密算法與硬件安全模塊

●支持 SV48 大地址空間,滿足大規(guī)模應用需求

dd25cf28-4ff9-11f1-ab55-92fbcf53809c.png


SRA3-40 RISC-V 計算服務器

●基于算能第二代RISC-V服務器級處理器SG2044

●64核RISC-V核心,支持RVV1.0向量擴展

●片內(nèi)融合異構TPU,內(nèi)置原生FP8算力

●128GB LPDDR5X統(tǒng)一高速內(nèi)存

●支持 4U 8 卡配置,可搭載多張智算加速卡

●支持 12 塊 SAS / SATA 硬盤 + NVMe SSD

●支持 openEuler / Ubuntu / deepin 等主流操作系統(tǒng)

dd459cea-4ff9-11f1-ab55-92fbcf53809c.png


持續(xù)推進RISC-V高性能軟件生態(tài)建設

面向未來,中國科學院軟件研究所智能軟件研究中心團隊將繼續(xù)圍繞NumPy在RISC-V平臺上的性能演進開展工作,包括探索基于RISC-V Zfh擴展的16-bit半精度浮點支持,以及進一步挖掘RVV在矩陣運算等更復雜數(shù)值計算場景中的優(yōu)化空間。

算能也將持續(xù)攜手如意社區(qū)與生態(tài)伙伴,共同推動RISC-V高性能基礎軟件生態(tài)的完善與成熟,加速RISC-V在服務器與智能計算領域的規(guī)?;瘧谩?/span>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 服務器
    +關注

    關注

    14

    文章

    10415

    瀏覽量

    91816
  • 軟件
    +關注

    關注

    69

    文章

    5381

    瀏覽量

    92014
  • RISC-V
    +關注

    關注

    49

    文章

    2976

    瀏覽量

    53648
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Triton-RISCV 完成 RISC-V 原生編譯適配,SG2044 平臺驗證 AI 算子 RVV 加速性能

    編譯與RVV向量加速,并在算能第二代服務器級RISC-V處理器SG2044平臺完成了系統(tǒng)性
    的頭像 發(fā)表于 05-09 17:03 ?1320次閱讀
    Triton-RISCV <b class='flag-5'>完成</b> <b class='flag-5'>RISC-V</b> 原生編譯<b class='flag-5'>適配</b>,<b class='flag-5'>SG2044</b> <b class='flag-5'>平臺</b><b class='flag-5'>驗證</b> AI 算子 <b class='flag-5'>RVV</b> 加速<b class='flag-5'>性能</b>

    RISC-V迎來關鍵拐點

    RVA23標志著主流CPU性能擴展方式的一個轉(zhuǎn)折點。它強制要求使用RISC-V向量擴展(RVV)
    的頭像 發(fā)表于 03-05 15:03 ?1002次閱讀
    <b class='flag-5'>RISC-V</b>迎來關鍵拐點

    OrangePi RV2 深度技術評測:RISC-V AI融合架構的先行者

    :8核RISC-V,支持RVV 1.0 256-bit向量擴展 制程 :22nm(未見官方披露,據(jù)行業(yè)資料為22nm) CPU頻率 :最高2.0 GHz AI算力 :CPU核內(nèi)融合2
    發(fā)表于 03-03 20:19

    重磅合作!Quintauris 聯(lián)手 SiFive,加速 RISC-V 在嵌入式與 AI 領域落地

    多個關鍵領域的落地采用,這波操作真的太讓人期待了~ 這次合作可不是簡單聯(lián)手,核心是優(yōu)勢互補:Quintauris 擅長硬件與軟件 IP,SiFive 則有高性能RISC-V 內(nèi)核和成熟平臺
    發(fā)表于 12-18 12:01

    探索RISC-V在機器人領域的潛力

    : 官方和社區(qū)對主流軟件(如Linux, ROS 2)的適配非常積極,降低了開發(fā)門檻。 3. 定位清晰: 精準定位于高性能RISC-V應用開發(fā)、AI和機器人領域,是學習和項目實踐的優(yōu)秀平臺
    發(fā)表于 12-03 14:40

    risc-v浮點運算單元的使用及其設計考慮

    RISC-V浮點運算單元(floating-point unit,簡稱FPU)是一種專門用于執(zhí)行浮點運算的硬件加速器,其作用是提高浮點運算速度,在科學計算、圖像處理和機器學習等應用領域
    發(fā)表于 10-21 14:46

    RISC-V V擴展的指令代碼

    1.指令集V擴展的主要內(nèi)容: 矢量指令:針對數(shù)據(jù)并行性,增加了一系列新的矢量指令,可以同時對多個數(shù)據(jù)進行操作,提高了計算效率。浮點指令:新增了一些浮點指令,支持更高精度的計算,提高了
    發(fā)表于 10-21 13:11

    RISC-V B擴展介紹及實現(xiàn)

    某個方向移位并將結(jié)果存儲在目標寄存器中;后者則用于為一個值生成一個位掩碼。 此外,B擴展還增加了一組壓縮指令,可以使指令占用更少的內(nèi)存空間,從而提高系統(tǒng)性能。這些壓縮指令兼容于RISC-V ISR
    發(fā)表于 10-21 13:01

    RISC-V HPC新標桿Sophon SG2044深度評估:支持RVV v1.0適配GCC 15.2,多核性能潛力巨大!

    RISC-V架構的普及浪潮中,嵌入式領域的成功早已眾人皆知,但高性能計算(HPC)始終是其難以突破的“高地”。算能SOPHONSG2044的出現(xiàn)打破了僵局。國際權威技術媒體發(fā)布的深度評測《IsRISC-VreadyforHig
    的頭像 發(fā)表于 10-16 13:23 ?1961次閱讀
    <b class='flag-5'>RISC-V</b> HPC新標桿Sophon <b class='flag-5'>SG2044</b>深度評估:支持<b class='flag-5'>RVV</b> <b class='flag-5'>v</b>1.0<b class='flag-5'>適配</b>GCC 15.2,多核<b class='flag-5'>性能</b>潛力巨大!

    強強聯(lián)手!愛丁堡大學與算能破局:RISC-V進軍高性能計算,SG2044多核性能飆漲近5倍

    RISC-V架構的普及浪潮中,嵌入式領域的成功早已眾人皆知,但高性能計算(HPC)始終是其難以突破的“高地”。算能SOPHONSG2044的出現(xiàn)打破了僵局,其64核高性能CPU不僅在
    的頭像 發(fā)表于 08-26 16:31 ?2217次閱讀
    強強聯(lián)手!愛丁堡大學與算能破局:<b class='flag-5'>RISC-V</b>進軍高<b class='flag-5'>性能</b>計算,<b class='flag-5'>SG2044</b>多核<b class='flag-5'>性能</b>飆漲近5倍

    芯華章RISC-V敏捷驗證方案再升級

    7月17-18日,在中國規(guī)模最大、規(guī)格最高的RISC-V峰會上,芯華章向數(shù)千名專業(yè)用戶展示其面向RISC-V指令集打造的完整敏捷驗證方案,其中最新發(fā)布的GalaxSim Turbo 3.0創(chuàng)新性地
    的頭像 發(fā)表于 07-21 17:03 ?1317次閱讀
    芯華章<b class='flag-5'>RISC-V</b>敏捷<b class='flag-5'>驗證</b>方案再升級

    開芯院采用芯華章P2E硬件驗證平臺加速RISC-V驗證

    近日,系統(tǒng)級驗證 EDA 解決方案提供商芯華章科技與北京開源芯片研究院(以下簡稱 “開芯院”)宣布,雙方基于芯華章的P2E 硬件驗證系統(tǒng)雙模驗證平臺,共同探索適用于
    的頭像 發(fā)表于 07-18 10:08 ?2667次閱讀
    開芯院采用芯華章P2E硬件<b class='flag-5'>驗證</b><b class='flag-5'>平臺</b>加速<b class='flag-5'>RISC-V</b><b class='flag-5'>驗證</b>

    RISC-V平臺思維和生態(tài)思維

    Doorn 認為,RISC-V 擴展要擁抱 “平臺思維” 和 “生態(tài)思維”。 ? 在 7 月 17 日舉辦的第五屆(2025)RISC-V 中國峰會主論壇上,Leendert van
    發(fā)表于 07-17 14:04 ?4247次閱讀

    ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀元!代碼已經(jīng)開源,一起來試試!

    AMDROCm6.2.4版本已成功移植到算能SG2044平臺!這一重大突破為SG2044帶來了強大的GPU計算能力,為高性能計算和人工智能應用開啟了前所未有的新篇章
    的頭像 發(fā)表于 07-14 17:04 ?1421次閱讀
    ROCm 6.2.4 成功移植至 <b class='flag-5'>SG2044</b>: 大模型部署速率飆升,<b class='flag-5'>RISC-V</b> + AI 新紀元!代碼已經(jīng)開源,一起來試試!

    RISC-V架構下的編譯器自動向量

    進迭時空專注于研發(fā)基于RISC-V的高性能新AICPU,對于充分發(fā)揮CPU核的性能而言,編譯器是不可或缺的一環(huán),而在AI時代,毫無疑問向量算力將發(fā)揮越來越重要的作用。進迭時空非常重視
    的頭像 發(fā)表于 06-06 16:59 ?1502次閱讀
    <b class='flag-5'>RISC-V</b>架構下的編譯器自動<b class='flag-5'>向量</b>化
    会理县| 航空| 仲巴县| 凉城县| 万山特区| 镇江市| 平远县| 拉萨市| 榆中县| 宝清县| 萍乡市| 大安市| 东丽区| 潼南县| 鹤庆县| 威海市| 滁州市| 霍山县| 错那县| 凉城县| 梅州市| 兴隆县| 齐河县| 石棉县| 浦东新区| 白玉县| 深州市| 崇仁县| 炉霍县| 宜川县| 隆尧县| 隆回县| 得荣县| 丘北县| 榆林市| 罗江县| 平和县| 高陵县| 绥化市| 天等县| 遂溪县|