日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA RAPIDS 25.06版本新增多項功能

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2025-09-09 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

RAPIDS 是一套面向 Python 數(shù)據(jù)科學(xué)的 NVIDIA CUDA-X 庫,最新發(fā)布的 25.06 版本引入了多項亮眼新功能,其中包括 Polars GPU 流執(zhí)行引擎——這是一種面向圖神經(jīng)網(wǎng)絡(luò)(GNN)的統(tǒng)一 API,以及無需更改代碼即可實現(xiàn)的支持向量機加速功能。在本篇博客中,我們將介紹其中的幾項重要更新。

Polars GPU 引擎更新

2024 年 9 月,NVIDIA 與 Polars 團隊合作推出了基于 NVIDIA cuDF 開發(fā)的 Polars GPU 引擎。此次發(fā)布的 25.06 版對 Polars GPU 引擎的功能進行了重大更新。

流執(zhí)行器現(xiàn)已進入實驗階段

25.06 版在 Polars GPU 引擎中引入了流執(zhí)行功能。流執(zhí)行器利用數(shù)據(jù)分區(qū)和并行處理技術(shù),能夠處理超出顯存容量的數(shù)據(jù)集。要使用這個新的流執(zhí)行器,用戶可以將恰當(dāng)配置的 GPUEngine 對象傳遞給 Polars 的 collect 調(diào)用。

這種新的流模式還能讓用戶將數(shù)據(jù)處理工作流擴展到多個 GPU,有助于加速分析數(shù)百 GB 到 TB 級的數(shù)據(jù)集。對于需要在分區(qū)之間移動數(shù)據(jù)的操作(例如連接和分組),新引入的數(shù)據(jù)混洗(shuffle)機制可在設(shè)備之間重新分配數(shù)據(jù)。多 GPU 執(zhí)行通過 Dask 分布式調(diào)度器進行編排,使用前需要先設(shè)置一個 Dask 客戶端。

流執(zhí)行器目前仍在積極開發(fā)中,尚未支持的操作將自動回退到內(nèi)存執(zhí)行器。

支持滾動聚合及更多列操作

最新版本還包含了對 Polars GPU 引擎中一些關(guān)鍵新 DataFrame 功能的支持。首先,我們在 Polars 中添加了對 .rolling() 操作的支持,允許用戶基于一些 DataFrame 中的其他列創(chuàng)建滾動組。這在處理時間序列數(shù)據(jù)集時尤為實用。

此外 GPU 引擎現(xiàn)在支持更豐富的日期時間列表達式,目前已支持的新方法包括 .strftime() 和 .cast_time_unit()。隨著我們繼續(xù)擴展整體 API 覆蓋范圍,未來版本還將支持更多方法。

統(tǒng)一的 GNN API

NVIDIA cuGraph-PyG 進一步集成了 WholeGraph 以加速特征提取,形成了我們所說的統(tǒng)一 API。這個新 API 現(xiàn)在允許用戶在單 GPU 工作流中使用 WholeGraph 的加速特征存儲,同時無需修改腳本即可用于多 GPU 或多節(jié)點工作流。

借助統(tǒng)一 API,在單 GPU 上進行原型開發(fā)時使用相同的 GNN 訓(xùn)練腳本就能在具有多個 GPU 的單節(jié)點以及多節(jié)點上運行。通過 PyTorch 的 torchrun 命令管理進程設(shè)置,使得大多數(shù) PyTorch 用戶都可以熟練地使用統(tǒng)一 API。

無需更改代碼的 cuML 增強功能

今年 3 月,NVIDIA 推出了由 cuML 驅(qū)動、用于 scikit-learn 的無需更改代碼的加速器,該加速器已進入公測階段。在 25.06 版本中,cuML 為用戶帶來了更多無需更改代碼的功能。

無需更改代碼的支持向量機

NVIDIA cuML 擴展了其無需更改代碼的加速功能,新增了對支持向量機的支持。支持向量分類(SVC)和支持向量回歸(SVR)這兩種強大的算法在 GPU 上執(zhí)行時,能很好地處理高維數(shù)據(jù)并顯著地提升速度。通過在 cuML 的零代碼變更接口中添加這些估計器,利用支持向量機的現(xiàn)有 scikit-learn 工作流無需修改即可加速。cuML 和 scikit-learn 在 SVC 和 SVR 的實現(xiàn)上存在一些關(guān)鍵差異,還請用戶加以了解。

改進的 scikit-learn 兼容性

25.06 版本對 cuML 加速 scikit-learn 估計器的方式進行了重大重構(gòu),增強了 scikit-learn 一致性,還改進了參數(shù)驗證和異常處理。此外,通過這次重新設(shè)計,cuML 也增強了與 scikit-learn API 的兼容性,可以更輕松地加速目前與 scikit-learn 集成的第三方庫。

隨機森林與更新后的森林推理庫(FIL)集成

通過集成更快、更強大的森林推理庫(FIL),cuML 的隨機森林估計器得到了升級,在保持向后兼容性的同時,提供了更高的性能和更好的內(nèi)存管理。

需注意,舊版特有的一些 API 調(diào)節(jié)參數(shù)(knobs)現(xiàn)已棄用,并將在即將發(fā)布的 25.08 版本中移除。

RAPIDS 內(nèi)存管理器與NVIDIABlackwell 解壓縮引擎的兼容性

RAPIDS 內(nèi)存管理器(RMM)庫增加了全新功能,確保用戶能夠使用最新的 NVIDIA 硬件功能。在最新版本中,RMM 異步內(nèi)存資源可支持兼容 NVIDIA Blackwell GPU 上基于硬件的解壓縮引擎,讓 IO 密集型工作流中的性能得到提升。

此外,RMM 現(xiàn)在以一個預(yù)編譯共享庫的形式存在,取代了之前的僅包含頭文件的庫。我們相信這一變化將為未來解鎖新功能奠定基礎(chǔ)。

平臺更新:Python 和NVIDIA CUDA 支持

25.06 版本為所有 RAPIDS 庫添加了對 Python 3.13 的支持,同時也是最后一個支持 CUDA 11 的版本。從 25.08 版開始,RAPIDS 將不再支持 CUDA 11。如需繼續(xù)使用 CUDA 11,可以固定使用 25.06 版本。

結(jié)語

RAPIDS 25.06 版為新的機器學(xué)習(xí)算法帶來了零代碼變更功能、新的 Polars GPU 流引擎、異步內(nèi)存資源的硬件解壓縮功能等多項功能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5696

    瀏覽量

    110139
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5283

    瀏覽量

    136096
  • 引擎
    +關(guān)注

    關(guān)注

    1

    文章

    369

    瀏覽量

    23514

原文標題:RAPIDS 新增 GPU Polars 流執(zhí)行等多項新功能

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    請問如何使用MCUXpresso Secure Provisioning Tool 25.06創(chuàng)建便攜式制造包?

    我目前正在使用 MCUX 安全配置工具 v25.06 為 i.MX RT1052 設(shè)備生成制造包。 該包已成功創(chuàng)建并在生成包的同一臺 PC 上正常工作。但是,當(dāng)我嘗試在另一臺計算機上使用相同的制造包
    發(fā)表于 04-10 12:29

    索尼更新相機遙控軟件開發(fā)包2.01版本

    2026年2月03日,索尼(中國)有限公司正式發(fā)布了可通過電腦遠程操控索尼相機的相機遙控軟件開發(fā)包(Camera Remote SDK)2.01版本,本次更新帶來了2個新功能,新增支持機型ILCE-7M5、PXW-Z380、DS
    的頭像 發(fā)表于 02-03 16:59 ?897次閱讀

    西門子PCB DFM分析工具Valor NPI 2510版本新增功能

    Valor NPI 2510 版本新增多項檢查功能、提升制造風(fēng)險識別,并推出令人矚目的 3D 可視化增強特性,這標志著產(chǎn)品的重大升級。Valor NPI 的 3D 視圖經(jīng)過重新設(shè)計,讓可制造性設(shè)計 (DFM) 結(jié)果的查看更直觀、
    的頭像 發(fā)表于 01-04 16:10 ?740次閱讀
    西門子PCB DFM分析工具Valor NPI 2510<b class='flag-5'>版本</b>的<b class='flag-5'>新增</b><b class='flag-5'>功能</b>

    睿擎平臺v1.7.2版本正式發(fā)布|技術(shù)集結(jié)

    核心亮點:●RC3562新產(chǎn)品系列重磅上線●RC3506平臺新增多項核心功能RC3562新產(chǎn)品系列重磅推出RC3562作為睿擎平臺全新產(chǎn)品系列,具備以下核心優(yōu)勢:●默認集成AMP混合部署方案,提升
    的頭像 發(fā)表于 12-17 18:10 ?785次閱讀
    睿擎平臺v1.7.2<b class='flag-5'>版本</b>正式發(fā)布|技術(shù)集結(jié)

    NVIDIA CUDA 13.1版本新增功能與改進

    NVIDIA CUDA 13.1 是自 CUDA 二十年前發(fā)明以來,規(guī)模最大、內(nèi)容最全面的一次更新。
    的頭像 發(fā)表于 12-13 10:08 ?2483次閱讀

    AMD Vivado Design Suite 2025.2版本現(xiàn)已發(fā)布

    AMD Vivado Design Suite 2025.2 版本現(xiàn)已發(fā)布,新增對 AMD Versal 自適應(yīng) SoC 的設(shè)計支持,包含新器件支持、QoR 功能及易用性增強。
    的頭像 發(fā)表于 12-09 15:11 ?1372次閱讀

    連接標準聯(lián)盟正式推出Matter 1.5版本

    、土壤傳感器的支持,同時還新增多項能源管理功能。此次更新延續(xù)了 Matter 的核心使命,即簡化智能家居開發(fā)流程、增強設(shè)備互操作性,為消費者與開發(fā)者打造更豐富、更可持續(xù)的互操作體驗。
    的頭像 發(fā)表于 11-30 10:34 ?1333次閱讀

    開鴻Bot系列大版本更新:體驗穩(wěn)定升級,樂享高效協(xié)同!

    V5.0.1.22版本開鴻Bot系列今日,開鴻Bot系列迎來第二次大版本更新——V5.0.1.22。此次版本更新致力于進一步提升系統(tǒng)穩(wěn)定性與用戶體驗,新增多項實用
    的頭像 發(fā)表于 09-26 17:06 ?1575次閱讀
    開鴻Bot系列大<b class='flag-5'>版本</b>更新:體驗穩(wěn)定升級,樂享高效協(xié)同!

    連接標準聯(lián)盟發(fā)布Matter 1.4.2版本

    連接標準聯(lián)盟(Connectivity Standard Alliance)近期發(fā)布了Matter 1.4.2 的標準版本更新。此版本引入了多項重要的增強功能,進一步鞏固了Matter
    的頭像 發(fā)表于 08-18 16:54 ?1697次閱讀

    開鴻Bot系列V5.0.1.10版本升級!

    開鴻Bot系列更新至V5.0.1.10版本,此次升級聚焦功能優(yōu)化及系統(tǒng)穩(wěn)定性提升,在分布式能力、文件分享、打印功能及界面顯示等方面進行了多項改進,同時修復(fù)了多個已知問題,進一步提升了系
    的頭像 發(fā)表于 08-08 18:58 ?891次閱讀
    開鴻Bot系列V5.0.1.10<b class='flag-5'>版本</b>升級!

    匠芯創(chuàng)發(fā)布新版GUI開發(fā)工具 新增多國語言設(shè)置等功能

    。此次版本更新,為用戶帶來了諸多實用的新功能,進一步提升了設(shè)計體驗和開發(fā)效率。在V1.3.0版本中,AiUIBuilder新增了多國語言切換功能
    的頭像 發(fā)表于 08-07 15:36 ?1570次閱讀
    匠芯創(chuàng)發(fā)布新版GUI開發(fā)工具 <b class='flag-5'>新增多</b>國語言設(shè)置等<b class='flag-5'>功能</b>

    匠芯創(chuàng)發(fā)布新版GUI開發(fā)工具 新增多國語言設(shè)置等功能

    。此次版本更新,為用戶帶來了諸多實用的新功能,進一步提升了設(shè)計體驗和開發(fā)效率。 在V1.3.0版本中,AiUIBuilder新增了 多國語言切換功能
    發(fā)表于 07-16 13:54

    NVIDIA DOCA 3.0版本的亮點解析

    NVIDIA DOCA 框架已發(fā)展成為新一代 AI 基礎(chǔ)設(shè)施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發(fā)布,每個版本都擴展了
    的頭像 發(fā)表于 07-04 14:27 ?1409次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA 3.0<b class='flag-5'>版本</b>的亮點解析

    CANoe產(chǎn)品體系19版本新特性及新增Option(上)

    版本持續(xù)助力當(dāng)前車輛E/E架構(gòu)中ECU開發(fā)驗證,同時賦能后續(xù)智能網(wǎng)聯(lián)電動車型預(yù)研驗證。新版本CANoe產(chǎn)品體系新增數(shù)據(jù)驅(qū)動的DDS、車輛互聯(lián)服務(wù)和高效電機模型庫,進一步支持CANXL
    的頭像 發(fā)表于 06-11 10:03 ?3247次閱讀
    CANoe產(chǎn)品體系19<b class='flag-5'>版本</b>新特性及<b class='flag-5'>新增</b>Option(上)

    NVIDIA在ICRA 2025展示多項最新研究成果

    在亞特蘭大舉行的國際機器人與自動化大會 (ICRA) 上,NVIDIA 展示了其在生成式 AI、仿真和自主操控領(lǐng)域的多項研究成果。
    的頭像 發(fā)表于 06-06 14:56 ?1603次閱讀
    澳门| 桃园市| 镇巴县| 丹东市| 广州市| 乌拉特后旗| 阿克陶县| 桐庐县| 新野县| 黑水县| 长子县| 榆林市| 高安市| 平潭县| 泽库县| 青铜峡市| 茶陵县| 贵定县| 江门市| 综艺| 运城市| 溆浦县| 怀集县| 璧山县| 杭锦后旗| 抚州市| 法库县| 资阳市| 阿瓦提县| 阿克陶县| 锦屏县| 尚义县| 广灵县| 建平县| 田阳县| 荥阳市| 偃师市| 平武县| 垣曲县| 海林市| 石楼县|