日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

將NVIDIA加速計(jì)算引入Polars

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-11-20 10:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Polars 近日發(fā)布了一款由 RAPIDS cuDF 驅(qū)動(dòng)的全新 GPU 引擎,該引擎可將 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,使數(shù)據(jù)科學(xué)家僅在一臺(tái)機(jī)器上就能實(shí)現(xiàn)在數(shù)秒內(nèi)處理數(shù)億行數(shù)據(jù)。

日新月異的數(shù)據(jù)挑戰(zhàn)

Pandas 等傳統(tǒng)數(shù)據(jù)處理庫(kù)均為單線程,當(dāng)處理數(shù)據(jù)超過(guò)數(shù)百萬(wàn)行時(shí)就會(huì)顯得“力不從心”。分布式數(shù)據(jù)處理系統(tǒng)雖然可以處理數(shù)十億行數(shù)據(jù),但又會(huì)增加處理中小型數(shù)據(jù)集的復(fù)雜程度和經(jīng)費(fèi)開支。

在高效處理數(shù)千萬(wàn)至數(shù)億行數(shù)據(jù)的工具之間一直存在著差距。這類工作負(fù)載常見于金融、零售、制造等行業(yè)的模型開發(fā)、需求預(yù)測(cè)和物流中。

在面向數(shù)據(jù)科學(xué)家和工程師Python 庫(kù)中,Polars 的增長(zhǎng)速度位居前列,其設(shè)計(jì)初衷就是為了應(yīng)對(duì)這些挑戰(zhàn)。該程序庫(kù)使用了先進(jìn)的查詢優(yōu)化技術(shù),以減少不必要的數(shù)據(jù)移動(dòng)和處理,使數(shù)據(jù)科學(xué)家可以僅用一臺(tái)機(jī)器就能流暢地處理數(shù)億行規(guī)模的工作負(fù)載。Polars 彌補(bǔ)了單線程解決方案速度過(guò)慢和分布式系統(tǒng)會(huì)增加非必要復(fù)雜性的缺陷,提供了一個(gè)極具吸引力的“中等規(guī)?!睌?shù)據(jù)處理解決方案。

將 NVIDIA 加速計(jì)算引入 Polars

與其他僅使用 CPU 的數(shù)據(jù)處理工具相比,Polars 利用多線程執(zhí)行、高級(jí)內(nèi)存優(yōu)化和惰性求值(lazy evaluation)功能,可顯著提升開箱即用的加速性能。

但由于各行各業(yè)的企業(yè)面臨日益增長(zhǎng)的數(shù)據(jù)處理需求,例如需要分析數(shù)十億筆金融交易、管理復(fù)雜的庫(kù)存系統(tǒng)等,都需要更加強(qiáng)大的性能。這時(shí)就該輪到加速計(jì)算發(fā)揮作用了:

cuDF 是 NVIDIA CUDA-X 加速庫(kù)中的 RAPIDS 套件的一部分,它是一個(gè)由 GPU 提供加速的 DataFrame 程序庫(kù),能夠利用 GPU 的大規(guī)模并行處理能力顯著提高數(shù)據(jù)處理性能。

Polars 團(tuán)隊(duì)與 NVIDIA 一起將 cuDF 的速度與 Polars 的效率相結(jié)合,使性能最高提速至在 CPU 上 Polars 的 13 倍。如此,即便用戶的數(shù)據(jù)處理工作量增長(zhǎng)到數(shù)億甚至數(shù)十億行數(shù)據(jù),依然能夠保持交互。

9f9cb96c-a016-11ef-93f3-92fbcf53809c.jpg

圖 1.圖中所示的是 PDS-H 基準(zhǔn)測(cè)試 22 個(gè)查詢中加速幅度最大的 4 個(gè)查詢。在運(yùn)行包含眾多復(fù)雜分組和連接操作的查詢時(shí),RAPIDS cuDF 驅(qū)動(dòng)的 Polars GPU 引擎的速度提速至 CPU 上 Polars 的 13 倍。

PDS-H基準(zhǔn)測(cè)試規(guī)模系數(shù) 80 | GPU:NVIDIA H100 | CPU:英特爾 Xeon W9-3495X(Sapphire Rapids) | 存儲(chǔ):本地NVMe。備注:PDS-H 源自 TPC-H,但這些結(jié)果與 TPC-H 的結(jié)果不具有可比性。

由于 Polars GPU 引擎直接內(nèi)置在 Polars Lazy API 中,用戶只需通過(guò) pip 安裝 polars[gpu] 并將 [engine=”gpu”] 發(fā)送至 collect 操作,即可將 GPU 加速應(yīng)用于他們的工作流。在后臺(tái),Polars 會(huì)嘗試首先在 GPU 上執(zhí)行操作,必要時(shí)再返回 CPU。這種方法可確保:

通過(guò)使用 Polars 的查詢優(yōu)化器,實(shí)現(xiàn)高效執(zhí)行和最低內(nèi)存使用

用戶無(wú)須修改現(xiàn)有 Polars 代碼,即可訪問(wèn) GPU 引擎

完全兼容 Polars 不斷發(fā)展的數(shù)據(jù)可視化、I/O 和機(jī)器學(xué)習(xí)庫(kù)生態(tài)系統(tǒng)

pip install polars[gpu] --extra-index-url=https://pypi.nvidia.com
 
import polars as pl
 
(transactions
 .group_by("CUST_ID")
 .agg(pl.col("AMOUNT").sum())
 .sort(by="AMOUNT", descending=True)
 .head()
 .collect(engine="gpu"))

結(jié)語(yǔ)

RAPIDS cuDF 驅(qū)動(dòng)的 Polars GPU 引擎現(xiàn)已發(fā)布公測(cè)版,為各行各業(yè)的數(shù)據(jù)科學(xué)家和工程師提供了一種適用于中等規(guī)模數(shù)據(jù)處理的強(qiáng)大工具。該引擎最高能夠?qū)?NVIDIA GPU 上的 Polars 工作流速度提速 13 倍,可以在不產(chǎn)生分布式系統(tǒng)開銷的情況下,高效處理數(shù)億行規(guī)模的數(shù)據(jù)集。Polars GPU 引擎直接內(nèi)置在 Polars API 中,使所有用戶都能輕松訪問(wèn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5696

    瀏覽量

    110142
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5283

    瀏覽量

    136101
  • 引擎
    +關(guān)注

    關(guān)注

    1

    文章

    369

    瀏覽量

    23514

原文標(biāo)題:RAPIDS cuDF 驅(qū)動(dòng)的 Polars GPU 引擎發(fā)布公測(cè)版

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Oracle和NVIDIA合作加速向量搜索和企業(yè)數(shù)據(jù)處理

    Oracle 和 NVIDIA 正在與客戶合作, GPU 加速的向量索引構(gòu)建應(yīng)用于實(shí)際工作負(fù)載。Oracle Private AI Services Container 初期支持 CPU 執(zhí)行,現(xiàn)
    的頭像 發(fā)表于 03-23 15:26 ?459次閱讀

    NVIDIA攜手微軟加速機(jī)器人和物理AI的發(fā)展

    在 GTC 大會(huì)上,微軟宣布了其代理式和物理 AI 系統(tǒng)統(tǒng)一平臺(tái)的更新,加速從實(shí)驗(yàn)到生產(chǎn)落地的進(jìn)程。 Microsoft Foundry 與 NVIDIA 開放模型和加速
    的頭像 發(fā)表于 03-23 15:21 ?995次閱讀

    NVIDIA RTX加速計(jì)算機(jī)現(xiàn)可直接連接到Apple Vision Pro

    NVIDIA 與 Apple 協(xié)作 NVIDIA CloudXR 6.0 原生集成到 visionOS 中,安全地基于 NVIDIA R
    的頭像 發(fā)表于 03-23 15:03 ?551次閱讀

    NVIDIA攜手全球工業(yè)軟件巨頭構(gòu)建AI智能體加速設(shè)計(jì)與工程開發(fā)流程

    GTC — NVIDIA 今日宣布,正與包括 Cadence、達(dá)索系統(tǒng)、PTC、西門子和新思科技等在內(nèi)的全球領(lǐng)先工業(yè)軟件廠商合作, NVIDIA CUDA-X?、NVIDIA Omn
    的頭像 發(fā)表于 03-19 15:39 ?451次閱讀

    NVIDIA DLSS 5發(fā)布并首次引入實(shí)時(shí)神經(jīng)網(wǎng)絡(luò)渲染模型

    NVIDIA 今天發(fā)布 NVIDIA DLSS 5,這是自 2018 年實(shí)時(shí)光線追蹤首次亮相以來(lái),NVIDIA計(jì)算機(jī)圖形領(lǐng)域最重大的突破。
    的頭像 發(fā)表于 03-19 15:33 ?394次閱讀

    NVIDIA加速計(jì)算平臺(tái)助力從地球到太空的AI應(yīng)用

    NVIDIA 今日宣布,其最新一代加速計(jì)算平臺(tái)正在開啟太空創(chuàng)新的新時(shí)代,將為軌道數(shù)據(jù)中心 (ODC)、地理空間信息收集以及自主太空運(yùn)行提供 AI 算力。
    的頭像 發(fā)表于 03-18 14:44 ?576次閱讀

    利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測(cè)試與驗(yàn)證數(shù)據(jù)生成。借助 NVIDIA Omniverse 庫(kù)和 Co
    的頭像 發(fā)表于 12-01 09:25 ?1485次閱讀

    NVIDIA在ISC 2025分享最新超級(jí)計(jì)算進(jìn)展

    NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代網(wǎng)絡(luò)和量子技術(shù)實(shí)現(xiàn)了飛躍。在 SC25 上展示的加速系統(tǒng)突顯了全球超級(jí)計(jì)算和 AI 的進(jìn)展
    的頭像 發(fā)表于 11-25 10:59 ?1126次閱讀
    <b class='flag-5'>NVIDIA</b>在ISC 2025分享最新超級(jí)<b class='flag-5'>計(jì)算</b>進(jìn)展

    NVIDIA宣布開源Aerial軟件

    NVIDIA 開源其 Aerial 軟件,并將 NVIDIA Sionna 研究套件和 Aerial 測(cè)試平臺(tái)引入 NVIDIA DGX Spark 平臺(tái),為研究人員提供強(qiáng)大的工具和便
    的頭像 發(fā)表于 11-03 15:14 ?1211次閱讀

    NVIDIA推出NVQLink高速互連架構(gòu)

    NVIDIA 推出 NVIDIA NVQLink,這是一種開放式系統(tǒng)架構(gòu),可將 GPU 計(jì)算的極致性能與量子處理器緊密結(jié)合,以構(gòu)建加速的量子超級(jí)計(jì)算
    的頭像 發(fā)表于 11-03 14:53 ?910次閱讀

    NVIDIA IGX Thor 機(jī)器人處理器實(shí)時(shí)物理 AI 引入工業(yè)和醫(yī)療邊緣場(chǎng)景

    年 10 月 28 日—— ?AI 正由數(shù)字世界走向物理世界。在工廠車間和手術(shù)室等場(chǎng)景中,機(jī)器正逐步進(jìn)化為能夠?qū)崟r(shí)觀察、感知并作出決策的協(xié)作伙伴。 ? 為加速這一變革,NVIDIA 今日推出
    的頭像 發(fā)表于 10-29 10:31 ?1419次閱讀
    <b class='flag-5'>NVIDIA</b> IGX Thor 機(jī)器人處理器<b class='flag-5'>將</b>實(shí)時(shí)物理 AI <b class='flag-5'>引入</b>工業(yè)和醫(yī)療邊緣場(chǎng)景

    NVIDIA RAPIDS 25.06版本新增多項(xiàng)功能

    RAPIDS 是一套面向 Python 數(shù)據(jù)科學(xué)的 NVIDIA CUDA-X 庫(kù),最新發(fā)布的 25.06 版本引入了多項(xiàng)亮眼新功能,其中包括 Polars GPU 流執(zhí)行引擎——這是一種面向圖
    的頭像 發(fā)表于 09-09 09:54 ?1295次閱讀

    NVIDIA RTX AI加速FLUX.1 Kontext現(xiàn)已開放下載

    NVIDIA RTX 與 NVIDIA TensorRT 現(xiàn)已加速 Black Forest Labs 的最新圖像生成和編輯模型;此外,Gemma 3n 現(xiàn)可借助 RTX 和 NVIDIA
    的頭像 發(fā)表于 07-16 09:16 ?2217次閱讀

    NVIDIA攜手諾和諾德借助AI加速藥物研發(fā)

    NVIDIA 宣布與諾和諾德開展合作,借助創(chuàng)新 AI 應(yīng)用加速藥物研發(fā)。此次合作也支持諾和諾德與丹麥 AI 創(chuàng)新中心 (DCAI) 關(guān)于使用 Gefion AI 超級(jí)計(jì)算機(jī)的協(xié)議落地
    的頭像 發(fā)表于 06-12 15:49 ?1520次閱讀

    借助NVIDIA技術(shù)加速半導(dǎo)體芯片制造

    NVIDIA Blackwell GPU、NVIDIA Grace CPU、高速 NVIDIA NVLink 網(wǎng)絡(luò)架構(gòu)和交換機(jī),以及諸如 NVIDIA cuDSS 和
    的頭像 發(fā)表于 05-27 13:59 ?1301次閱讀
    聂拉木县| 灵石县| 分宜县| 双鸭山市| 靖远县| 焦作市| 扎兰屯市| 胶州市| 宿迁市| 正阳县| 平潭县| 罗城| 遂溪县| 昌邑市| 奉化市| 垦利县| 乐陵市| 金川县| 株洲市| 盱眙县| 当涂县| 乌鲁木齐县| 仁怀市| 印江| 淮安市| 海口市| 遂川县| 镇沅| 新密市| 精河县| 新蔡县| 腾冲县| 沧州市| 鹤山市| 北海市| 宜黄县| 高邑县| 南华县| 南康市| 萨嘎县| 安国市|