日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA RAPIDS加速器v21.08的功能應用

星星科技指導員 ? 來源:NVIDIA ? 作者:Eric Rife ? 2022-04-20 14:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

介紹

用于Apache Spark 的 RAPIDS 加速器 8 月版( 21.08 )現(xiàn)已發(fā)布。自 NVIDIA GTC 2020 首次發(fā)布以來,已經(jīng)有很長時間了。我們在許多方面都有所改進,特別是在易用性方面, Apache Spark 應用程序的代碼更改很少甚至沒有。去年,該團隊一直專注于添加功能和持續(xù)改進性能。為了證明這一點,我們使用 NVIDIA 數(shù)據(jù)科學( NDS )基準測試了定期測量在 3000 ( 3 TB 未壓縮)的比例因子下的性能和功能。在此版本中,除了添加新功能外,我們非常自豪地在提高所有通過查詢的端到端速度和降低 NVIDIA EGX 服務器的總體擁有成本方面取得了進展。

基準更新

NVIDIA 決策支持( NDS )是我們對 Apache Spark 社區(qū)常用的行業(yè)標準數(shù)據(jù)科學基準的改編。 NDS 包含與行業(yè)標準基準測試 TPC-DS 相同的 105 個 SQL 查詢,但修改了數(shù)據(jù)集生成和執(zhí)行腳本的部分。在 GTC 2021 更新中,有 95 個查詢通過。在 21.08 版本中,通過核心外分組方式、窗口排名和密集排名等新功能,我們已經(jīng)能夠在 GPU 上運行所有 105 個查詢。

基準設置

比例因子 -3K (帶浮點數(shù)的 3TB 數(shù)據(jù)集)

Systems: 4x NVIDIA 認證 EGX 服務器

EGX 服務器硬件規(guī)格: 4-node Dell R740xd, each with (2) 24-core CPUs, 512GB RAM, HDFS on NVMe, (1) CX-6 Dx 25/100Gb NIC, 2x NVIDIA A30 GPU

CPU 硬件規(guī)格: 4-node dell r740xd , each with ( 2 ) 24-core CPU s , 512GB ram , hdfs on nvme ,( 1 ) cx-6 dx 25 / 100gb nic

軟件: RAPIDS 加速器 v21.08.0 、 cuDF 21.08.0 、 Apache Spark 3.1.1 、 UCX 1.10.1

pYYBAGJfrzaARpzXAAChsgig6dI213.png

圖 1 : EGX 服務器上的 NDS 查詢速度: GPU vs CPU 。

基于此版本,我們很高興地向大家展示,所有 105 個查詢現(xiàn)在都可以在 GPU 上運行,而無需任何代碼更改。

用于這些基準測試的基準服務器對于四臺沒有 GPU s 的服務器的成本略低于 170000 美元,而在每臺服務器中包含一臺 NVIDIA A100 GPU 的成本則低于 220000 美元。

簡單來說,基準 GPU 服務器的成本是 CPU 服務器的 1.29 倍。

如上圖所示(圖 1 ),超過 95 個查詢現(xiàn)在比 GPU 快 1.29 倍,因此運行起來更便宜。

GPU 上一些速度較慢的查詢目前正在解決中,我們正在不懈地努力改進這些查詢并提高總體速度。

用戶可以很容易地推斷出 GPU 的加速從 1x 到 18x 不等,因此建議用戶確認 GPU 的正確用例。

如果用戶不確定 GPU 的正確用例,鑒定工具將是一個方便的資產(chǎn)。有關鑒定工具的更多信息,請參閱以下章節(jié)。

分析和鑒定工具

分析與鑒定工具于 21.06 發(fā)布,獲得了用戶社區(qū)的積極反饋以及對新功能的要求。在 21.08 中,鑒定工具現(xiàn)在能夠處理 Apache Spark 2.x 版本生成的事件日志。該工具還將支持 AWS EMR 6.3.0 、 Google Dataproc 2. 0 、 Microsoft Azure Synapse 以及 DataRicks 7.3 和 8.2 運行時生成的事件日志。鑒定工具不再需要 Spark 運行時。用戶現(xiàn)在只需在機器上使用 Apache Spark 3.x JAR 即可使用鑒定工具。最新版本還具有選擇事件日志的新過濾功能。該工具還查找插件不支持的讀取數(shù)據(jù)格式和類型,并從分數(shù)中刪除這些格式和類型(基于 SQL Dataframe 操作中的總?cè)蝿諘r間)。輸出將以簡潔的格式報告在終端上,對每個已處理事件日志的詳細分析將存儲為 csv 輸出。

新功能

此版本為數(shù)組和結(jié)構(gòu)添加了更多功能。我們現(xiàn)在可以對多層結(jié)構(gòu)數(shù)據(jù)類型進行聯(lián)合,也可以以拼花格式編寫數(shù)組數(shù)據(jù)類型。我們在現(xiàn)有的超前、滯后和行號功能中添加了秩和密集秩窗口功能。有了這一新增功能, RAPIDS 加速器現(xiàn)在可以支持 SQL 中最常用的窗口運算符。對于時間戳操作符,我們添加了對遺留時間戳的支持。使用此功能,用戶可以讀取 Spark 2.0 中支持的傳統(tǒng)時間戳格式。對于 Databricks 用戶,我們添加了在 GPU 中緩存數(shù)據(jù)的功能(所有其他平臺都支持這種功能)。

我們通過處理 GPU 內(nèi)存溢出的數(shù)據(jù)集以進行分組和窗口操作,繼續(xù)改善用戶體驗。這一改進將節(jié)省用戶創(chuàng)建分區(qū)的時間,以避免 GPU 上出現(xiàn)內(nèi)存不足錯誤。類似地, UCX 1.11 的采用改進了 RAPIDS Spark 加速洗牌管理器的錯誤處理。

關于作者

Eric Rife 是 NVDIA 數(shù)據(jù)科學公司的技術營銷經(jīng)理。他是一名高級專業(yè)人員,擁有 25 年的管理和工程經(jīng)驗,設計和管理全天候關鍵任務企業(yè)系統(tǒng),包括 Unix / Linux / Windows 服務器、應用程序服務器和多 PB 存儲解決方案。他目前領導 NVIDIA 的工作,幫助基礎設施經(jīng)理和數(shù)據(jù)科學家重新思考如何加快 AI 在企業(yè)業(yè)務應用中的應用。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 服務器
    +關注

    關注

    14

    文章

    10371

    瀏覽量

    91768
  • WINDOWS
    +關注

    關注

    4

    文章

    3707

    瀏覽量

    94338
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何使用 powerquad 加速器中的一些功能以及 CMSIS 原始實現(xiàn)中的一些功能?

    )。 如何使用 powerquad 加速器中的一些功能以及 CMSIS 原始實現(xiàn)中的一些功能。 Example: I do not want to call arm_mat_trans_q15 powerquad
    發(fā)表于 04-03 06:37

    羅氏中國加速器科研坊正式啟動

    "羅氏中國加速器科研坊"在上海舉辦,首批來自三甲醫(yī)院的二十多位臨床科研人員,參加了為期五天的腫瘤臨床開發(fā)訓練營。
    的頭像 發(fā)表于 03-28 09:55 ?364次閱讀

    AMD Alveo MA35D加速器:開啟大規(guī)模交互式流媒體新時代

    AMD Alveo MA35D加速器:開啟大規(guī)模交互式流媒體新時代 在當今全球視頻市場被直播主導的背景下,低延遲應用不斷涌現(xiàn),對基礎設施和視頻處理技術的成本結(jié)構(gòu)及部署策略產(chǎn)生了深遠影響。AMD推出
    的頭像 發(fā)表于 12-15 14:35 ?589次閱讀

    工業(yè)級-專業(yè)液晶圖形顯示加速器RA8889ML3N簡介+顯示方案選型參考表

    本帖最后由 MTCN2013 于 2025-11-17 15:23 編輯 專業(yè)液晶圖形顯示加速器能夠有效減少對MCU運算資源的占用,對于只需普通單片機運算資源的儀器儀表來說,專業(yè)圖形顯示加速器
    發(fā)表于 11-14 16:03

    邊緣計算中的AI加速器類型與應用

    人工智能正在推動對更快速、更智能、更高效計算的需求。然而,隨著每秒產(chǎn)生海量數(shù)據(jù),將所有數(shù)據(jù)發(fā)送至云端處理已變得不切實際。這正是邊緣計算中AI加速器變得不可或缺的原因。這種專用硬件能夠直接在邊緣設備上
    的頭像 發(fā)表于 11-06 13:42 ?1030次閱讀
    邊緣計算中的AI<b class='flag-5'>加速器</b>類型與應用

    亞馬遜云科技第三期創(chuàng)業(yè)加速器圓滿收官 助力初創(chuàng)釋放Agentic AI潛力 加速全球化進程

    北京——2025年10月28日 ,亞馬遜云科技第三期創(chuàng)業(yè)加速器項目圓滿收官。35家入營企業(yè)齊聚一堂,分享了各自的業(yè)務發(fā)展情況,以及參與本期加速器的收獲及體驗。第三期創(chuàng)業(yè)加速器持續(xù)聚焦AI,特別是前沿
    的頭像 發(fā)表于 10-29 15:18 ?1079次閱讀

    航裕電源以大電流技術為國內(nèi)外超導加速器項目提供優(yōu)質(zhì)方案

    航裕電源:以大電流技術,護航尖端科技 大科學裝置建設熱潮中,超導加速器作為探索微觀世界、推動前沿科研的 “國之重”,對供電系統(tǒng)的穩(wěn)定性、精度及功率提出極致要求。航裕電源以31.5kA、80kA萬安
    的頭像 發(fā)表于 10-12 15:02 ?1779次閱讀

    NVIDIA RAPIDS 25.06版本新增多項功能

    RAPIDS 是一套面向 Python 數(shù)據(jù)科學的 NVIDIA CUDA-X 庫,最新發(fā)布的 25.06 版本引入了多項亮眼新功能,其中包括 Polars GPU 流執(zhí)行引擎——這是一種面向圖
    的頭像 發(fā)表于 09-09 09:54 ?1291次閱讀

    英特爾Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持

    英特爾? Gaudi 2EAI加速器現(xiàn)已為DeepSeek-V3.1提供深度優(yōu)化支持。憑借出色的性能和成本效益,英特爾Gaudi 2E以更低的投入、更高的效率,實現(xiàn)從模型訓練的深度突破到推理部署的實時響應,為大模型的加速落地提供
    的頭像 發(fā)表于 08-26 19:18 ?3356次閱讀
    英特爾Gaudi 2E AI<b class='flag-5'>加速器</b>為DeepSeek-<b class='flag-5'>V</b>3.1提供<b class='flag-5'>加速</b>支持

    創(chuàng)客總部加入MathWorks加速器計劃

    全球領先的數(shù)學計算軟件開發(fā)商 MathWorks 日前宣布,創(chuàng)客總部已加入 MathWorks 加速器計劃。作為中關村科創(chuàng)孵化,創(chuàng)客總部致力于為人工智能創(chuàng)業(yè)企業(yè)、高校院所技術精英搭建推動與實體經(jīng)濟
    的頭像 發(fā)表于 08-22 10:00 ?1376次閱讀

    Andes晶心科技推出新一代深度學習加速器

    高效能、低功耗 32/64 位 RISC-V 處理核與 AI 加速解決方案的領導供貨商—Andes晶心科技(Andes Technology)今日正式發(fā)表最新深度學習加速器 Ande
    的頭像 發(fā)表于 08-20 17:43 ?3144次閱讀

    Microchip推出Adaptec? SmartRAID 4300 系列加速器 提供安全的可擴展 NVMe? RAID 存儲解決方案

    Technology Inc.(微芯科技公司)推出 Adaptec ? ?SmartRAID 4300 系列 NVMe? RAID 存儲加速器。這是一款功能豐富又安全的支持RAID的高性能軟件定義存儲(SDS)解決方案
    的頭像 發(fā)表于 08-06 16:31 ?1.9w次閱讀
    Microchip推出Adaptec? SmartRAID 4300 系列<b class='flag-5'>加速器</b> 提供安全的可擴展 NVMe? RAID 存儲解決方案

    高壓放大器在粒子加速器研究中的應用

    粒子加速器是現(xiàn)代科學研究中不可或缺的大型實驗裝置,廣泛應用于物理學、化學、材料科學、生物學等多個領域。其核心原理是利用電場和磁場對帶電粒子進行加速和約束,使粒子達到極高的能量,從而為研究微觀世界
    的頭像 發(fā)表于 06-19 17:09 ?720次閱讀
    高壓放大器在粒子<b class='flag-5'>加速器</b>研究中的應用

    粒子加速器?——?科技前沿的核心裝置

    粒子加速器全稱“荷電粒子加速器”,是一種利用電磁場在高真空環(huán)境中對帶電粒子(如電子、質(zhì)子、離子)進行加速和控制,使其獲得高能量的特種裝置。粒子加速器技術現(xiàn)已發(fā)展成為集高能物理、核物理、
    的頭像 發(fā)表于 06-19 12:05 ?4189次閱讀
    粒子<b class='flag-5'>加速器</b>?——?科技前沿的核心裝置

    基于雙向塊浮點量化的大語言模型高效加速器設計

    本文提出雙向塊浮點(BBFP)量化格式及基于其的LLMs加速器BBAL,通過雙向移位與重疊位設計顯著降低量化誤差,提升非線性計算效率,實現(xiàn)精度、吞吐量和能效的顯著優(yōu)化,相關成果被國際頂級會議 DAC 2025 接收。
    的頭像 發(fā)表于 05-14 13:40 ?2533次閱讀
    基于雙向塊浮點量化的大語言模型高效<b class='flag-5'>加速器</b>設計
    伊宁县| 大兴区| 磐石市| 瑞丽市| 拉萨市| 威信县| 舞阳县| 连云港市| 安福县| 林口县| 桑植县| 洛隆县| 肇庆市| 镇巴县| 达拉特旗| 崇阳县| 潞西市| 临城县| 杭锦后旗| 老河口市| 尖扎县| 深水埗区| 邵东县| 丁青县| 米脂县| 永德县| 合川市| 石首市| 彭泽县| 富顺县| 登封市| 乌拉特后旗| 南溪县| 连江县| 衡阳市| 安图县| 台南县| 永丰县| 晴隆县| 万荣县| 建宁县|