日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用NVIDIA DGX cuQuantum設備實現(xiàn)超級計算規(guī)模的量子電路仿真

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-10-12 09:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

量子電路模擬對于開發(fā)量子計算機的應用程序和算法至關重要。由于已知量子計算算法和用例的破壞性,政府、企業(yè)和學術界的量子算法研究人員正在開發(fā)新的量子算法,并在更大的量子系統(tǒng)上進行基準測試。

在沒有大規(guī)模糾錯量子計算機的情況下,開發(fā)這些算法的最佳方法是通過量子電路模擬。量子電路模擬需要大量計算, GPU 是計算量子態(tài)的天然工具。 為了模擬更大的量子系統(tǒng),有必要將計算分布在多個 GPU 和多個節(jié)點上,以充分利用超級計算機的計算能力。

NVIDIA cuQuantum 是一個軟件開發(fā)工具包( SDK ),使用戶可以使用 GPU 輕松加速和縮放量子電路模擬,為探索量子優(yōu)勢提供了新的能力。

此 SDK 包括最近發(fā)布的 NVIDIA DGX cuQuantum Appliance ,這是一個支持部署的軟件容器,具有多 GPU 狀態(tài)向量模擬支持。通用多 GPU API 現(xiàn)在也可在 cuStateVec 中使用,以便輕松集成到任何模擬器中。對于張量網(wǎng)絡模擬, cuQuantum cuTensorNet library 提供的切片 API 可實現(xiàn)分布在多個 GPU 或多個節(jié)點上的加速張量網(wǎng)絡收縮。這使得用戶可以利用 DGX A100 系統(tǒng)的近線性強伸縮性。

NVIDIA cuQuantum SDK 具有狀態(tài)向量和張量網(wǎng)絡方法庫。這篇文章主要關注用于多節(jié)點狀態(tài)向量模擬的 cuStateVec 和 DGX cuQuantum 設備 。如果您有興趣了解更多關于 cuTensorNet 和張量網(wǎng)絡方法的信息,請參見 使用 NVIDIA cuTensorNet 擴大 Quantum Circuit Simulation 。

什么是多節(jié)點、多 GPU 狀態(tài)矢量仿真

節(jié)點是由緊密互連的處理器組成的單個封裝單元,這些處理器經(jīng)過優(yōu)化,可以在保持機架就緒外形的同時協(xié)同工作。多節(jié)點多 GPU 狀態(tài)向量模擬利用了一個節(jié)點內的多個 GPU 和 GPU 的多個節(jié)點,以提供比其他方式更快的解決時間和更大的問題規(guī)模。

DGX 使用戶能夠利用高內存、低延遲和高帶寬。 DGX H100 system 由八個 H100 張量芯 GPU 組成,利用了 第四代 NVLink 和第三代 NVSwitch 。該節(jié)點是量子電路模擬的發(fā)電站。

在 DGX A100 節(jié)點上運行,所有八個 GPU 上都有啟用 NVIDIA 多 GPU 的 DGX cuQuantum Appliance ,對于三種常見的量子計算算法:量子傅里葉變換、肖氏算法和 Sycamore Supremacy 電路,在雙 64 核 AMD EPYC 7742 處理器上的速度提高了 70 到 290 倍。這使得用戶能夠使用單個 DGX A100 節(jié)點(八個 GPU ),通過全狀態(tài)矢量方法模擬多達 36 個量子比特。圖 1 所示的結果比我們上次宣布此功能的基準測試高出 4.4 倍,這是因為我們的團隊已經(jīng)實現(xiàn)了只使用軟件的增強。

poYBAGNGF9CAWQAlAACj7-etYr8358.png

圖 1.DGX cuQuantum Appliance 多 GPU 加速超過最先進的雙插槽 CPU 服務器

NVIDIA cuStateVec 團隊深入研究了除單個節(jié)點內的多個 GPU 之外,利用多個節(jié)點的性能方法。因為大多數(shù)門應用程序都是完全并行的操作,所以節(jié)點內和跨節(jié)點的 GPU 可以被編排以進行分而治之。

在模擬過程中,狀態(tài)向量被分割并分布在 GPU 之間,每個 GPU 可以對其狀態(tài)向量的一部分并行應用一個門。在許多情況下,這可以在本地處理;然而,高階量子比特的門應用需要分布式狀態(tài)向量之間的通信。

一種典型的方法是首先對量子比特重新排序,然后在每個 GPU 中應用門,而不訪問其他 GPU 或節(jié)點。這種重新排序本身需要設備之間的數(shù)據(jù)傳輸。為了有效地做到這一點,高互連帶寬變得極其重要。在多個節(jié)點上有效地利用這種并行性是非常重要的。

介紹多節(jié)點 DGX cuQuantum Appliance

這里給出了基于性能和任意尺度狀態(tài)矢量的量子電路模擬的答案。 NVIDIA 很高興宣布新 DGX cuQuantum Appliance 提供的多節(jié)點、多 GPU 功能。在我們的下一版本中,任何 cuQuantum 容器用戶都將能夠快速、輕松地利用 IBM Qiskit 前端在世界上最大的 NVIDIA 系統(tǒng)上模擬量子電路。

cuQuantum 的任務是使盡可能多的用戶能夠輕松加速和縮放量子電路模擬。為此, cuQuantum 團隊正在努力將 NVIDIA 多節(jié)點方法生產(chǎn)成 API ,該 API 將于明年初正式上市。通過這種方法,您將能夠利用更廣泛的基于 NVIDIA GPU 的系統(tǒng)來擴展狀態(tài)向量量子電路模擬。

NVIDIA 多節(jié)點 DGX cuQuantum 設備正處于開發(fā)的最后階段,您很快就能利用 NVIDIA DGX SuperPOD 系統(tǒng) 的最佳性能。這將作為 NGC 托管的容器映像提供,您可以在 Docker 和幾行代碼的幫助下快速部署。

NVIDIA DGX H100 擁有所有 DGX 系統(tǒng)中最快的 I / O 架構,是大型 AI 群集(如 NVIDIA -DGX SuperPOD )的基礎構建塊,是可擴展 AI 的企業(yè)藍圖,現(xiàn)在是量子電路仿真基礎設施。 DGX H100 中的八臺 NVIDIA H100 GPU 使用新的高性能第四代 NVLink 技術,通過四臺第三代 NVSwitch 進行互連。

第四代 NVLink 技術提供了上一代 1.5 倍的通信帶寬,比 PCIe Gen5 快 7 倍。它提供了高達 7.2 TB / s 的 GPU 總吞吐量至 – GPU ,比上一代 DGX A100 提高了近 1.5 倍。

DGX H100 系統(tǒng)與隨附的八個 NVIDIA ConnectX-7 InfiniBand / Ethernet 適配器(每個適配器都以 400 GB / s 的速度運行)一起,提供了強大的高速結構,可在分布于多個節(jié)點的狀態(tài)矢量之間的全局通信中節(jié)省開銷。多節(jié)點、多 GPU cuQuantum 與大規(guī)模 GPU 加速計算相結合,利用最先進的網(wǎng)絡硬件和軟件優(yōu)化,這意味著 DGX H100 系統(tǒng)可以擴展到數(shù)百或數(shù)千個節(jié)點,以應對最大的挑戰(zhàn),例如將全狀態(tài)矢量量子電路模擬擴展到 50 個量子比特以上。

為了對這項工作進行基準測試,多節(jié)點 DGX cuQuantum Appliance 運行在 NVIDIA Selene Supercomputer 上,這是 NVIDIA DGX SuperPOD 系統(tǒng)的參考體系結構。截至 2022 年 6 月, Selene 在超級計算系統(tǒng) TOP500 榜單中排名第八 ,以 63.5 petaflops 的速度執(zhí)行高性能 Linpack ( HPL )基準測試,并以 24.0 giaflops /瓦特的速度在 Green500 名單上排名第 22 。

NVIDIA 利用多節(jié)點 DGX cuQuantum Appliance 運行基準測試: Quantum Volume 、 Quantum 近似優(yōu)化算法( QAOA )和 Quantum 相位估計。量子體積電路的深度為 10 和 30 。 QAOA 是一種常用算法,用于解決相對而言近期量子計算機上的組合優(yōu)化問題。我們用兩個參數(shù)運行它。

在前面的算法中演示了弱標度和強標度。很明顯,擴展到像 NVIDIA DGX SuperPOD 這樣的超級計算機對于加快解決時間和擴展相空間研究人員可以利用狀態(tài)矢量量子電路模擬技術探索的相空間都很有價值。

pYYBAGNGF9GANn1sAACWZzl6YCo818.png

圖 2.DGX cuQuantum Appliance 多節(jié)點弱擴展性能,從 32 到 40 量子比特

我們正在通過更新的 DGX cuQuantum Appliance 進一步幫助用戶實現(xiàn)規(guī)模化。通過引入多節(jié)點功能,我們允許用戶在一個 GPU 上移動 32 個量子比特,在一個 NVIDIA 安培架構節(jié)點上移動 36 個量子比特。我們用 32 個 DGX A100 節(jié)點模擬了總共 40 個量子比特。用戶現(xiàn)在可以根據(jù)系統(tǒng)配置進一步擴展,軟件限制為 56 量子位或數(shù)百萬 DGX A100 節(jié)點。我們在 NVIDIA Hopper GPU 上的其他初步測試表明,這些數(shù)字在我們的下一代架構上會更好。

我們還衡量了我們多節(jié)點能力的強大擴展性。為了簡單起見,我們專注于 Quantum Volume 。圖 3 描述了當我們多次改變 GPU 的數(shù)量來解決同一問題時的性能。與最先進的雙插槽服務器 CPU 相比,在利用 16 個 DGX A100 節(jié)點時,我們獲得了 320 到 340 倍的加速。這也比以前最先進的量子體積實現(xiàn)快 3.5 倍(對于只有兩個 DGX A100 節(jié)點的 36 個量子比特,深度= 10 )。當添加更多節(jié)點時,這種加速會變得更加顯著。

poYBAGNGF9KAP2p8AACUG0A4Wqs215.png

圖 3.與最先進的 CPU 服務器相比, DGX cuQuantum Appliance 多節(jié)點加速 32 qubit Quantum Volume

在最大的 NVIDIA 系統(tǒng)上模擬和縮放量子電路

NVIDIA 的 cuQuantum 團隊正在將狀態(tài)向量模擬擴展到多節(jié)點、多 GPU 。這使得終端用戶能夠對比以往任何時候都大的全狀態(tài)矢量進行量子電路模擬。 cuQuantum 不僅支持擴展,還支持性能,顯示節(jié)點之間的擴展能力較弱,擴展能力較強。

此外, cuQuantum 推出了第一個由 cuQuantom 支持的 IBM Qiskit 映像。在我們的下一個版本中,您將能夠拉動這個容器,從而使用這個流行的框架更容易、更快地擴展量子電路模擬。

關于作者

Tom Lubowe 是 NVIDIA 的量子計算產(chǎn)品經(jīng)理。 Tom 擅長理解用戶需求,并將其與技術能力相協(xié)調。在加入之前,他曾在 Xanadu 、 Rigetti 等量子計算硬件初創(chuàng)公司和其他量子機器學習軟件初創(chuàng)公司擔任業(yè)務開發(fā)和產(chǎn)品管理職務。在致力于將量子計算帶給用戶之前,他曾在 SEI Investments 從事 FinTech 產(chǎn)品方面的工作。

Takuma Yamaguchi 是 NVIDIA 的 CUDA 數(shù)學庫小組的高級軟件工程師,在那里他致力于 cuStateVec 中量子算法的優(yōu)化。他擁有東京大學土木工程博士學位。

Shinya Morino 是NVIDIA 高級解決方案架構師,隸屬于NVIDIA 人工智能技術中心( NVAITC )。他已經(jīng)在 NVAITC 中原型化了一個 GPU 加速狀態(tài)向量模擬器,并正在利用他的知識推動 cuStateVec 的開發(fā)。新亞擁有日本東京大學的工程學博士學位。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5711

    瀏覽量

    110181
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5302

    瀏覽量

    136151
  • 服務器
    +關注

    關注

    14

    文章

    10402

    瀏覽量

    91805
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA DGX Spark助力高等教育領域重大項目

    在全球各地的頂尖高校,NVIDIA DGX Spark 桌面超級計算機正將數(shù)據(jù)中心級的 AI 能力帶到實驗室臺前、教師辦公室里和學生的終端設備
    的頭像 發(fā)表于 03-09 16:33 ?737次閱讀

    NVIDIA DGX Spark桌面級AI超級計算機助力開發(fā)者構建AI模型

    開源 AI 正在加速各行各業(yè)的創(chuàng)新,NVIDIA DGX Spark 將幫助開發(fā)者將創(chuàng)新轉化為影響力。
    的頭像 發(fā)表于 01-09 09:49 ?797次閱讀

    NVIDIA NVQLink技術被全球十余家超級計算中心廣泛采用

    NVIDIA NVQLink 被全球十余家超級計算中心廣泛采用,與多家實驗室及量子制造商共同推動量子計算
    的頭像 發(fā)表于 11-25 11:10 ?1094次閱讀

    NVIDIA在ISC 2025分享最新超級計算進展

    NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代網(wǎng)絡和量子技術實現(xiàn)了飛躍。在 SC25 上展示
    的頭像 發(fā)表于 11-25 10:59 ?1149次閱讀
    <b class='flag-5'>NVIDIA</b>在ISC 2025分享最新<b class='flag-5'>超級</b><b class='flag-5'>計算</b>進展

    NVIDIA DGX Spark助力構建自己的AI模型

    作為個人 AI 超級計算機,為世界各地的 AI 研究人員、數(shù)據(jù)科學家和學生提供 NVIDIA Grace Blackwell 平臺的強大功能。
    的頭像 發(fā)表于 11-21 09:25 ?1645次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> Spark助力構建自己的AI模型

    NVIDIA DGX Spark快速入門指南

    NVIDIA DGX Spark 已正式向 AI 開發(fā)者交付,對于剛入手的全新 DGX Spark,該如何進行初始化設置?本篇文章將引導您完成 DGX Spark 首次設置。在初始設置
    的頭像 發(fā)表于 11-17 14:11 ?7298次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> Spark快速入門指南

    IQM與NVIDIA攜手開展NVQLink合作,推動可擴展量子糾錯技術發(fā)展

    全球超導量子計算領域的領軍企業(yè)IQM Quantum Computers今日宣布,將在其量子計算機中集成NVIDIA的NVQLink技術,以
    的頭像 發(fā)表于 10-31 10:30 ?550次閱讀

    NVIDIA黃仁勛向SpaceX馬斯克交付DGX Spark

    革新于星艦基地開始。NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛親手將全球迄今為止最小的 AI 超級計算NVIDIA DGX Spark 交付
    的頭像 發(fā)表于 10-21 11:12 ?1192次閱讀

    NVIDIA DGX Spark新一代AI超級計算機正式交付

    NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛在 SpaceX 向埃隆·馬斯克交付 DGX Spark。
    的頭像 發(fā)表于 10-21 10:41 ?1588次閱讀

    MediaTek攜手NVIDIA開啟個人AI算力新紀元

    即將上市的 NVIDIA DGX Spark 個人 AI 超級計算機,搭載 MediaTek 與 NVIDIA 合作設計的 GB10 Gra
    的頭像 發(fā)表于 10-16 11:26 ?999次閱讀

    NVIDIA DGX Spark桌面AI計算機開啟預訂

    DGX Spark 現(xiàn)已開啟預訂!麗臺科技作為 NVIDIA 授權分銷商,提供從產(chǎn)品到服務的一站式解決方案,助力輕松部署桌面 AI 計算機。
    的頭像 發(fā)表于 09-23 17:20 ?1611次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> Spark桌面AI<b class='flag-5'>計算</b>機開啟預訂

    KiCad電路仿真簡易教程

    “ ?KiCad作為一款功能強大的開源EDA軟件,不僅能進行原理圖設計和PCB布局,還集成了強大的電路仿真功能。通過其內置的? ngspice? 仿真引擎,工程師可以在設計早期驗證電路的功能和性能
    的頭像 發(fā)表于 09-09 11:19 ?1.4w次閱讀
    KiCad<b class='flag-5'>電路仿真</b>簡易教程

    九進制計數(shù)電路仿真設計

    九進制計數(shù)電路仿真
    發(fā)表于 06-09 14:48 ?0次下載

    NVIDIA助力全球最大量子研究超級計算

    NVIDIA 宣布將開設量子-AI 技術商業(yè)應用全球研發(fā)中心(G-QuAT),該中心部署了全球最大量子計算研究專用超級
    的頭像 發(fā)表于 05-22 09:44 ?1139次閱讀

    NVIDIA發(fā)布AI優(yōu)先DGX個人計算系統(tǒng)

    NVIDIA 宣布,多家行業(yè)領先系統(tǒng)制造商將打造 NVIDIA DGX Spark。
    的頭像 發(fā)表于 05-22 09:39 ?1305次閱讀
    从江县| 巢湖市| 会东县| 靖西县| 华亭县| 谢通门县| 宁河县| 盘锦市| 广饶县| 政和县| 社旗县| 佳木斯市| 寻甸| 达州市| 永吉县| 靖州| 德庆县| 安新县| 英山县| 精河县| 周口市| 琼结县| 新竹市| 泗水县| 中卫市| 庄河市| 临沧市| 西藏| 潞西市| 盖州市| 奈曼旗| 淮阳县| 平原县| 黄浦区| 达日县| 五台县| 西和县| 宾阳县| 交口县| 安塞县| 平乡县|