日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

OrionX AI芯片計算資源池化技術

智能計算芯世界 ? 來源:智能計算芯世界 ? 2023-07-10 14:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作為 AI 市場中的重要組成,以 GPU、FPGA 等為主的 AI 加速器市場發(fā)展也隨之水漲船高。GPU 資源池化技術從初期的簡單虛擬化,到資源池化,經歷了四個技術演進階段。

?簡單虛擬化。將物理 GPU 按照 2 的 N 次方,切分成多個固定大小的 vGPU(Virtual GPU,虛擬 GPU),每個 vGPU 的算力和顯存相等。實踐證明,不同的 AI 模型對于算力、顯存資源的需求是不同的。所以,這樣的切分方式,并不能滿足 AI 模型多樣化的需求。

?任意虛擬化。將物理 GPU 按照算力和顯存兩個維度,自定義切分,獲得滿足 AI 應用個性化需求的 vGPU。

?遠程調用。AI 應用與物理 GPU 服務器分離部署,允許通過高性能網(wǎng)絡遠程調用 GPU資源。這樣可以實現(xiàn) AI 應用與物理 GPU 資源剝離,AI 應用可以部署在私有云的任意位置,只需要網(wǎng)絡可達,即可調用 GPU 資源。

?資源池化。形成 GPU 資源池后,需要統(tǒng)一的管理面來實現(xiàn)管理、監(jiān)控、資源調度和資源回收等功能。同時,也需要提供北向 API,與數(shù)據(jù)中心級的資源調度平臺對接,讓用戶在單一界面,就可以調度包括 vGPU 在內的數(shù)據(jù)中心內的各類資源。

OrionX 通過軟件定義 AI 算力,顛覆了原有的 AI 應用直接調用物理 GPU 的架構,增加軟件層,將 AI 應用與物理 GPU 解耦合。AI 應用調用邏輯的 vGPU,再由 OrionX 將 vGPU需求匹配到具體的物理 GPU。OrionX 架構實現(xiàn)了 GPU 資源池化,讓用戶高效、智能、靈活地使用 GPU 資源,達到了降本增效的目的。

b492344e-1ec8-11ee-962d-dac502259ad0.png

一個典型的 OrionX GPU 資源池的邏輯架構中包含了 OrionX Controller(OC)、OrionX Server Service(OSS)、OrionX Client Runtime(OCRT)、和 OrionX GUI(OG)等功能組件。

OrionX 的各功能組件可以根據(jù)用戶環(huán)境需求被部署在單服務器上,也可以被分布式地部署在數(shù)據(jù)中心的多個物理機、虛擬機或者容器環(huán)境中。在分布式的部署環(huán)境中,各功能組件可以通過多種類型的網(wǎng)絡建立連接,從而把數(shù)據(jù)中心的 GPU 資源管理起來,形成一種可以被全局共享的計算資源,對 AI 應用提供可遠程訪問的、可靈活切分的、可聚合的彈性 GPU算力。OrionX 的邏輯架構如下圖所示。

b4ec7800-1ec8-11ee-962d-dac502259ad0.png

CUDA是由 Nvidia 公司定義且公開推廣、維護的一種 GPU 編程接口。從 2007 年推出之后,經過十幾年生態(tài)培育,已經成為 GPU 編程的一個事實標準。大部分流行的 AI 框架,例如 TensorFlow、PyTorch、MXNet 和 PaddlePaddle都是基于 CUDA 編程接口開發(fā)。

OrionX 在管理物理 GPU 之后,通過模擬 CUDA 標準接口,為各種 AI 應用提供一個與 Nvidia CUDA SDK 接口功能一致的運行環(huán)境,從而使得 AI 應用透明無感知地運行在 OrionX GPU資源池之上。OrionX 不僅在單服務器上模擬了 CUDA 標準接口,并且通過分布式部署各功能組件,能夠提供分布式的 CUDA 運行環(huán)境。

OrionX 的各個功能組件通過管理平面網(wǎng)絡和數(shù)據(jù)平面網(wǎng)絡進行通信,共同完成 GPU 資源池的管理以及 GPU 資源的調度等功能。

在部署 OrionX 時,使用基于 TCP/IP 網(wǎng)絡的管理平面,來承載整個系統(tǒng)的管理工作。通過管理網(wǎng)絡,分布在各個節(jié)點的功能組件都保持和 OrionX Controller 同步。管理平面邏輯結構如下圖所示。

b51a473a-1ec8-11ee-962d-dac502259ad0.png

在應用運行的過程中,應用所在環(huán)境和 GPU 物理節(jié)點之間的數(shù)據(jù)傳輸使用的是 OrionX 的數(shù)據(jù)面。該數(shù)據(jù)面支持多種后端數(shù)據(jù)傳輸載體,包括 TCP/IP 以太網(wǎng)絡、RoCE RDMA、Infiniband RDMA、Share Memory 等。具備高帶寬、低延遲。同時支持多種傳輸協(xié)議,根據(jù)優(yōu)先級自動使用高性能的傳輸方式。支持虛擬機、容器和宿主機之間的 TCP/IP 網(wǎng)絡隔離。

b5432fb0-1ec8-11ee-962d-dac502259ad0.png

OrionX 的各個組件,支持直接部署在裸金屬服務器上,即安裝操作系統(tǒng)后,直接以 Binary形式部署,也支持容器化部署。OrionX 具備適配多種 Linux 操作系統(tǒng)和云平臺的能力,因此,OrionX 具有多樣化的部署形式。

OrionX 支持 CentOS、Ubuntu、Debian 等 Linux 發(fā)行版本,同時支持基于 KVM 的虛擬機云平臺和基于 Docker 的容器云平臺。尤其是支持原生容器,并實現(xiàn)了和 Kubernetes 的平滑對接。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1664

    文章

    22509

    瀏覽量

    639514
  • 服務器
    +關注

    關注

    14

    文章

    10371

    瀏覽量

    91770
  • AI芯片
    +關注

    關注

    17

    文章

    2166

    瀏覽量

    36869

原文標題:OrionX AI芯片計算資源池化技術

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NanoEdge AI技術原理、應用場景及優(yōu)勢

    NanoEdge AI 是一種基于邊緣計算的人工智能技術,旨在將人工智能算法應用于物聯(lián)網(wǎng)(IoT)設備和傳感器。這種技術的核心思想是將數(shù)據(jù)處理和分析從云端轉移到設備本身,從而減少數(shù)據(jù)傳
    發(fā)表于 03-12 08:09

    AI發(fā)展對芯片技術有什么影響?

    現(xiàn)在說AI是未來人類技術進步的一大方向,相信大家都不會反對。說到AI芯片技術的關系,我覺得主要體現(xiàn)在兩個方面:第一,
    發(fā)表于 08-12 06:38

    OpenHarmony3.1 Release版本特性解析——OpenHarmony硬件資源架構介紹

    ,實現(xiàn)硬件互助、資源共享,為用戶提供流暢的全場景體驗。本期,我們通過介紹 OpenHarmony 的硬件資源框架,為大家揭曉 OpenHarmony 是如何實現(xiàn)多設備協(xié)同的。一、硬
    發(fā)表于 05-23 16:42

    電力云資源的建立

    國家電網(wǎng)公司從2010年開始建設電力云資源,存儲域作為資源的必須部分,設計和實現(xiàn)存儲域是資源
    發(fā)表于 11-27 17:33 ?0次下載
    電力云<b class='flag-5'>資源</b><b class='flag-5'>池</b>的建立

    華為視頻云平臺通過云技術實現(xiàn)計算、網(wǎng)絡、存儲資源

    華為視頻云的支撐框架為云平臺FusionCloud,可承建北京城市副中心行政辦公區(qū)的視頻監(jiān)控系統(tǒng),構建計算、存儲等資源適配視頻的應用業(yè)務,通過基于主流開放的OpenStack架構的云虛擬
    的頭像 發(fā)表于 12-14 16:35 ?9211次閱讀

    OpenHarmony硬件資源模型

    在設計初期,為解決兩臺設備間的協(xié)同問題,我們通過 OpenHarmony 提供的分布式設備虛擬能力將兩臺設備的硬件資源進行融合,實現(xiàn)了“一對一”的硬件資源訪問。這便是硬件資源
    的頭像 發(fā)表于 05-11 10:24 ?2363次閱讀

    什么是內存

    1什么是內存 1.1技術 所謂“技術”,就
    的頭像 發(fā)表于 11-08 16:26 ?2081次閱讀
    什么是內存<b class='flag-5'>池</b>

    高并發(fā)內存項目實現(xiàn)

    相關知識 1、技術 技術就是程序先向系統(tǒng)申請過量的
    的頭像 發(fā)表于 11-09 11:16 ?1616次閱讀
    高并發(fā)內存<b class='flag-5'>池</b>項目實現(xiàn)

    了解連接、線程、內存、異步請求

    技術 技術能夠減少資源對象的創(chuàng)建次數(shù),提?程
    的頭像 發(fā)表于 11-09 14:44 ?2443次閱讀
    了解連接<b class='flag-5'>池</b>、線程<b class='flag-5'>池</b>、內存<b class='flag-5'>池</b>、異步請求<b class='flag-5'>池</b>

    內存主要解決的問題

    內存的定義 1.技術 是在計算機技術中經常使用的一種設計模式,其內涵在于:將程序中需要
    的頭像 發(fā)表于 11-13 15:23 ?1798次閱讀
    內存<b class='flag-5'>池</b>主要解決的問題

    技術的應用實踐

    作為一名Java開發(fā)人員,技術或多或少在業(yè)務代碼中使用。常見的包括線程、連接等。也是因為Java語言超級豐富的基建,基本上這些
    的頭像 發(fā)表于 11-24 10:22 ?1275次閱讀
    <b class='flag-5'>池</b><b class='flag-5'>化</b><b class='flag-5'>技術</b>的應用實踐

    優(yōu)刻得與聯(lián)想AI實驗室攜手共建高效AI資源

    近日,云計算服務提供商優(yōu)刻得(UCloud)與聯(lián)想AI實驗室宣布達成戰(zhàn)略合作,雙方將共同打造一個高效且靈活的本地AI資源
    的頭像 發(fā)表于 07-14 14:19 ?1717次閱讀

    打造異構計算新標桿!國數(shù)集聯(lián)發(fā)布首款CXL混合資源參考設計

    今日,領先的高速互聯(lián)芯片及方案設計廠商國數(shù)集聯(lián)發(fā)布業(yè)界首創(chuàng)的CXL混合資源(Compute Express Link Hybrid Resource Pool ,以下簡稱“CHRP”)參考設計。該
    的頭像 發(fā)表于 08-06 14:19 ?1078次閱讀
    打造異構<b class='flag-5'>計算</b>新標桿!國數(shù)集聯(lián)發(fā)布首款CXL混合<b class='flag-5'>資源</b><b class='flag-5'>池</b>參考設計

    AI云端計算資源有哪些類型

    AI云端計算資源涵蓋了從基礎設施到軟件服務的多個層面,為AI模型的訓練、推理和部署提供了強大的支持。下面,AI部落小編為您詳細介紹
    的頭像 發(fā)表于 11-15 09:39 ?1077次閱讀

    AI云端計算資源的多維度優(yōu)勢

    AI云端計算資源,作為AI技術與云計算深度融合的產物,在成本效益、性能優(yōu)化、數(shù)據(jù)安全、靈活擴展以
    的頭像 發(fā)表于 01-07 11:11 ?1115次閱讀
    蓬安县| 盐边县| 顺昌县| 怀仁县| 株洲县| 绍兴市| 盐亭县| 林口县| 金沙县| 汝阳县| 甘谷县| 信宜市| 凉山| 东山县| 东源县| 多伦县| 金溪县| 鹤山市| 麻江县| 溧阳市| 缙云县| 内黄县| 贺兰县| 厦门市| 枣阳市| 尉氏县| 京山县| 枣庄市| 无为县| 岳西县| 滦南县| 类乌齐县| 辽中县| 鄯善县| 禄丰县| 湖南省| 太保市| 上杭县| 汕头市| 太白县| 新绛县|