日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

GPU會完全取代用于AI工作負載的計算基礎架構中的CPU?

我快閉嘴 ? 來源:賢集網(wǎng) ? 作者:賢集網(wǎng) ? 2020-10-09 14:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能AI)最初只是實驗室研究,但如今機器學習深度學習等人工智能技術正越來越多地應用到現(xiàn)實世界中,例如檢測金融交易中的欺詐行為、分析零售數(shù)據(jù)以提供個性化的購物體驗,或者找到運輸工具的最佳路線。

這些趨勢意味著人工智能正迅速成為許多企業(yè)工作流程中不可或缺的一部分,從電子郵件到CRM或ERP,尤其是數(shù)據(jù)分析,從組織自身的數(shù)據(jù)集中收集商業(yè)智能見解,以提高效率,甚至創(chuàng)造新的商業(yè)機會。

這并不奇怪,IDC最近的一項調(diào)查顯示,85%的企業(yè)正在評估人工智能或已經(jīng)在生產(chǎn)中使用人工智能。然而,IDC發(fā)現(xiàn),大多數(shù)組織報告說,在他們的人工智能項目中,有四分之一的機構報告說,失敗率高達50%。這些失敗都歸因于缺乏熟練員工或文化上的挑戰(zhàn),但另一個常見的失敗原因是無法從概念驗證項目擴展到能夠服務于整個組織的生產(chǎn)能力。

退一步講,重要的是要區(qū)分那些投資于人工智能以獲得顯著的戰(zhàn)略優(yōu)勢或可能重塑其整個商業(yè)模式的組織,而不是那些僅僅尋求簡化運營或使用人工智能來自動化某些任務的組織。對于后者,基于云的AI功能生態(tài)系統(tǒng)已經(jīng)興起,可以通過API進行訪問并將其集成到業(yè)務工作流程中。

另一類公司則以電子商務巨頭阿里巴巴(Alibaba)分拆出來的一家銀行為例,該銀行使用人工智能來管理其所有金融服務,在貸款審批等流程方面,它的速度比競爭對手快得多,而且員工人數(shù)只占其一小部分。正如《哈佛商業(yè)評論》(Harvard Business Review)所詳述的,這家新銀行的核心是一個基于人工智能的“決策工廠”,它將決策視為一門科學,利用數(shù)據(jù)來推動預測和洞察,從而指導和自動化公司的運營工作流程。

對于這類業(yè)務,實施你的人工智能戰(zhàn)略首先要有正確的數(shù)據(jù),并且要理解如何使用它。這意味著不僅要雇傭數(shù)據(jù)科學家,還要雇傭數(shù)據(jù)戰(zhàn)略家,他們是能夠?qū)I(yè)務問題轉化為分析解決方案和見解的專業(yè)人士。

人工智能是建立在數(shù)據(jù)基礎上的

大量的數(shù)據(jù)是開發(fā)機器學習(ML)或深度學習(DL)算法的最終根本。您在模型上投入的樣本數(shù)據(jù)越多,就可以將模型“訓練”得越好,并且其輸出越準確可靠。結果是,與傳統(tǒng)的企業(yè)IT環(huán)境相比,為AI項目存儲和處理數(shù)據(jù)通常需要與高性能計算(HPC)安裝有更多共同點的硬件。

訓練一個深度學習模型或分析大量數(shù)據(jù)需要大量的處理能力。這可以通過使用一堆服務器和高端處理器芯片并行處理問題來實現(xiàn)。但更有效的解決方案是求助于專門的加速器,如GPU,或圖形處理單元。

GPU之所以得名,是因為它們最初是3D圖形的加速器,需要數(shù)百萬次重復計算才能渲染圖像。因此,它們具有使用數(shù)百個簡單處理核心的大規(guī)模并行體系結構,事實證明,它們也適用于AI模型所涉及的計算。

例如,谷歌發(fā)現(xiàn)一個僅用于48個Nvidia GPU即可處理用于在線圖像識別的AI系統(tǒng),該系統(tǒng)需要16,000個CPU。

這并不意味著GPU會完全取代用于AI工作負載的計算基礎架構中的CPU。在許多情況下,仍然需要CPU來處理應用程序邏輯和其他數(shù)據(jù)科學計算,因此在大多數(shù)情況下,結合使用CPU和GPU的計算節(jié)點將被證明是最佳解決方案。

存儲源計算

與傳統(tǒng)的HPC體系結構一樣,獲得最佳性能的關鍵是保持計算節(jié)點及其gpu以足夠高的速率接收數(shù)據(jù),以使它們保持忙碌,這意味著存儲基礎結構在提供所需的性能級別方面起著至關重要的作用。正確的數(shù)據(jù)存儲系統(tǒng)必須提供高吞吐量,以防止昂貴的gpu閑置,但它也必須具有靈活性和可擴展性。

更復雜的是,不同的AI工作負載將以讀寫數(shù)據(jù)的方式顯示不同的訪問模式,存儲層需要能夠處理所有這些模式。ML訓練工作負載往往遵循一種不可預測的訪問模式,例如,生成大量的讀寫操作,這些讀寫操作可能包括大小不等的隨機訪問和順序訪問,存儲層必須能夠吸收這些數(shù)據(jù)并提供高吞吐量。

當訓練數(shù)據(jù)集足夠小時,例如在試驗性部署中,它可能被緩存在本地內(nèi)存中,或者從小型計算節(jié)點群集中的本地閃存驅(qū)動器(SSD)中提供服務,這可以提供足夠的性能級別,特別是當閃存SSD是NVMe驅(qū)動器時。

NVMe是一種存儲標準,它使用高速PCIe總線將SSD直接鏈接到系統(tǒng)中的處理器,而不是傳統(tǒng)接口(如SASSATA)。它還指定了一種新的高效協(xié)議,可以減少軟件開銷,從而最大限度地提高閃存提供的低延遲。NVMe的一個關鍵特性是支持多個I/O隊列(最多65535個),從而使閃存能夠并行處理多個請求。這利用了NAND存儲設備的內(nèi)部并行性,并允許比SAS或SATA高得多的原始吞吐量。

然而,擴展這樣一個試驗性部署來支持生產(chǎn)性人工智能用例所需的大量數(shù)據(jù)是困難的和/或昂貴的,這可能是一些人工智能項目無法超越概念驗證階段的原因。

成本也是一個因素。許多全閃存存儲體系結構都依賴于單獨的對象存儲池或類似的存儲池來保存訪問頻率較低的冷數(shù)據(jù)。相比之下,存儲公司DDN有一個名為熱池的功能,用戶可以通過在用于熱數(shù)據(jù)的閃存層和用于冷數(shù)據(jù)的更大的旋轉磁盤層之間自動遷移數(shù)據(jù),將所有內(nèi)容保存在一個文件系統(tǒng)中。這降低了由于管理開銷而導致的成本,同時使所有數(shù)據(jù)更接近你的手邊。

加速任意規(guī)模的AI

這方面的一個很好的例子可以從DDN的加速、任意規(guī)模的AI(A3I)投資組合中看到,DDN是一家專門從事高性能存儲的公司。A3I系列是一套基于DDN EXAScaler系統(tǒng)的預配置設備,可選擇所有閃存NVMe SSD或閃存與硬盤驅(qū)動器存儲的混合,以提高存儲容量。

為了擴大規(guī)模,客戶只需添加額外的設備,每個AI200X/AI400X設備的閃存NVMe容量高達256TB,或AI7990X型號的混合存儲容量為4PB。每個文件系統(tǒng)都可以看作是一個構建塊,可以聚合成一個可以在容量、性能和功能上進行擴展的文件系統(tǒng)。

根據(jù)DDN,A3I設備針對所有類型的訪問模式和數(shù)據(jù)布局進行了優(yōu)化,以確保GPU資源的充分利用。每個設備還具有多個高速主機接口,最多有8個HDR100 InfiniBand或100Gbit/s以太網(wǎng)端口。

AI基礎設施認證

認識到這一點,領先的GPU供應商Nvidia在其參考架構中將DDNA3I存儲與DGX A100系統(tǒng)結合在一起,DGX A100系統(tǒng)是一個專用的AI計算系統(tǒng),其中包含八個最新的A100 Tensor Core GPU和一對AMD Epyc CPU。DGX A100系統(tǒng)的架構被設計為適用于所有AI工作負載的通用系統(tǒng),可消耗高達192GB / s的大量數(shù)據(jù)。但是,四個并行工作的DDN AI400X存儲設備能夠使所有這些GPU完全存滿數(shù)據(jù)。

雖然DGX A100是相當新的產(chǎn)品,但是客戶已經(jīng)在AI應用程序中將DDN存儲與Nvidia的舊DGX-1平臺一起使用。日本東北大學醫(yī)學大銀行組織(ToMMo)已實現(xiàn)DDN EXAScaler存儲,該存儲連接到運行Parabricks基因組分析軟件的基于DGX-1 GPU的分析服務器,作為其醫(yī)療超級計算機系統(tǒng)的一部分。

據(jù)該大學稱,這極大地提高了其分析能力和樣品量。因為由于能夠處理更大的數(shù)據(jù)集,所以以前只存在于理論上的方法現(xiàn)在變得可行,從而提高了數(shù)據(jù)分析的準確性。

不過教訓是,要使用A來I轉變業(yè)務運營,組織需要能夠處理大量數(shù)據(jù)。這反過來又意味著要建立一個能夠處理這些數(shù)據(jù)量的基礎設施,以及在不破壞銀行資金的情況下擴大對數(shù)據(jù)和計算資源的訪問的方法,以支持未來的增長。

希望通過采用全面的數(shù)據(jù)戰(zhàn)略來領先于競爭對手的公司需要確保自己不會在基礎架構方面承擔額外風險。選擇一家在要求最苛刻的數(shù)據(jù)密集型的環(huán)境中提供一系列解決方案方面具有豐富經(jīng)驗的存儲供應商是一個明智的起點。
責任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    41754

    瀏覽量

    302952
  • 人工智能
    +關注

    關注

    1821

    文章

    50459

    瀏覽量

    267555
  • 機器學習
    +關注

    關注

    67

    文章

    8569

    瀏覽量

    137364
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    內(nèi)存要取代GPU?HBM之父警告:以英偉達GPU為核心的架構要被顛覆

    主板和CPU成為了主角。 ? 而最近“HBM之父”金正浩教授也語出驚人,提出未來內(nèi)存將成為主角:“GPUCPU將會被集成到內(nèi)存(HBM和HBF)里,淪為內(nèi)存的一個組件”。 ? 倒反
    的頭像 發(fā)表于 04-03 09:54 ?7327次閱讀
    內(nèi)存要<b class='flag-5'>取代</b><b class='flag-5'>GPU</b>?HBM之父警告:以英偉達<b class='flag-5'>GPU</b>為核心的<b class='flag-5'>架構</b>要被顛覆

    英特爾前CEO基辛格:GPU將被取代!

    激進的想法,是因為其認為量子技術的普及時間可能遠超所有人的想象。 ? 與此同時,基辛格還表示,當前AI泡沫確實存在,而量子計算的突破性進展將從根本上改變行業(yè)格局,也就是說,量子計算將是戳破當前
    的頭像 發(fā)表于 12-04 09:48 ?7627次閱讀

    基于openEuler平臺的CPU、GPU與FPGA異構加速實戰(zhàn)

    隨著 AI、視頻處理、加密和高性能計算需求的增長,單一 CPU 已無法滿足低延遲、高吞吐量的計算需求。openEuler 作為面向企業(yè)和云端的開源操作系統(tǒng),在 多樣算力支持 方面表現(xiàn)出
    的頭像 發(fā)表于 04-08 11:02 ?1272次閱讀
    基于openEuler平臺的<b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>與FPGA異構加速實戰(zhàn)

    為何CPUAI基礎設施的核心

    人工智能 (AI) 并非一種具有單一理想基礎設施的單一工作負載AI 涵蓋了多樣化的工作負載,需
    的頭像 發(fā)表于 03-11 10:35 ?1433次閱讀

    成功案例:象帝先計算技術與Imagination合作——面向現(xiàn)代圖形與計算工作負載的專業(yè)GPU

    為專業(yè)計算設計桌面GPU桌面GPU不僅用于游戲,還能加速從專業(yè)可視化、高級模擬到數(shù)據(jù)密集型計算在內(nèi)的多種現(xiàn)代
    的頭像 發(fā)表于 03-09 09:17 ?528次閱讀
    成功案例:象帝先<b class='flag-5'>計算</b>技術與Imagination合作——面向現(xiàn)代圖形與<b class='flag-5'>計算</b><b class='flag-5'>工作</b><b class='flag-5'>負載</b>的專業(yè)<b class='flag-5'>GPU</b>

    OrangePi RV2 深度技術評測:RISC-V AI融合架構的先行者

    OrangePi RV2是香橙派推出的一款基于RISC-V架構AI開發(fā)板,搭載KY X1八核處理器。該板以“CPU 融合AI”為核心理念,內(nèi)置2TOPS算力,并支持雙M.2 NVMe
    發(fā)表于 03-03 20:19

    Banana Pi BPI-CM6 計算模塊將 8 核 RISC-V 處理器帶入 CM4 外形尺寸

    。AI 加速器/NPU:該 SoC 的架構宣稱可提供高達 2.0 TOPS 的 AI 計算能力(專為機器學習/AI
    發(fā)表于 12-20 09:01

    適應邊緣AI全新時代的GPU架構

    電子發(fā)燒友網(wǎng)站提供《適應邊緣AI全新時代的GPU架構.pdf》資料免費下載
    發(fā)表于 09-15 16:42 ?47次下載

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學習AI芯片的創(chuàng)新方法與架構

    算法 5.2加速矩陣乘法的芯片架構 ①新的矩陣乘法器架構 ②基于RISC-V的矩陣乘法擴展指令集 ③用信息論的思想來減少AI推理計算量 三、用于
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    工作嗎? 從書中也了解到了AI芯片都有哪些?像CPUGPU、FPGA、ASIC都是AI芯片。 其他的還是知道的,F(xiàn)PGA屬于
    發(fā)表于 09-12 16:07

    AI 芯片浪潮下,職場晉升新契機?

    、新架構不斷涌現(xiàn)。能夠在工作中提出創(chuàng)新性的解決方案,推動 AI 芯片性能、功耗、成本等關鍵指標的優(yōu)化,將極大提升在職稱評審的競爭力。例如,在芯片設計
    發(fā)表于 08-19 08:58

    AI芯片:加速人工智能計算的專用硬件引擎

    人工智能(AI)的快速發(fā)展離不開高性能計算硬件的支持,而傳統(tǒng)CPU由于架構限制,難以高效處理AI任務
    的頭像 發(fā)表于 07-09 15:59 ?2057次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」書中的芯片知識是比較接近當前的頂尖芯片水平的,同時包含了芯片架構的基礎知識,但該部分知識比較晦澀難懂,或許是由于我一
    發(fā)表于 06-18 19:31

    GPU架構深度解析

    GPU架構深度解析從圖形處理到通用計算的進化之路圖形處理單元(GPU),作為現(xiàn)代計算機中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)
    的頭像 發(fā)表于 05-30 10:36 ?2071次閱讀
    <b class='flag-5'>GPU</b><b class='flag-5'>架構</b>深度解析

    能效提升3倍!異構計算架構AI跑得更快更省電

    。它是應對復雜計算需求的關鍵技術之一。 ? 異構計算架構的核心優(yōu)勢 ? 異構計算架構的核心要素主要包括多種
    的頭像 發(fā)表于 05-25 01:55 ?4350次閱讀
    紫金县| 天门市| 江永县| 庄浪县| 固安县| 承德市| 高邑县| 喜德县| 化州市| 黄大仙区| 和硕县| 云龙县| 枝江市| 姜堰市| 营山县| 鄯善县| 中超| 栾川县| 迭部县| 逊克县| 沾化县| 中宁县| 焉耆| 宜阳县| 巫溪县| 鹿泉市| 车致| 滦南县| 甘德县| 惠水县| 项城市| 武城县| 岫岩| 天柱县| 呼伦贝尔市| 长岭县| 通城县| 高陵县| 左贡县| 绥滨县| 石景山区|