我們生活在一個每天都會產(chǎn)生大量數(shù)據(jù)的數(shù)字信息時代。隨著物聯(lián)網(wǎng)設(shè)備、自動駕駛汽車、聯(lián)網(wǎng)家庭和聯(lián)網(wǎng)工作場所數(shù)量的不斷增加,數(shù)據(jù)中心的數(shù)據(jù)愈加趨向飽和。因此,需要一種解決方案,使數(shù)據(jù)中心能夠處理不斷增加的進出和通過數(shù)據(jù)中心傳輸?shù)臄?shù)據(jù)量。
數(shù)據(jù)處理單元,通常稱為DPU,是一種新型可編程的高性能處理器,優(yōu)化執(zhí)行和加速由數(shù)據(jù)中心服務(wù)器執(zhí)行的網(wǎng)絡(luò)和存儲功能。DPU 就像 GPU 一樣插在服務(wù)器的 PCIe 插槽上,它們允許服務(wù)器將網(wǎng)絡(luò)和存儲功能從 CPU 卸載到DPU上 ,從而使 CPU 專注于運行操作系統(tǒng)和系統(tǒng)應(yīng)用程序。DPU 通常使用可重新編程的 FPGA 與網(wǎng)卡相結(jié)合來加速網(wǎng)絡(luò)流量。
DPU是由三個主要元件組成的片上系統(tǒng)。首先,數(shù)據(jù)處理單元通常有一個軟件可編程的多核 CPU 。第二個元件是高性能網(wǎng)絡(luò)接口,它使 DPU 能夠解析、處理并在網(wǎng)絡(luò)中有效地傳輸數(shù)據(jù)。第三個元件是一組豐富的靈活、可編程的加速引擎,它將網(wǎng)絡(luò)和存儲功能從 CPU 卸載到 DPU。
此外,DPU 可用于處理包括網(wǎng)絡(luò)安全、防火墻任務(wù)、加密和基礎(chǔ)設(shè)施管理在內(nèi)的功能。
DPU 最常見的特性是什么?
DPU 具有很多功能,以下是最常見的功能:
1)通過一個或多個 100 Gigabit 到 200 Gigabit 接口的高速連接
2)高速數(shù)據(jù)包處理
3)基于 ARM 或 MIPS 的 CPU多核處理處理器(8個64位Arm CPU內(nèi)核)
5)加速器
6)PCI Express Gen 4 支持
7)安全功能
8)自定義操作系統(tǒng)與主機系統(tǒng)的操作系統(tǒng)分離
常見的 DPU 解決方案有哪些?
2021年4月,英偉達發(fā)布了新一代數(shù)據(jù)處理器BlueField-3 DPU。BlueField-3是首款為AI和加速計算而設(shè)計的DPU,相比上一代產(chǎn)品,它具有10倍加速計算能力、16個Arm A78 CPU核,和4倍的加密速度。BlueField-3利用英偉達 DOCA(集數(shù)據(jù)中心于芯片的架構(gòu))軟件開發(fā)包的優(yōu)勢,為開發(fā)者提供一個完整、開放的軟件平臺,開發(fā)在BlueField DPU上開發(fā)軟件定義和硬件加速的網(wǎng)絡(luò)、存儲、安全和管理等應(yīng)用。BlueField-3預(yù)計將于2022年第一季度發(fā)布樣品。

賽靈思和英特爾的一些產(chǎn)品被稱為SmartNIC ,利用FPGA 來加速網(wǎng)絡(luò)和存儲功能。智能網(wǎng)卡的工作原理與數(shù)據(jù)處理單元相同,它們將網(wǎng)絡(luò)功能從CPU 卸載到 SmartNIC,通過將網(wǎng)絡(luò)和存儲功能智能地委托給 SmartNIC ,從而釋放處理能力。FPGA 的可重新編程特性,為數(shù)據(jù)路徑帶來了并行性和定制化。
例如,賽靈思提供帶各種產(chǎn)品的 ALVEO 系列SmartNIC,英特爾及其合作伙伴提供了多種基于 FPGA 的 SmartNIC 解決方案,以加速大型數(shù)據(jù)中心的數(shù)據(jù)處理工作負載。英特爾稱其 SmartNIC“通過將交換、存儲和安全功能卸載到集成了英特爾 FPGA 和英特爾至強處理器的單一 PCIe 平臺上來提高數(shù)據(jù)中心的性能水平?!?英特爾提供了第二個更新的 SmartNIC解決方案,稱為 Silicom FPGA SmartNIC N5010,它結(jié)合了英特爾 Stratix 10 FPGA 和英特爾以太網(wǎng) 800 系列適配器,為組織提供 4個100 Gigabit 以太網(wǎng)端口,為數(shù)據(jù)中心提供充足的帶寬。
Fungible是一家位于加利福尼亞的組合式系統(tǒng)初創(chuàng)公司。該公司聲稱其技術(shù)能為每100美元的數(shù)據(jù)中心網(wǎng)絡(luò)中的網(wǎng)絡(luò)、計算和存儲資源節(jié)省67美元。針對以數(shù)據(jù)為中心(data-centric)應(yīng)用的處理,F(xiàn)ungible研發(fā)了F1 DPU處理器和TrueFabric互聯(lián)技術(shù)。TrueFabric是由Fungible首先提出的新型大規(guī)模數(shù)據(jù)中心網(wǎng)絡(luò)互聯(lián)標準,這種Fabric互聯(lián)協(xié)議基于標準的UDP/IP/Ethernet協(xié)議棧構(gòu)建。

Fungible F1 DPU 外殼
RoCEv2是一種當前數(shù)據(jù)中心網(wǎng)絡(luò)中主流的互聯(lián)網(wǎng)絡(luò)協(xié)議,該協(xié)議同樣基于UDP/IP/Ethernet搭建,對終端提供高性能的RDMA Read/Write服務(wù),而TrueFabric對接入點提供高性能的Send/Receive服務(wù)。Fungible F1 DPU原生支持TrueFabric,因此F1 DPU可以用于大規(guī)模TrueFabric數(shù)據(jù)中心網(wǎng)絡(luò),不同類型的服務(wù)器都可以將Fungible DPU作為網(wǎng)絡(luò)接入點。
還有哪些其他性能加速器?
下面是數(shù)據(jù)中心中經(jīng)常使用的一些性能加速器,包括 GPU、CSD和 FPGA。
1. GPU
GPU通常部署在數(shù)據(jù)中心的高性能服務(wù)器上,以加速工作負載。服務(wù)器通常會將復(fù)雜的數(shù)學計算卸載到 GPU。因為GPU 采用了一種并行架構(gòu),該架構(gòu)由許多比 CPU 更小的內(nèi)核組成,使它們能夠并行處理許多任務(wù),從而使組織能夠從服務(wù)器中提取更多性能。

來源:英偉達
例如,CPU平均有四到十個核心,而 GPU 有數(shù)百或數(shù)千個較小的核心,它們一起運行以并行處理復(fù)雜的計算。CPU更適合順序數(shù)據(jù)處理。
安裝在數(shù)據(jù)中心服務(wù)器上的 GPU 非常適合加速深度學習訓練和機器學習訓練,這些訓練需要大量的計算能力,而CPU無法提供。組織使用 GPU 來訓練深度學習和機器學習模型,數(shù)據(jù)集越大,神經(jīng)網(wǎng)絡(luò)越大,復(fù)雜的計算需要很長時間。在某些情況下,深度學習訓練需要幾個小時,但若使用 CPU 執(zhí)行相同的任務(wù)可能需要幾天到幾周的時間。
此外,將GPU 添加到數(shù)據(jù)中心服務(wù)器可顯著提高數(shù)據(jù)吞吐量,并提供以盡可能低的延遲處理和分析數(shù)據(jù)的能力。(延遲是指完成給定任務(wù)所需的時間量,數(shù)據(jù)吞吐量是指單位時間內(nèi)完成的任務(wù)數(shù)。)
2.計算存儲驅(qū)動器(CSD)
計算存儲已經(jīng)作為性能加速器進入數(shù)據(jù)中心,在存儲設(shè)備級別處理數(shù)據(jù),減少了CPU 和存儲設(shè)備之間的數(shù)據(jù)傳輸。計算存儲支持實時數(shù)據(jù)分析,并通過減少輸入/輸出瓶頸來提高系統(tǒng)性能。CSD看起來與常規(guī)存儲驅(qū)動器相同,但它們包含一個多核處理器,用于執(zhí)行一些功能,例如在數(shù)據(jù)進入存儲設(shè)備時對數(shù)據(jù)進行索引,并在存儲設(shè)備中搜索特定條目。

來源:AnandTech
由于實時處理和分析數(shù)據(jù)的需求不斷增長,CSD越來越受歡迎。數(shù)據(jù)不再需要在存儲設(shè)備和 CPU 之間傳輸。相反,數(shù)據(jù)在存儲設(shè)備本身上進行處理,在數(shù)據(jù)所在的確切位置為存儲介質(zhì)提供計算能力,從而實現(xiàn)實時分析和決策。
3. FPGA
FPGA是一種集成電路,由邏輯塊、I/O單元和其他資源組成,允許用戶根據(jù)需要執(zhí)行的工作負載的特定要求以不同的方式重新編程和重新配置芯片。FPGA在執(zhí)行深度學習推理處理和機器學習推理方面也越來越受歡迎。

來源:Xilinx
在英偉達的帶領(lǐng)下,DPU的概念非?;鸨?。總體而言,由于數(shù)據(jù)中心中存儲的數(shù)據(jù)量不斷增加,需要一種能夠加速高性能數(shù)據(jù)中心服務(wù)器執(zhí)行的存儲和網(wǎng)絡(luò)功能的解決方案,而DPU 可以為現(xiàn)有服務(wù)器注入新的活力,發(fā)展市場非常巨大,預(yù)測到2025年僅中國市場就能達到每年40億美元的規(guī)模,估計全球?qū)⒊^120億美元。
審核編輯 :李倩
-
cpu
+關(guān)注
關(guān)注
68文章
11332瀏覽量
226002 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
18文章
5780瀏覽量
75215 -
DPU
+關(guān)注
關(guān)注
0文章
417瀏覽量
27150
原文標題:淺談DPU產(chǎn)業(yè)發(fā)展現(xiàn)狀
文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
《具身智能發(fā)展報告(2025年)》
【「芯片設(shè)計基石——EDA產(chǎn)業(yè)全景與未來展望」閱讀體驗】跟著本書來看EDA的奧秘和EDA發(fā)展
【「芯片設(shè)計基石——EDA產(chǎn)業(yè)全景與未來展望」閱讀體驗】--中國EDA的發(fā)展
【「芯片設(shè)計基石——EDA產(chǎn)業(yè)全景與未來展望」閱讀體驗】--全書概覽
集創(chuàng)北方亮相2025 LED顯示產(chǎn)業(yè)發(fā)展焦點論壇
慧爾視亮相2025交通毫米波雷達產(chǎn)業(yè)發(fā)展大會
MEMS加速度計與石英加速度計的發(fā)展現(xiàn)狀與水平對比
基于NVIDIA BlueField DPU的5G UPF數(shù)據(jù)面加速方案
NVIDIA助力Axio團隊打造全新DPU數(shù)據(jù)面開發(fā)框架
利用NVIDIA DPU重塑網(wǎng)絡(luò)安全格局
中國芯片發(fā)展現(xiàn)狀和趨勢2025
鋁電解電容的行業(yè)發(fā)展現(xiàn)狀與未來趨勢展望
RISC-V 發(fā)展現(xiàn)狀及未來發(fā)展重點
淺談DPU產(chǎn)業(yè)發(fā)展現(xiàn)狀
評論