阿里巴巴發(fā)布了玄鐵910 RISC-V內(nèi)核,這是一款基于RISC-V RV64GCV的AI加速引擎的超高性能處理器。
在HotChips 2020大會(huì)上,阿里巴巴發(fā)布了 玄鐵910 RISC-V內(nèi)核,這是一款基于RISC-V RV64GCV的AI加速引擎的超高性能處理器。它的性能比 SiFive 的 U74 高出約 40%。

它帶有 RISC-V 0.7.1 矢量擴(kuò)展和 Sv39 內(nèi)存管理單元 + 8/16 物理內(nèi)存保護(hù)。Sv39 是為 RV64 系統(tǒng)設(shè)計(jì)的虛擬內(nèi)存系統(tǒng),支持 39 位虛擬地址空間。它的實(shí)現(xiàn)支持 39 位虛擬地址空間,分為 4 KiB 頁。XT910 的一些主要亮點(diǎn)包括:
超高性能超標(biāo)量處理器
RISC-V 兼容加上 RISC-V Turbo 技術(shù)
雙問題亂序內(nèi)存子系統(tǒng)
AI矢量加速引擎
XT910 采用同構(gòu)多核架構(gòu),每個(gè)集群最多 4 個(gè)內(nèi)核。每個(gè)內(nèi)核支持一個(gè) 32KB/64KB L1 指令緩存和一個(gè) 32KB/64KB L1 數(shù)據(jù)緩存。每個(gè)集群都有一個(gè)共享的 L2 緩存內(nèi)存。
流水線的前端由 7 個(gè)階段組成。取指令單元每個(gè)周期可以取 8 條指令。指令譯碼單元每個(gè)周期可以同時(shí)譯碼3條指令,并且可以使用物理寄存器每個(gè)周期最多4條指令。亂序引擎每個(gè)周期最多可以發(fā)出 8 條指令。

流水線的后端具有亂序內(nèi)存訪問、專用分支處理和亂序向量計(jì)算。它具有多個(gè)執(zhí)行單元,包括 2 個(gè)單周期 ALU、1 個(gè)單周期分支跳轉(zhuǎn)單元、1 個(gè)雙發(fā)出加載和存儲單元、2 個(gè)標(biāo)量浮點(diǎn)單元和 2 個(gè)向量執(zhí)行單元。

它支持浮點(diǎn) 16/32/64 和整數(shù) 8/16/32/64 操作。它直接訪問向量加載和向量存儲上的 L1 緩存??傮w而言,矢量引擎為每個(gè) CPU 集群提供超過 300 GFLOPS 的 FP 16 計(jì)算能力。

除了XT910的內(nèi)部使用,阿里巴巴還推廣基于無間SoC平臺的邊緣服務(wù)器、工控、ADAS等邊緣計(jì)算應(yīng)用。
審核編輯:郭婷
-
處理器
+關(guān)注
關(guān)注
68文章
20339瀏覽量
255356 -
服務(wù)器
+關(guān)注
關(guān)注
14文章
10371瀏覽量
91774 -
RISC-V
+關(guān)注
關(guān)注
49文章
2954瀏覽量
53606
發(fā)布評論請先 登錄
阿里巴巴達(dá)摩院發(fā)布新一代旗艦CPU產(chǎn)品玄鐵C950
深度解析ADSP - TS101S TigerSHARC嵌入式處理器
ADSP - 21467/ADSP - 21469 SHARC處理器:高性能音頻處理的理想之選
探索ADSP - 21371/ADSP - 21375 SHARC處理器:高性能音頻處理的利器
ADSP - 21369 SHARC處理器:高性能音頻處理的理想之選
深入剖析ADSP - 2136x SHARC處理器:高性能音頻處理的理想之選
ADSP1802 SHARC處理器:高性能音頻處理的理想之選
TDA7718B:高性能車載音頻處理器的卓越之選
TDA7418:高性能3頻段汽車音頻處理器的深度解析
TDA7418:高性能3頻段汽車音頻處理器的深度剖析
海外電商平臺阿里巴巴國際站獲取商品詳情的API接口
萬豪國際集團(tuán)與阿里巴巴達(dá)成AI時(shí)代戰(zhàn)略合作 升級賓客旅行體驗(yàn)
阿里巴巴的超高性能超標(biāo)量處理器
評論