日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

HPC處理器的多核架構挑戰(zhàn)

王燕 ? 來源:十個名字V ? 作者:十個名字V ? 2022-07-14 16:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著半導體設計團隊競相利用“超越摩爾”,新的架構選擇和挑戰(zhàn)層出不窮。以超大規(guī)模硬件為例,其中一系列工作負載——數(shù)據(jù)庫分析、人工智能、微服務、視頻編碼和高復雜性計算算法——需要一系列處理器解決方案。性能、功耗和成本仍然至關重要,但現(xiàn)在架構師自己交付。沒有一種“最好”的架構;處理器必須設計為最好地服務于特定類別的工作負載和價格/性能配置文件。

多核架構挑戰(zhàn)

AWS Graviton2 有 64 個 Arm Neoverse N1 內(nèi)核,它們平鋪在單個芯片上的連貫網(wǎng)狀網(wǎng)絡中。其他設計已經(jīng)擴展到多芯片,芯片之間具有緩存一致的連接。多芯片實現(xiàn)為進一步增長和降低不太先進工藝成本的潛力開辟了空間。雖然這些新架構選項擴展了可能性,但它們也帶來了新的設計挑戰(zhàn)。在眾多選擇中,哪些架構真正能夠以合適的價格為合適的工作負載提供更高的吞吐量?

這里的一個問題是,應如何針對目標類應用程序的物理內(nèi)存對相干網(wǎng)狀網(wǎng)絡中的分布式系統(tǒng)緩存進行分區(qū)。優(yōu)化這些選擇,甚至優(yōu)化哪些 CPU 內(nèi)核最能滿足需求,都需要以周期級精度運行實際工作負載。高級模型根本不足以達到此目的。

poYBAGLOsl2ALQFSAARV9EQJl4Q431.png

poYBAGLOsl2ALQFSAARV9EQJl4Q431.png

圖:多芯片實現(xiàn)中不同的 I/O 延遲。(來源:Cadence

連貫網(wǎng)格中的處理器陣列之間的通信延遲在單個裸片內(nèi)將相對一致,但在多裸片實現(xiàn)中裸片之間的延遲可能會有很大差異(見圖)。因此,設計發(fā)展出多種架構,可在未來使用——全連接網(wǎng)格、集線器和輻條內(nèi)存系統(tǒng)或其他 2D 和 3D 結(jié)構,其中一個小芯片提供大系統(tǒng)緩存和主內(nèi)存訪問。此外,堆棧中的其他小芯片相互通信,并通過集線器與主存儲器通信。

有效探索所有這些選項在很大程度上取決于針對實際工作負載準確建模性能。建模和分析只能在 RTL 域中使用仿真和原型進行探索。

SystemReady 合規(guī)性

服務器架構師面臨的另一種問題是操作系統(tǒng)兼容性。您可以直接在大多數(shù)筆記本電腦上啟動任何 Linux 發(fā)行版、虛擬機管理程序或 Windows。要在基于 Arm 的服務器上啟動,此責任由服務器制造商和 Arm 分擔。

Arm 開發(fā)了一個名為 SystemReady 的合規(guī)套件,以標準化一組最低要求,以解決這個問題和其他合規(guī)問題。PCIe 合規(guī)性是一個特別重要的組件,因為它直接為許多服務器接口協(xié)議提供或作為主要 I/O 的基礎,以實現(xiàn)快速存儲、快速網(wǎng)絡和芯片外連貫接口。這里特別重要的是通過 PCIe 進行遠程服務器引導。Arm 將此合規(guī)套件作為在 UEFI (BIOS) 層上運行的軟件提供。Cadence 與 Arm 合作了幾年,旨在將測試縮減為具有 PCIe 流量生成庫的最小裸機測試套件,該庫的仿真速度比 UEFI 測試套件更快,可以快速調(diào)整硬件調(diào)試。

服務器開發(fā)人員面臨的另一個挑戰(zhàn)是 PCIe 使用強排序的內(nèi)存模型。Arm 支持標準允許的松散排序的內(nèi)存模型。但只有強排序才能保證沒有死鎖。在松散訂購下,硬件/固件開發(fā)人員必須提供該保證。不幸的是,這無法通過合規(guī)性檢查。集成商必須再次在仿真器或原型系統(tǒng)上通過廣泛的用例測試證明設計是死鎖安全的。

使用 Cadence System 驗證 IP 的方法使工程師能夠在半天內(nèi)啟動并運行系統(tǒng)級測試套件,該套件可以根據(jù) SystemReady 要求驗證 PCIe 集成。此方法還可用于演示從連接到 PCIe 的閃存設備模型引導 SUSE Linux 和 Windows,這引起了高級服務器社區(qū)的極大興趣。

不僅適用于服務器

Arm Neoverse 平臺不僅是為高端服務器設計的。該家族已經(jīng)開始進入其他云應用程序和通信基礎設施,一直到邊緣。在其中一些應用程序中,多核架構已經(jīng)很重要。在大多數(shù)此類應用程序(例如汽車)中,對一系列開放和商業(yè)操作系統(tǒng)的開箱即用支持是必不可少的。

我相信用于自動生成系統(tǒng)級內(nèi)容和驗證系統(tǒng)級目標合規(guī)性的工具將在許多市場中具有廣泛的適用性。EDA 行業(yè)需要超越傳統(tǒng)的單接口單協(xié)議驗證 IP (VIP) 范圍,走向多接口多協(xié)議系統(tǒng)級 VIP 的新時代。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20341

    瀏覽量

    255356
  • ARM
    ARM
    +關注

    關注

    135

    文章

    9595

    瀏覽量

    393834
  • 服務器
    +關注

    關注

    14

    文章

    10372

    瀏覽量

    91775
  • HPC
    HPC
    +關注

    關注

    0

    文章

    350

    瀏覽量

    25083
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    MPC180LMB安全處理器:功能、架構與應用全解析

    MPC180LMB安全處理器:功能、架構與應用全解析 在當今數(shù)字化時代,網(wǎng)絡安全至關重要,安全處理器在保障數(shù)據(jù)安全方面發(fā)揮著關鍵作用。Freescale Semiconductor
    的頭像 發(fā)表于 04-10 11:30 ?171次閱讀

    ADSP - 21467/ADSP - 21469 SHARC處理器:高性能音頻處理的理想之選

    SHARC處理器憑借其卓越的性能和豐富的功能,成為了眾多工程師在音頻處理項目中的首選。本文將深入介紹這款處理器的特點、架構、性能以及相關設計要點,希望能為電子工程師們在實際應用中提
    的頭像 發(fā)表于 03-23 16:35 ?793次閱讀

    探索ADSP - 21371/ADSP - 21375 SHARC處理器:高性能音頻處理的利器

    探索ADSP - 21371/ADSP - 21375 SHARC處理器:高性能音頻處理的利器 在電子設計領域,處理器的性能和特性直接影響著產(chǎn)品的功能和競爭力。ADSP - 21371/ADSP
    的頭像 發(fā)表于 03-23 16:35 ?819次閱讀

    SMJ320C80數(shù)字信號處理器架構、特性與應用全解析

    SMJ320C80數(shù)字信號處理器架構、特性與應用全解析 在當今數(shù)字化的時代,數(shù)字信號處理器(DSP)在眾多領域中發(fā)揮著至關重要的作用。SMJ320C80作為一款高性能的單芯片并行處理器
    的頭像 發(fā)表于 03-06 16:55 ?1144次閱讀

    探索TDA54x Jacinto?處理器:高性能與安全的完美融合

    我們帶來了哪些新的技術亮點和應用可能。 文件下載: tda54-q1.pdf 強大的功能特性 多核處理架構 TDA54x處理器擁有豐富的處理
    的頭像 發(fā)表于 03-06 16:50 ?1190次閱讀

    MAX77874:16A高性能四相降壓調(diào)節(jié),引領多核處理器電源解決方案

    MAX77874:16A高性能四相降壓調(diào)節(jié),引領多核處理器電源解決方案 在電子設備飛速發(fā)展的今天,多核心CPU和GPU處理器對電源的要求
    的頭像 發(fā)表于 03-06 16:40 ?1098次閱讀

    TAS3103A數(shù)字音頻處理器:特性、架構與應用詳解

    TAS3103A數(shù)字音頻處理器:特性、架構與應用詳解 引言 在當今數(shù)字化音頻處理領域,一款高性能、可配置的音頻處理器至關重要。德州儀器(Texas Instruments)的TAS31
    的頭像 發(fā)表于 02-27 16:25 ?307次閱讀

    Chiplet,如何助力HPC

    (chipletarchitecture),它能夠以更低的成本提供比單芯片處理器更高的性能,同時能耗降低高達10倍。這些優(yōu)勢使得小芯片架構在未來高性能計算和人工智
    的頭像 發(fā)表于 02-26 15:15 ?901次閱讀
    Chiplet,如何助力<b class='flag-5'>HPC</b>?

    云拼接處理器的性能如何?

    性能方面表現(xiàn)卓越,以下從多個維度進行深入解析。 一、硬件設計:穩(wěn)定與高效的基石 融大視覺的云拼接處理器采用嵌入式純硬件設計,這一設計理念使其區(qū)別于依賴操作系統(tǒng)的軟件方案。由于沒有傳統(tǒng)操作系統(tǒng)的復雜架構,系統(tǒng)完
    的頭像 發(fā)表于 09-05 00:11 ?901次閱讀

    Andes晶心科技推出AndesCore 46系列處理器家族

    Andes晶心科技,作為高效能、低功耗32/64位RISC-V處理器核的領導供貨商及RISC-V國際組織的創(chuàng)始首席會員,今日宣布推出具有4個成員的AndesCore 46系列處理器家族。首款成員AX46MPV是一款全新64位多核
    的頭像 發(fā)表于 08-13 14:02 ?3043次閱讀

    【老法師】多核異構處理器中M核程序的啟動、編寫和仿真

    有很多研究單片機的小伙伴在面對多核異構處理器時,可能會對多核的啟動流程感到困惑——因為不熟悉GCC編程和GDB調(diào)試,所以也無法確定多核異構處理器
    的頭像 發(fā)表于 08-13 09:05 ?4239次閱讀
    【老法師】<b class='flag-5'>多核</b>異構<b class='flag-5'>處理器</b>中M核程序的啟動、編寫和仿真

    T113-i芯片技術解析:高性能嵌入式處理器的創(chuàng)新設計

    ?芯片概述 明遠智睿的T113-i芯片是一款由全志科技推出的高性能、低功耗嵌入式處理器,主要面向智能家居、工業(yè)控制、消費電子等領域。該芯片基于ARM架構,集成了多核CPU、GPU和豐富的接口資源,在
    的頭像 發(fā)表于 07-17 14:15 ?1563次閱讀

    龍芯處理器支持WINDOWS嗎?

    龍芯處理器目前不支持原生運行Windows操作系統(tǒng),主要原因如下: 架構差異 龍芯架構:龍芯早期基于MIPS架構,后續(xù)轉(zhuǎn)向自主研發(fā)的LoongArch指令集(與x86/ARM不兼容
    發(fā)表于 06-05 14:24

    HPM5E31IGN單核 32 位 RISC-V 處理器

    問題。其單核設計在保證性能的同時實現(xiàn)了優(yōu)異的能效比,主頻可達248MHz,遠超同類ARM架構處理器。這種高性能特性使其能夠輕松應對實時數(shù)據(jù)處理、復雜算法運算等挑戰(zhàn)性任務。核心特性
    發(fā)表于 05-29 09:23

    技術分享 | 如何在2k0300(LoongArch架構處理器上跑通qt開發(fā)流程

    技術分享 | 如何在2k0300開發(fā)板(LoongArch架構處理器上跑通qt開發(fā)流程
    的頭像 發(fā)表于 05-20 11:05 ?1042次閱讀
    技術分享 | 如何在2k0300(LoongArch<b class='flag-5'>架構</b>)<b class='flag-5'>處理器</b>上跑通qt開發(fā)流程
    南投市| 呈贡县| 伊宁市| 达州市| 娄烦县| 彩票| 洱源县| 突泉县| 桂林市| 贵德县| 大关县| 陈巴尔虎旗| 和林格尔县| 千阳县| 安福县| 都兰县| 双城市| 个旧市| 茂名市| 甘泉县| 公安县| 苏尼特右旗| 靖州| 孝昌县| 莱西市| 城口县| 抚宁县| 文昌市| 浪卡子县| 栾川县| 拉萨市| 灵山县| 南澳县| 晋宁县| 铜鼓县| 博客| 曲水县| 西畴县| 商洛市| 日土县| 松江区|