日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

傳統(tǒng)用于數(shù)字設計的CPU是否已經達到了容量極限?

傅里葉的貓 ? 來源:傅里葉的貓 ? 2024-04-17 10:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文翻譯自Synopsys的官方文章:

在數(shù)字設計的Implementation過程中,從RTL到GDSII的每一步都是高度計算密集型的。在SoC層面,為了最小化互連的延遲,我們需要評估數(shù)百個partition的各種布局方案。一旦確定了布局方案,接下來就是進行每個partition內的其余步驟,以實現(xiàn)全芯片的implementation和signoff。由于每一步的計算需求已經很高,并且還要乘以partition的數(shù)量,這就引發(fā)了一個問題:傳統(tǒng)用于數(shù)字設計的CPU是否已經達到了容量極限?GPU是否能夠滿足計算需求?

如今,GPU以其處理人工智能、機器學習、游戲和高性能計算等要求最為苛刻的工作負載而聞名。隨著芯片越來越大、越來越復雜,也許也是時候考慮用GPU來完成數(shù)字芯片設計的Implementation了。

CPU在EDA工作負載中的容量挑戰(zhàn)

CPU長期以來被認為是計算機的“大腦”。擁有數(shù)十億個晶體管和多個處理核心,如今的CPU非常適合完成廣泛的任務,并且能夠快速完成。另一方面,GPU最初是為特定目的設計的,但隨著時間的推移,它們也轉變?yōu)橥ㄓ玫牟⑿?a target="_blank">處理器

一般來講,EDA工具都是在基于x86處理器的CPU上運行的。然而,隨著多芯片設計等復雜架構變得越來越普遍,我們正在接近CPU計算容量的限制??紤]到芯片設計團隊始終面臨的上市時間壓力,利用額外的工具和技術來加速芯片設計過程的任何方面都是有意義的。在驗證和分析方面,新思科技的PrimeSim和VCS仿真流程已經從GPU加速中受益。雖然數(shù)字設計流程中的每個任務并不是都非常適合GPU,但有些任務確實可以加速。

最先進的高性能數(shù)據(jù)中心x86 CPU核心平均有64到128個核心,每個box最多約有200個核心。需要更多核心的任務需要分布在許多box上;如果網絡不夠快,這會產生一些開銷。RTL到GDSII流程和優(yōu)化技術包含許多相互依賴性。為了使流程中的每個任務能夠成功并行執(zhí)行,作業(yè)分布在CPU box之間的數(shù)據(jù)共享必須非??焖伲舆t要小。然而,實際上,網絡延遲會妨礙周轉時間,使得完整的RTL到GDSII流程的分布式并行化變得不那么有吸引力。

另一方面,GPU核心可以輕松擴展。每個核心執(zhí)行的操作更少,而且非常微小,以至于你可以在一個插座中擁有數(shù)萬個核心,以提供巨大的處理能力,同時保持可管理的占用空間。能夠從大規(guī)模并行性中受益的任務非常適合GPU。然而,這樣的任務也必須是主要單向的,因為任何決策和迭代都會減慢進程和/或需要回到CPU進行“如果那么”決策。這排除了許多RTL到GDSII數(shù)字implementation流程中的任務,盡管并非所有任務都不適合。

使用GPU加速加快布局過程

在數(shù)字設計流程中,自動布局是已經展示出在GPU上運行前景的一項任務。在商業(yè)環(huán)境中運行的原型中,新思科技的Fusion Compiler GPU加速布局技術相比CPU,已經展示出顯著的周轉時間優(yōu)勢:

使用GPU放置一個3nm GPU流處理器設計,包含1.4M個可放置的標準單元和20個可放置的硬宏,僅需38秒,相比之下,CPU驅動的布局需要13分鐘

使用GPU放置一個12nm汽車CPU設計,包含2.9M個可放置的標準單元和200個可放置的硬宏,僅需82秒,相比之下,CPU驅動的布局需要19分鐘

結合新思科技DSO.ai的AI驅動自動設計空間優(yōu)化,我們預計將在相同的完成時間線上將AI驅動的搜索空間擴大15倍到20倍。這樣做可以使設計團隊實現(xiàn)更好的功耗、性能和面積(PPA)結果。

在許多方面,由于對最終設計PPA的高影響,布局和 floorplanning 是涉及最廣泛探索的implementation步驟。我們可以想象,即使GPU計算資源通常與強大的CPU計算集群分開,單個designer使用基于GPU的布局技術也能具有很高的生產力。然而,在RTL到GDSII 的implementation流程的其余部分中,通過CPU和GPU集群之間移動設計數(shù)據(jù)引入的延遲可能會限制吞吐量優(yōu)勢。

新的數(shù)據(jù)中心SoC正在設計中,CPU和GPU資源之間具有統(tǒng)一內存,用于TB級工作負載。這些新興架構消除了利用GPU加速所需的設計數(shù)據(jù)移動,并將允許我們考慮在數(shù)字設計流程中應用GPU加速的其他位置,特別是當設計師可以將GPU與AI驅動的implementation工具配對時,可以進行更快、更廣泛的探索和更好的結果。隨著像新思科技.ai這樣的AI驅動的全棧EDA流程解決方案產生更好的PPA結果、更快的達到目標時間和更高的工程生產力,人們只能想象GPU加速的加入將如何進一步改變芯片設計。

總結

雖然芯片設計過程中的仿真部分對于在GPU上運行并不陌生,但很快數(shù)字設計流程的各個方面也將有機會利用GPU加速。對于大型芯片或復雜架構(如多芯片設計),CPU在運行RTL到GDSII流程時所需的計算容量正在耗盡,無法達到期望的速度。憑借其可擴展性和處理能力,GPU有可能提供更快的周轉時間和更好的芯片結果。使用GPU驅動的放置器進行的原型實驗已經將布局速度提高了多達20倍。隨著AI集成到EDA流程中,加入GPU可以形成一個強大的組合,以提高PPA(功耗、性能和面積)和上市時間。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片設計
    +關注

    關注

    15

    文章

    1173

    瀏覽量

    56787
  • 人工智能
    +關注

    關注

    1821

    文章

    50367

    瀏覽量

    267066
  • RTL
    RTL
    +關注

    關注

    1

    文章

    395

    瀏覽量

    62903
  • 機器學習
    +關注

    關注

    67

    文章

    8567

    瀏覽量

    137263
  • GPU芯片
    +關注

    關注

    1

    文章

    307

    瀏覽量

    6562

原文標題:GPU可以加速芯片設計的Implementaion嗎?

文章出處:【微信號:傅里葉的貓,微信公眾號:傅里葉的貓】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI算力大爆發(fā),傳統(tǒng)光纖“跑不動”了

    電子發(fā)燒友網報道(文/黃山明)AI時代下,算力中心正將分布式GPU集群變?yōu)橹髁鳎虼藢W絡提出了更低時延、更大帶寬、更長跨數(shù)據(jù)中心距離的硬需求。但這時候發(fā)現(xiàn),傳統(tǒng)的光纖在物理極限已經不夠用了,不僅
    的頭像 發(fā)表于 03-24 17:39 ?7065次閱讀

    Keysight任意波形發(fā)生器M8199B的性能指標及典型應用

    隨著光通信、毫米波雷達以及高速數(shù)字鏈路技術不斷突破傳統(tǒng)極限,對于任意波形發(fā)生器(AWG)的要求也達到了前所未有的高度。Keysight 的AWG M8199B,以超高的性能刷新了商用
    的頭像 發(fā)表于 03-19 08:24 ?1322次閱讀
    Keysight任意波形發(fā)生器M8199B的性能指標及典型應用

    請問openssl/libressl 是否已經使用硬件加密引擎?

    雖然我 rsync / scp / SFTP 其中一個 CPU 內核將被 100% 使用,但總帶寬也不是很好。(文件在 NVMe 上) 那么,正如標題一樣,openssl/libressl 是否已經使用了硬件加密引擎?
    發(fā)表于 03-16 08:17

    吉時利數(shù)字源表2602B在電池容量測試中的應用解析

    鋰離子電池作為現(xiàn)代電子設備核心動力源,其容量衰減直接影響設備續(xù)航能力。吉時利數(shù)字源表2602B憑借其高精度測量與多通道并行測試能力,為電池性能評估提供了全新技術路徑。本文從測試原理、操作步驟及數(shù)據(jù)分析維度,系統(tǒng)闡述2602B在電池容量
    的頭像 發(fā)表于 01-08 17:47 ?1287次閱讀
    吉時利<b class='flag-5'>數(shù)字</b>源表2602B在電池<b class='flag-5'>容量</b>測試中的應用解析

    華為數(shù)字能源圓滿完成智能組串式構網型儲能極限耐火試驗

    華為數(shù)字能源在國際權威的獨立保障和風險管理機構DNV和第三方認證機構TüV南德的全程見證下,圓滿完成基于最新版UL9540A的華為智能組串式構網型儲能大規(guī)模極限耐火試驗。
    的頭像 發(fā)表于 01-07 09:49 ?442次閱讀

    備用電池的容量和環(huán)境兼容性對電能質量在線監(jiān)測裝置的精度有何影響?

    備用電池的 容量 和 環(huán)境兼容性 均通過 影響供電穩(wěn)定性 間接作用于電能質量在線監(jiān)測裝置的精度 —— 容量決定供電 “持續(xù)穩(wěn)定性”,環(huán)境兼容性決定供電 “動態(tài)穩(wěn)定性”,兩者共同保障裝置核心元件
    的頭像 發(fā)表于 11-27 18:00 ?1515次閱讀
    備用電池的<b class='flag-5'>容量</b>和環(huán)境兼容性對電能質量在線監(jiān)測裝置的精度有何影響?

    你的企業(yè)網絡,是否真的“跟得上”數(shù)字化轉型的腳步?

    前言在數(shù)字化轉型的浪潮中,您的企業(yè)是否也面臨這樣的網絡困境:分公司訪問云端系統(tǒng)頻繁卡頓,視頻會議屢屢中斷成為溝通的常態(tài);跨地域數(shù)據(jù)傳輸緩慢,嚴重影響項目交付進度;盡管已投入大量成本部署多條專線,網絡
    的頭像 發(fā)表于 11-26 10:02 ?1435次閱讀
    你的企業(yè)網絡,<b class='flag-5'>是否</b>真的“跟得上”<b class='flag-5'>數(shù)字</b>化轉型的腳步?

    【「高速數(shù)字設計(基礎篇)」閱讀體驗】第六章 去耦電容的容量需求分析

    去耦電容容量別瞎猜!《高速數(shù)字設計》第6章教你量化計算,精準選型 在高速數(shù)字電路設計中,去耦電容選多大容量是個難點?!陡咚?b class='flag-5'>數(shù)字設計》第6章“
    發(fā)表于 11-19 20:48

    串聯(lián)諧振試驗裝置的核心工作邏輯是什么?和傳統(tǒng)耐壓設備比優(yōu)勢在哪?

    ,通常 50-100 倍)。? 對比傳統(tǒng)工頻耐壓設備,優(yōu)勢堪稱 “降維打擊”:傳統(tǒng)設備需大電源容量(如測 3km 10kV 電纜需 500kVA 以上),體積堪比冰箱且重量超 200kg;而武漢特高壓串聯(lián)
    發(fā)表于 10-11 15:40

    如何判斷電能質量在線監(jiān)測裝置的測量精度是否達到標準?

    判斷電能質量在線監(jiān)測裝置的測量精度是否達到標準,需圍繞 “ 標準限值明確→實驗室精準校準→現(xiàn)場工況驗證→數(shù)據(jù)溯源閉環(huán) ” 的邏輯,結合國家 / 國際標準(如 GB/T 19862-2016、IEC
    的頭像 發(fā)表于 09-26 14:11 ?932次閱讀

    高壓二極管應用中,是否有足夠銅箔/散熱片,結溫是否接近極限?

    MDD辰達半導體FAE,我們往往會追溯到一個核心問題——是否有足夠銅箔/散熱片支撐散熱,器件結溫是否已經接近極限。一、結溫與器件可靠性的關系結溫(Tj)是指二極管P
    的頭像 發(fā)表于 09-17 11:42 ?1061次閱讀
    高壓二極管應用中,<b class='flag-5'>是否</b>有足夠銅箔/散熱片,結溫<b class='flag-5'>是否</b>接近<b class='flag-5'>極限</b>?

    github 上的 nano版本已經更新到了4.1.1,是否能提供4.1.1版本的mdk pack包?

    github 上的 nano版本已經更新到了4.1.1,是否能提供4.1.1版本的mdk pack包, 會方便很多
    發(fā)表于 09-17 06:36

    CCG3PA是否支持發(fā)起B(yǎng)IST 共享容量消息?

    我正在使用CCG3PA ,我想發(fā)起B(yǎng)IST 共享容量消息。我檢查了 CCG3PA 的 API 文檔和 PD 堆棧,但找不到任何與啟動BIST 共享容量模式相關的枚舉或 API。 CCG3PA是否支持發(fā)起B(yǎng)IST 共享
    發(fā)表于 07-23 07:07

    極限電流與氧分壓傳感器區(qū)別解析

    極限電流型氧傳感器與氧分壓型氧傳感器在原理、結構及應用上存在顯著差異,具體區(qū)別如下:工作原理01極限電流型氧傳感器:基于電化學泵原理,施加外部電壓使氧氣在電極間遷移,當電壓足夠高時,電流達到
    的頭像 發(fā)表于 05-19 13:26 ?978次閱讀
    <b class='flag-5'>極限</b>電流與氧分壓傳感器區(qū)別解析

    SMA 連接器功率容量的演進:從傳統(tǒng)設計到新型材料的突破

    SMA連接器功率容量傳統(tǒng)設計的艱難摸索到新型材料驅動下的突破發(fā)展,是一部不斷創(chuàng)新、持續(xù)進取的科技進步史。伴隨材料科學與制造技術的持續(xù)革新,德索的SMA連接器功率容量也將不斷躍上新臺階,為微波、射頻等前沿領域注入源源不斷的發(fā)展動
    的頭像 發(fā)表于 05-14 09:10 ?733次閱讀
    SMA 連接器功率<b class='flag-5'>容量</b>的演進:從<b class='flag-5'>傳統(tǒng)</b>設計到新型材料的突破
    中山市| 黄平县| 合山市| 温宿县| 桦南县| 嘉善县| 平武县| 阿瓦提县| 游戏| 开封市| 拜泉县| 台东县| 文安县| 平南县| 寻甸| 融水| 苗栗市| 新乐市| 孟连| 申扎县| 蒲江县| 茂名市| 雷波县| 大英县| 青田县| 隆子县| 前郭尔| 鹤壁市| 阿坝| 淮南市| 琼结县| 泗洪县| 吉隆县| 青岛市| 闻喜县| 昌宁县| 会宁县| 新疆| 龙川县| 安康市| 鸡泽县|