日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

采用全新的7nm架構,AMD RDNA架構的解析

獨愛72H ? 來源:中關村在線 ? 作者:中關村在線 ? 2019-12-10 17:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來源:中關村在線)

隨著AMD的全新7nm制程工藝的RDNA架構推出,代表著AMD在未來的GPU市場上將有一番大作為,在過去的幾代中,AMD的GPU已經利用了很久的基于GCN架構的計算單元。GCN多年來一直很好地服務于AMD,并且非常適合各種工作負載,但是對于Radeon RX 5700系列和Navi核心,AMD的GCN架構已經不能繼續(xù)滿足了,因此他們推出了全新的RDNA(Radeon DNA)架構。

RDNA架構采用臺積電的7nm制程工藝,GDDR6顯存,支持PCI Express 4.0接口。GPU還采用了新的Radeon Media和Radeon Display引擎,以更好地滿足流媒體和內容創(chuàng)作者的需求,并引入一系列新的顯示技術。

Navi核心中的新COMPUTE UNIT(CU單元)設計具有多級緩存層次結構和簡化的圖形管道,不僅可以提高每時鐘性能,還可以提高時鐘頻率。新的CU提供雙倍的GCN指令速率,并且具有兩倍的標量單位數和調度程序數。通過資源池,兩個CU可以協調并充當工作組處理器。例如,64個線程可以分組為兩個Wave32指令,并在單個時鐘中執(zhí)行。CU的靈活性和集中資源的能力提高了單線程性能,GPU利用率和效率。

Navi還具有新的緩存層次結構。AMD為其增加了一個新的L1緩存,并將L0緩存的負載帶寬加倍到ALU。新的緩存層次結構減少了每個級別的緩存延遲,并提高了有效帶寬。

Navi中的DCC(Delta Color Compression,增強色彩壓縮)算法也得到了改進,并且也可用于緩存子系統(tǒng)的更廣泛部分。使用Navi,著色器現在可以讀取和寫入壓縮的顏色數據。新的顯示單元還可以讀取幀緩沖器中的壓縮數據,而無需先對其進行解壓縮。最終結果是整個GPU的有效帶寬更高。

Navi核心中的整個圖形管道也已得到改進,可提高效率,實現更好的每時鐘性能,并且GPU還具有更高效的時鐘門控功能,可提高整體電源效率。相對于GCN,RDNA提供超過50%的每瓦性能提升和25%更好的整體性能提升。據AMD稱,超過50%的改進來自架構優(yōu)化; GPU的7nm工藝和頻率改進也得到了提升。

根據AMD的說法,Navi的40 CU設計性能比Vega64提高了約14%,功耗降低了23%。并且具有小得多的芯片尺寸。(Navi 10的面積為251平方毫米,作為對比Vega 64上面的那顆為495平方毫米。)

最后,我們來看看采用完整完整的RDNA架構的GPU核心里面都有什么呢?40個RDNA計算單元,包括80個標量處理器,2560個流處理器和160個64位雙線性濾波器單元。GPU具有4MB L2緩存,512K L1和雙倍VSL0負載帶寬,支持整個芯片的DCC(Delta Color Compression,增強色彩壓縮)。簡化的圖形引擎具有新的幾何引擎,64像素單位和4個異步計算引擎。

而在未來,當RDNA架構的顯卡核心從251mm2擴大、乃至翻倍后,帶來更多的流處理器和晶體管,想必會讓AMD在高端乃至旗艦市場上大發(fā)神威。而在入門級顯卡上,RDNA架構則擁有較GCN架構更好的能耗比,能夠更好的控制功耗與發(fā)熱,移植到移動端上也非常有可能,從而打破競爭對手在移動端顯卡上的一家獨霸!

(責任編輯:fqj)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • amd
    amd
    +關注

    關注

    25

    文章

    5708

    瀏覽量

    140452
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11332

    瀏覽量

    225987
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    STR71xF ARM7TDMI? 32位MCU深度解析:特性、架構與應用指南

    STR71xF ARM7TDMI? 32位MCU深度解析:特性、架構與應用指南 在電子工程師的日常工作中,選擇一款合適的微控制器(MCU)至關重要。ST公司的STR71xF系列ARM7
    的頭像 發(fā)表于 04-17 15:15 ?220次閱讀

    深入剖析AT91FR4081微控制器:功能、架構與應用全解析

    的處理器內核 AT91FR4081采用ARM7TDMI ARM? Thumb?處理器核心,具備高性能32位RISC架構和高密度16位指令集,在
    的頭像 發(fā)表于 04-06 10:40 ?314次閱讀

    2022全新版!Java分布式架構設計與開發(fā)實戰(zhàn)(完結)

    2022全新版!Java分布式架構設計與開發(fā)實戰(zhàn)(完結) 分庫分表實戰(zhàn):Java海量數據存儲架構設計 在現代互聯網應用中,隨著業(yè)務規(guī)模的指數級增長,數據庫性能瓶頸已成為制約系統(tǒng)發(fā)展的關鍵因素。當單
    發(fā)表于 03-30 15:20

    如何突破AI存儲墻?深度解析ONFI 6.0高速接口與Chiplet解耦架構

    Timing Group 及SCA(獨立指令地址)架構,具備基于固件的訓練能力,能夠完美適配全球主流廠商的存儲顆粒。 3. 技術規(guī)格參數核心指標技術參數行業(yè)價值 最高速率4800Mbps (ONFI
    發(fā)表于 01-29 17:32

    Windows平臺EtherCAT實時控制:從抖動抑制到虛擬化架構解析

    Windows平臺EtherCAT實時控制:從抖動抑制到虛擬化架構解析
    的頭像 發(fā)表于 01-29 15:26 ?442次閱讀
    Windows平臺EtherCAT實時控制:從抖動抑制到虛擬化<b class='flag-5'>架構</b><b class='flag-5'>解析</b>

    AMD UltraScale架構:高性能FPGA與SoC的技術剖析

    AMD UltraScale架構:高性能FPGA與SoC的技術剖析 在當今的電子設計領域,高性能FPGA和MPSoC/RFSoC的需求日益增長。AMD的UltraScale架構憑借其創(chuàng)
    的頭像 發(fā)表于 12-15 14:35 ?775次閱讀

    采用Prefetch+Cache架構有什么優(yōu)勢?

    我看官方說,采用Prefetch+Cache架構同頻CoreMark 計算力/功耗比超越同類產品,這優(yōu)勢就是低功耗么?要是具體芯片比較的話,應該怎么比?
    發(fā)表于 12-11 07:35

    商湯科技正式發(fā)布并開源全新多模態(tài)模型架構NEO

    商湯科技正式發(fā)布并開源了與南洋理工大學S-Lab合作研發(fā)的全新多模態(tài)模型架構 —— NEO,為日日新SenseNova 多模態(tài)模型奠定了新一代架構的基石。
    的頭像 發(fā)表于 12-08 11:19 ?1196次閱讀
    商湯科技正式發(fā)布并開源<b class='flag-5'>全新</b>多模態(tài)模型<b class='flag-5'>架構</b>NEO

    芯源MCU架構是不是基本都是ARM架構?還有其他的架構嗎?

    芯源MCU架構是不是基本都是ARM架構?還有其他的架構嗎?
    發(fā)表于 11-20 06:21

    國產AI芯片真能扛住“算力內卷”?海思昇騰的這波操作藏了多少細節(jié)?

    最近行業(yè)都在說“算力是AI的命門”,但國產芯片真的能接住這波需求嗎? 前陣子接觸到海思昇騰910B,實測下來有點超出預期——7nm工藝下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
    發(fā)表于 10-27 13:12

    五大電磁頻譜管理系統(tǒng):原理、架構與應用全景解析

    五大電磁頻譜管理系統(tǒng):原理、架構與應用全景解析
    的頭像 發(fā)表于 09-26 10:21 ?689次閱讀
    五大電磁頻譜管理系統(tǒng):原理、<b class='flag-5'>架構</b>與應用全景<b class='flag-5'>解析</b>

    AMD 7nm Versal系列器件NoC的使用及注意事項

    AMD 7nm Versal系列器件引入了可編程片上網絡(NoC, Network on Chip),這是一個硬化的、高帶寬、低延遲互連結構,旨在實現可編程邏輯(PL)、處理系統(tǒng)(PS)、AI引擎(AIE)、DDR控制器(DDRMC)、CPM(PCIe/CXL)等模塊之間
    的頭像 發(fā)表于 09-19 15:15 ?3157次閱讀
    <b class='flag-5'>AMD</b> <b class='flag-5'>7nm</b> Versal系列器件NoC的使用及注意事項

    適應邊緣AI全新時代的GPU架構

    電子發(fā)燒友網站提供《適應邊緣AI全新時代的GPU架構.pdf》資料免費下載
    發(fā)表于 09-15 16:42 ?47次下載

    基于AMD Versal器件實現PCIe5 DMA功能

    Versal是AMD 7nm的SoC高端器件,不僅擁有比16nm性能更強的邏輯性能,并且其PS系統(tǒng)中的CPM PCIe也較上一代MPSoC PS硬核PCIe單元強大得多。本節(jié)將基于AMD
    的頭像 發(fā)表于 06-19 09:44 ?2049次閱讀
    基于<b class='flag-5'>AMD</b> Versal器件實現PCIe5 DMA功能

    GPU架構深度解析

    GPU架構深度解析從圖形處理到通用計算的進化之路圖形處理單元(GPU),作為現代計算機中不可或缺的一部分,已經從最初的圖形渲染專用處理器,發(fā)展成為強大的并行計算引擎,廣泛應用于人工智能、科學計算
    的頭像 發(fā)表于 05-30 10:36 ?2043次閱讀
    GPU<b class='flag-5'>架構</b>深度<b class='flag-5'>解析</b>
    新巴尔虎右旗| 德州市| 南漳县| 大余县| 蓬溪县| 宝山区| 浦东新区| 霸州市| 沽源县| 普宁市| 江门市| 宣城市| 仲巴县| 南城县| 五峰| 中方县| 苏尼特右旗| 东山县| 新源县| 婺源县| 新郑市| 城固县| 吉林省| 巴塘县| 通道| 荃湾区| 佳木斯市| 上虞市| 德兴市| 宁阳县| 洞口县| 璧山县| 贵港市| 肇庆市| 全椒县| 凤城市| 独山县| 峡江县| 马关县| 铜山县| 南川市|