日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU競(jìng)爭(zhēng)壁壘:微架構(gòu)和平臺(tái)生態(tài)

架構(gòu)師技術(shù)聯(lián)盟 ? 來(lái)源:架構(gòu)師技術(shù)聯(lián)盟 ? 2023-05-15 11:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

據(jù)Global Market Insights 數(shù)據(jù),全球 GPU 市場(chǎng)預(yù)計(jì)將以 CAGR 25.9%持續(xù)增長(zhǎng),至 2030 年達(dá)到 4000 億美元規(guī)模。其中 AI 領(lǐng)域大語(yǔ)言模型的持續(xù)推出以及參數(shù)量的不斷增長(zhǎng)有望驅(qū)動(dòng)模型訓(xùn)練端、推理端 GPU 需求快速增長(zhǎng)。

近年來(lái),國(guó)產(chǎn) GPU 廠商在圖形渲染 GPU 和高性能計(jì)算 GPGPU 領(lǐng)域上均推出了較為成熟的產(chǎn)品,在性能上不斷追趕行業(yè)主流產(chǎn)品,在特定領(lǐng)域達(dá)到業(yè)界一流水平。生態(tài)方面國(guó)產(chǎn)廠商大多兼容英偉達(dá) CUDA,融入大生態(tài)進(jìn)而實(shí)現(xiàn)客戶端不斷導(dǎo)入。在高端GPU 芯片進(jìn)口受限的背景下,國(guó)產(chǎn) GPU 廠商預(yù)計(jì)將乘政策東風(fēng),抓住國(guó)產(chǎn)替代契機(jī)快速成長(zhǎng)。

a0f44268-f251-11ed-90ce-dac502259ad0.png

GPU(圖形處理器)最初是為了解決 CPU 在圖形處理領(lǐng)域性能不足的問(wèn)題而誕生。CPU 作為核心控制計(jì)算單元,高速緩沖存儲(chǔ)器(Cache)、控制單元(Control)在 CPU 硬件架構(gòu)設(shè)計(jì)中所占比例較大,主要為實(shí)現(xiàn)低延遲和處理單位內(nèi)核性能要求較高的工作而存在,而計(jì)算單元(ALU)所占比例較小,這使得 CPU 的大規(guī)模并行計(jì)算表現(xiàn)不佳。GPU 架構(gòu)內(nèi)主要為計(jì)算單元,采用極簡(jiǎn)的流水線進(jìn)行設(shè)計(jì),適合處理高度線程化、相對(duì)簡(jiǎn)單的并行計(jì)算,在圖像渲染等涉及大量重復(fù)運(yùn)算的領(lǐng)域擁有更強(qiáng)運(yùn)算能力。 GPGPU脫胎于GPU,通用性提升

a0ff6404-f251-11ed-90ce-dac502259ad0.png

CPU+GPU 異構(gòu)計(jì)算解決多元化計(jì)算需求

a10960ee-f251-11ed-90ce-dac502259ad0.png

大語(yǔ)言模型開(kāi)啟 AI 元年

a110f944-f251-11ed-90ce-dac502259ad0.png

常見(jiàn)的AI 加速芯片主要為GPU、FPGAASIC

a11ae1ac-f251-11ed-90ce-dac502259ad0.png

大語(yǔ)言模型有望拉動(dòng) GPU 需求增量

a12385d2-f251-11ed-90ce-dac502259ad0.png

a12faf6a-f251-11ed-90ce-dac502259ad0.png

GPU 的微架構(gòu)是用以實(shí)現(xiàn)指令執(zhí)行的硬件電路結(jié)構(gòu)設(shè)計(jì) 以 Nvidia 第一個(gè)實(shí)現(xiàn)統(tǒng)一著色器模型的 Tesla 微架構(gòu)為例,從頂層 Host Interface 接受來(lái)自 CPU 的數(shù)據(jù),藉由 Vertex(頂點(diǎn))、Pixel(片元)、Compute(計(jì)算著色器)分發(fā)給各 TPC(Texture Processing Clusters 紋理處理集群)進(jìn)行處理。

a13a875a-f251-11ed-90ce-dac502259ad0.png

流處理器、特殊函數(shù)計(jì)算單元構(gòu)成計(jì)算核心 在單個(gè) TPC 中主要的運(yùn)算結(jié)構(gòu)為SM(Streaming Multiprocessor 流式多處理器),其內(nèi)在蘊(yùn)含 I Cache(指令緩存)、C Cache(常量緩存)以及核心的計(jì)算單元 SP(Streaming Processor 流處理器)和 SFU(Special Function Unit 特殊函數(shù)計(jì)算單元),外加 Texture Unit(紋理單元)。

a1467a60-f251-11ed-90ce-dac502259ad0.png

解耦計(jì)算單元,擁抱通用計(jì)算 由于圖形渲染流管線相對(duì)固定,Nvidia 在 Tesla構(gòu)中將部分重要環(huán)節(jié)剝離并實(shí)現(xiàn)可編程,解耦出 SM 計(jì)算單元用于通用計(jì)算,即可實(shí)現(xiàn)根據(jù)具體任務(wù)需要分配相應(yīng)線程實(shí)現(xiàn)通用計(jì)算處理。

a14f464a-f251-11ed-90ce-dac502259ad0.png

計(jì)算核心、紋理單元增加, GPC 功能更加完整,Nvidia Fermi 架構(gòu)奠定完整GPU 計(jì)算架構(gòu)基礎(chǔ)。

a1596788-f251-11ed-90ce-dac502259ad0.png

在Tesla 之后,Nvidia 第一個(gè)完整的 GPU 計(jì)算架構(gòu) Fermi通過(guò)制程微縮增加更多計(jì)算核心、紋理單元,并且通過(guò)增加 PolyMorph Engine(多形體引擎)和 Raster Engine(光柵引擎)使得原來(lái) TPC 升級(jí)成為擁有更加完整功能的 GPC(Graphics Processing Clusters 圖形處理器集群)。Fermi 架構(gòu)共包含 4 個(gè) GPC,16 個(gè) SM,512 個(gè)CUDA Core。

英偉達(dá)GPU從最初 Fermi 架構(gòu)到最新的 Ampere 架構(gòu)和 Hopper 架構(gòu)

a166f9f2-f251-11ed-90ce-dac502259ad0.png

每一階段都在性能和能效比方面得到提升,引入了新技術(shù),如 CUDA、GPUBoost、RT 核心和 Tensor 核心等,在圖形渲染、科學(xué)計(jì)算和深度學(xué)習(xí)等領(lǐng)域發(fā)揮重要作用。最新一代 Hopper 架構(gòu)在 2022 年 3 月推出,旨在加速 AI 模型訓(xùn)練,使用 Hopper Tensor Core 進(jìn)行 FP8 和 FP16 的混合精度計(jì)算,以大幅加速Transformer 模型的 AI 計(jì)算。與上一代相比,Hopper 還將 TF32、FP64、FP16 和INT8 精度的每秒浮點(diǎn)運(yùn)算(FLOPS)提高了 3 倍。

AMD 作為全球第二大GPU廠商,亦通過(guò)持續(xù)的架構(gòu)演進(jìn)保持其市場(chǎng)領(lǐng)先地位

a16fa23c-f251-11ed-90ce-dac502259ad0.png

從2010年以來(lái),AMD 相繼推出:GCN 架構(gòu)、RDNA 架構(gòu)、RDNA 2 架構(gòu)、RDNA 3 架構(gòu)、CDNA 架構(gòu)和 CDNA 2 架構(gòu)。最新一代面向高性能計(jì)算和人工智能 CDNA 2 架構(gòu)于架構(gòu)采用增強(qiáng)型 Matrix Core 技術(shù),支持更廣泛的數(shù)據(jù)型和應(yīng)用,針對(duì)高性能計(jì)算工作負(fù)載帶來(lái)全速率雙精度和全新 FP64 矩陣運(yùn)算?;?CDNA2 架構(gòu)的 AMD Instinct MI250X GPU FP64 雙精度運(yùn)算算力最高可達(dá) 95.7 TFLOPs。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5283

    瀏覽量

    136101
  • 微架構(gòu)
    +關(guān)注

    關(guān)注

    0

    文章

    22

    瀏覽量

    7351

原文標(biāo)題:GPU競(jìng)爭(zhēng)壁壘:微架構(gòu)和平臺(tái)生態(tài)

文章出處:【微信號(hào):架構(gòu)師技術(shù)聯(lián)盟,微信公眾號(hào):架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    電網(wǎng)系統(tǒng)架構(gòu):集群協(xié)同與能量互濟(jì)的網(wǎng)絡(luò)設(shè)計(jì)

    電網(wǎng)系統(tǒng)通過(guò)整合多個(gè)異構(gòu)電網(wǎng)(交流、直流、混合架構(gòu)),構(gòu)建“集群協(xié)同、能量互濟(jì)” 的網(wǎng)絡(luò)體系 ,打破單個(gè)電網(wǎng)的資源壁壘,實(shí)現(xiàn)跨區(qū)域、跨類型的能量互補(bǔ)與協(xié)同調(diào)度,成為提升區(qū)域能源利用
    的頭像 發(fā)表于 04-17 14:21 ?185次閱讀
    多<b class='flag-5'>微</b>電網(wǎng)系統(tǒng)<b class='flag-5'>架構(gòu)</b>:集群協(xié)同與能量互濟(jì)的網(wǎng)絡(luò)設(shè)計(jì)

    一文搞懂瑞芯平臺(tái)Trust架構(gòu):從原理到問(wèn)題排查全解析

    在嵌入式系統(tǒng)和智能設(shè)備領(lǐng)域,硬件級(jí)安全防護(hù)已成為產(chǎn)品核心競(jìng)爭(zhēng)力。 ARM TrustZone 技術(shù)作為行業(yè)通用的硬件安全擴(kuò)展方案,被廣泛應(yīng)用于各類 Cortex-A 架構(gòu)芯片。瑞芯平臺(tái)
    的頭像 發(fā)表于 04-13 16:14 ?4689次閱讀
    一文搞懂瑞芯<b class='flag-5'>微</b><b class='flag-5'>平臺(tái)</b>Trust<b class='flag-5'>架構(gòu)</b>:從原理到問(wèn)題排查全解析

    登臨科技GPU+架構(gòu)以硬核算力賦能智慧種植

    傳統(tǒng)農(nóng)業(yè)種植模式的諸多痛點(diǎn),正持續(xù)制約著農(nóng)業(yè)智能化升級(jí)進(jìn)程,農(nóng)業(yè)現(xiàn)代化發(fā)展亟需一場(chǎng) “算力革命”。登臨科技自主研發(fā)的 GPU + 架構(gòu),憑借兼具通用性與高效性的核心優(yōu)勢(shì)打破技術(shù)壁壘,以硬核算力賦能智慧種植,實(shí)現(xiàn)農(nóng)業(yè)檢測(cè)更精準(zhǔn)、生
    的頭像 發(fā)表于 04-13 09:55 ?509次閱讀
    登臨科技<b class='flag-5'>GPU</b>+<b class='flag-5'>架構(gòu)</b>以硬核算力賦能智慧種植

    沐曦股份GPU產(chǎn)品正式接入華佗開(kāi)源生態(tài)

    沐曦股份堅(jiān)持“自主創(chuàng)新與開(kāi)放兼容”雙軌戰(zhàn)略,以自研MXMACA軟件棧為核心,構(gòu)建硬件與應(yīng)用的橋梁,并承載開(kāi)源核心使命。該棧于2025年2月正式開(kāi)源,致力于打造開(kāi)放的GPU編程接口標(biāo)準(zhǔn),大幅降低開(kāi)發(fā)門(mén)檻,有效破解跨平臺(tái)兼容難題,驅(qū)動(dòng)AI算力
    的頭像 發(fā)表于 03-16 14:40 ?1720次閱讀
    沐曦股份<b class='flag-5'>GPU</b>產(chǎn)品正式接入華佗開(kāi)源<b class='flag-5'>生態(tài)</b>

    HarmonyOS首登信公開(kāi)課,分享跨平臺(tái)適配與體驗(yàn)提升實(shí)踐經(jīng)驗(yàn)

    的兼容性挑戰(zhàn)與解決方案。此次分享作為信與HarmonyOS共建生態(tài)的一次具體實(shí)踐,展現(xiàn)了雙方在技術(shù)開(kāi)發(fā)方面的積極交流與協(xié)作。 作為生態(tài)每年一度的核心溝通
    的頭像 發(fā)表于 02-02 09:22 ?542次閱讀
    HarmonyOS首登<b class='flag-5'>微</b>信公開(kāi)課,分享跨<b class='flag-5'>平臺(tái)</b>適配與體驗(yàn)提升實(shí)踐經(jīng)驗(yàn)

    打破智能家居生態(tài)壁壘,樂(lè)鑫一站式Matter解決方案實(shí)現(xiàn)無(wú)縫互聯(lián)

    樂(lè)鑫科技作為CSA聯(lián)盟核心成員,提供一站式Matter解決方案,助力打破智能家居生態(tài)壁壘。方案覆蓋Wi-Fi、Thread等多種連接方式,支持ESP32全系列硬件平臺(tái),并配套提供ESP-Matter
    的頭像 發(fā)表于 11-06 15:19 ?1492次閱讀
    打破智能家居<b class='flag-5'>生態(tài)</b><b class='flag-5'>壁壘</b>,樂(lè)鑫一站式Matter解決方案實(shí)現(xiàn)無(wú)縫互聯(lián)

    瑞芯這幾年為啥那么火?

    還支持8K視頻編解碼。 異構(gòu)計(jì)算架構(gòu):瑞芯很多CPU采用“CPU+GPU+NPU”異構(gòu)計(jì)算架構(gòu),例如旗艦芯片RK3588集成8核CPU、高性能GP
    發(fā)表于 10-20 15:50

    如何看懂GPU架構(gòu)?一分鐘帶你了解GPU參數(shù)指標(biāo)

    GPU架構(gòu)參數(shù)如CUDA核心數(shù)、顯存帶寬、TensorTFLOPS、互聯(lián)方式等,并非“冰冷的數(shù)字”,而是直接關(guān)系設(shè)備能否滿足需求、如何發(fā)揮最大價(jià)值、是否避免資源浪費(fèi)等問(wèn)題的核心要素。本篇文章將全面
    的頭像 發(fā)表于 10-09 09:28 ?1594次閱讀
    如何看懂<b class='flag-5'>GPU</b><b class='flag-5'>架構(gòu)</b>?一分鐘帶你了解<b class='flag-5'>GPU</b>參數(shù)指標(biāo)

    景嘉JM1100生態(tài)合作推介會(huì)長(zhǎng)沙站圓滿結(jié)束

    近日,以 “自主創(chuàng)芯 生態(tài)共建” 為主題的景嘉JM1100 生態(tài)合作推介會(huì)(長(zhǎng)沙站)圓滿結(jié)束。本次推介會(huì)匯聚了產(chǎn)業(yè)鏈各級(jí)領(lǐng)導(dǎo)、知名學(xué)者以及上下游企業(yè)代表,大家圍繞景嘉自主全新一代
    的頭像 發(fā)表于 09-16 17:53 ?1991次閱讀

    適應(yīng)邊緣AI全新時(shí)代的GPU架構(gòu)

    電子發(fā)燒友網(wǎng)站提供《適應(yīng)邊緣AI全新時(shí)代的GPU架構(gòu).pdf》資料免費(fèi)下載
    發(fā)表于 09-15 16:42 ?47次下載

    【「算力芯片 | 高性能 CPU/GPU/NPU 架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 架構(gòu)分析」書(shū)中的芯片知識(shí)是比較接近當(dāng)前的頂尖芯片水平的,同時(shí)包含了芯片架構(gòu)的基礎(chǔ)知識(shí),但該部分知識(shí)比較晦澀難懂,或許是由于我一
    發(fā)表于 06-18 19:31

    從封閉到開(kāi)放:聚徽解碼安卓工控機(jī)如何打破工業(yè)軟件生態(tài)壁壘

    、模塊化設(shè)計(jì)與生態(tài)協(xié)同能力,正成為破解工業(yè)軟件生態(tài)壁壘的關(guān)鍵突破口。 一、開(kāi)源架構(gòu):重構(gòu)工業(yè)軟件開(kāi)發(fā)范式 安卓系統(tǒng)的開(kāi)源特性徹底顛覆了傳統(tǒng)工業(yè)軟件開(kāi)發(fā)模式。傳統(tǒng)工控系統(tǒng)依賴廠商封閉AP
    的頭像 發(fā)表于 06-09 15:42 ?789次閱讀

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計(jì)算的進(jìn)化之路圖形處理單元(GPU),作為現(xiàn)代計(jì)算機(jī)中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)展成為強(qiáng)大的并行計(jì)算引擎,廣泛應(yīng)用于人工智能、科學(xué)計(jì)算
    的頭像 發(fā)表于 05-30 10:36 ?2043次閱讀
    <b class='flag-5'>GPU</b><b class='flag-5'>架構(gòu)</b>深度解析

    ARM Mali GPU 深度解讀

    ARM Mali GPU 深度解讀 ARM Mali 是 Arm 公司面向移動(dòng)設(shè)備、嵌入式系統(tǒng)和基礎(chǔ)設(shè)施市場(chǎng)設(shè)計(jì)的圖形處理器(GPU)IP 核,憑借其異構(gòu)計(jì)算架構(gòu)、能效優(yōu)化和生態(tài)協(xié)同,
    的頭像 發(fā)表于 05-29 10:12 ?5000次閱讀

    iTOP-3588S開(kāi)發(fā)板四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    性能強(qiáng) iTOP-3588S開(kāi)發(fā)板采用瑞芯RK3588S處理器,是全新一代AloT高端應(yīng)用芯片,搭載八核64位CPU,四核Cortex-A76和四核Cortex-A55架構(gòu)主頻高達(dá)2.4GHZ
    發(fā)表于 05-15 10:36
    五大连池市| 金秀| 平遥县| 天镇县| 蛟河市| 集安市| 扎囊县| 阿拉善左旗| 银川市| 麻江县| 长泰县| 新民市| 铅山县| 甘南县| 连州市| 河南省| 尼木县| 曲麻莱县| 五寨县| 普陀区| 天门市| 甘肃省| 库车县| 蛟河市| 海林市| 嘉禾县| 安乡县| 唐河县| 东海县| 东乡族自治县| 天津市| 织金县| 福建省| 阜宁县| 云龙县| 辽阳县| 阿拉尔市| 宁津县| 阳泉市| 怀仁县| 阿城市|