日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

釋放GPU的處理潛力

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:DUNCAN YOUNG ? 2022-11-07 15:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

高性能圖形處理單元 (GPU) 的內(nèi)部計(jì)算架構(gòu)已從固定功能圖形執(zhí)行單元發(fā)展為完全可編程的單指令多數(shù)據(jù) (SIMD) 處理器陣列。這種演變是由視頻游戲社區(qū)的需求推動(dòng)的,即并行執(zhí)行通用物理計(jì)算,以使煙霧、碎片、火災(zāi)和流體等行為更加逼真。將這些相同類型的重復(fù)并行計(jì)算卸載和加速到 GPU 上的能力為雷達(dá)、聲納和圖像處理等軍事技術(shù)提供了巨大的潛力。高效實(shí)施的關(guān)鍵是新一代工具,如 OpenCL 和 CUDA,它們集成了跨異構(gòu) CPU/GPU 架構(gòu)的代碼開發(fā)以及支持它們的內(nèi)存和 I/O 帶寬。

單邊處理光線

高性能 GPU 設(shè)備的核心通常具有多達(dá) 128 個(gè) 32 位單精度處理器內(nèi)核,主頻為 1 GHz 或更高。它們被組織為并行 SIMD 陣列,以便處理器組可以在不同的數(shù)據(jù)集上并行執(zhí)行相同的指令。作為 GPU 運(yùn)行時(shí),主要要求是利用動(dòng)畫 3D 圖形功能,例如著色器。然而,GPU 正在從特定的著色器處理器演變而成為更通用的數(shù)學(xué)處理器,現(xiàn)在稱為“流處理器”。借助正確的工具,GPU 可以更廣泛地應(yīng)用于加速多種基于 PC 的應(yīng)用程序,例如基因研究、地震處理、氣象處理和 DSP,其成本遠(yuǎn)低于其他更具體的硬件加速形式。

一家主要的GPU制造商N(yùn)VIDIA開發(fā)了一種稱為CUDA的軟件環(huán)境,以將GPU的潛力釋放到這些其他應(yīng)用領(lǐng)域。CUDA 通過允許通過隱藏 GPU 流處理器及其與 CPU 接口的抽象函數(shù)庫進(jìn)行內(nèi)聯(lián) C 代碼開發(fā)來支持 CPU 和 GPU 的組合。這提供了一個(gè)非常靈活的編程接口,并允許將來對(duì)流處理器進(jìn)行增長甚至根本性更改,而不會(huì)影響現(xiàn)有代碼。為了減少錯(cuò)誤的范圍,CUDA 采用簡(jiǎn)單的編程模型,在內(nèi)部管理多個(gè)線程以優(yōu)化處理器利用率,因此無需編寫顯式線程代碼。

沒有圖形的圖形 GPU

矛盾的是,會(huì)有一類嵌入式應(yīng)用程序根本不會(huì)生成任何本地圖形輸出。通常,此類可能包括無人機(jī)或水下遙控車輛(ROV)或許多其他類型的無人傳感器中的圖像處理。具有 GPU 的嵌入式 PC 成為圖像增強(qiáng)、穩(wěn)定、模式識(shí)別、目標(biāo)跟蹤、視頻編碼或加密/解密的理想平臺(tái)。這些都是可以用常規(guī) C 代碼編寫以在高性能 PC 上運(yùn)行的應(yīng)用程序,但可以通過 GPU 流處理器加速以運(yùn)行速度快幾個(gè)數(shù)量級(jí)。GPU 提供已經(jīng)集成到許多 PC 配置中的通用并行處理,并且通過使用現(xiàn)成的工具(如 CUDA、MathWorksMATLAB 和移植的 VSIPL DSP 庫)來構(gòu)建、測(cè)試和驗(yàn)證應(yīng)用程序,需要的專業(yè)技能低于 FPGA 開發(fā)。

PCI Express 是性能的關(guān)鍵

嵌入式傳感器處理應(yīng)用需要高數(shù)據(jù)帶寬來接收和處理連續(xù)的傳入原始圖像數(shù)據(jù)流。CUDA 處理多線程并因此最大化 GPU SIMD 陣列的處理負(fù)載的能力取決于外部接口及其本地內(nèi)存接口的性能。高端GPU設(shè)備將使用16通道PCI Express 2.0,是早期PCI Express 1.0數(shù)據(jù)速率的兩倍,理論上每通道500 MBps。對(duì)于堅(jiān)固耐用的嵌入式應(yīng)用,這非常適合VPX (ANSI/VITA 46)封裝標(biāo)準(zhǔn)的流行3U和6U格式,并具有擴(kuò)展的高速連接性。GE Fanuc Intelligent Platforms的MAGIC1強(qiáng)固型嵌入式PC(如圖1所示)基于3U VPX外形,并經(jīng)過重新設(shè)計(jì)和增強(qiáng),以支持NVIDIA支持CUDA的GPU。雖然這種嵌入式PC非常適合3U格式,但6U配置文件還具有空間和更大的連接性,有可能基于許多多核處理器和GPU使用PCI Express 2.0作為互連的新型強(qiáng)大多計(jì)算引擎。

GPU 正在迅速發(fā)展,創(chuàng)造了一種處理能力,可在許多不同的市場(chǎng)中得到廣泛的應(yīng)用。CUDA 和類似的開發(fā)環(huán)境提供了對(duì)這種未開發(fā)性能儲(chǔ)備的可訪問性。因此,堅(jiān)固耐用的軍事和航空航天領(lǐng)域似乎將改變復(fù)雜、耗時(shí)的傳感器應(yīng)用的開發(fā)、測(cè)試、驗(yàn)證和成功部署方式。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20339

    瀏覽量

    255356
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5283

    瀏覽量

    136105
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    壁仞科技壁礪166系列GPU產(chǎn)品率先支持DeepSeek-V4模型

    完成DeepSeek-V4在旗艦通用GPU壁礪166系列產(chǎn)品的適配驗(yàn)證與優(yōu)化,充分釋放產(chǎn)品算力密度與帶寬優(yōu)勢(shì),全面賦能GenAI推理加速。
    的頭像 發(fā)表于 04-28 14:04 ?735次閱讀
    壁仞科技壁礪166系列<b class='flag-5'>GPU</b>產(chǎn)品率先支持DeepSeek-V4模型

    GPU負(fù)重前行:一組實(shí)驗(yàn)看懂視頻色彩空間轉(zhuǎn)換的真相

    處理海量圖形數(shù)據(jù)。視頻處理涉及解碼、編碼、轉(zhuǎn)碼、特效、渲染等重負(fù)載任務(wù),傳統(tǒng)CPU逐個(gè)處理效率低下,GPU通過硬件加速釋放CPU資源,成為視
    的頭像 發(fā)表于 04-17 11:35 ?116次閱讀
    <b class='flag-5'>GPU</b>負(fù)重前行:一組實(shí)驗(yàn)看懂視頻色彩空間轉(zhuǎn)換的真相

    如何在 VisionFive v2 上使用外部 GPU?

    如果舊的 amd gpu 在 VisionFive V2 上運(yùn)行,我想使用帶有開源 amd 驅(qū)動(dòng)程序的 amd gpu。我需要什么以及如何將 GPU 連接到 VisionFive v2?
    發(fā)表于 03-13 06:38

    借助NVIDIA CUDA Tile IR后端推進(jìn)OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計(jì)目標(biāo)是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的一大優(yōu)勢(shì)是允許開發(fā)者基于其構(gòu)建自定義的 DS
    的頭像 發(fā)表于 02-10 10:31 ?552次閱讀

    恩智浦全新S32N7處理釋放軟件定義汽車(SDV)的全部潛力

    · S32N7處理器系列實(shí)現(xiàn)核心車輛功能的全面數(shù)字化和集中化 · 汽車制造商能夠降低系統(tǒng)復(fù)雜性,并在整個(gè)車隊(duì)釋放AI驅(qū)動(dòng)的創(chuàng)新潛力 · 博世率先在其車輛集成平臺(tái)中部署S32N7 拉斯維加斯國際消費(fèi)
    的頭像 發(fā)表于 01-19 17:06 ?6.6w次閱讀
    恩智浦全新S32N7<b class='flag-5'>處理</b>器<b class='flag-5'>釋放</b>軟件定義汽車(SDV)的全部<b class='flag-5'>潛力</b>

    汽車中的GPU是如何使用的?

    (HMI)的發(fā)展尤為迅猛。隨著電子電氣架構(gòu)(EEA)的集中化,車輛對(duì)高性能計(jì)算能力的需求顯著提升,GPU(圖形處理單元)的靈活性、可擴(kuò)展性以及高效并行計(jì)算能力,使其成為支持這些創(chuàng)新應(yīng)用的核心組件
    的頭像 發(fā)表于 12-03 14:45 ?9726次閱讀
    汽車中的<b class='flag-5'>GPU</b>是如何使用的?

    如何通過交替式幾何處理實(shí)現(xiàn)更優(yōu)的多核?GPU?擴(kuò)展

    在理論上,通過增加更多GPU核心來提升性能似乎很簡(jiǎn)單:核心越多,性能越強(qiáng)。但在實(shí)踐中,這是圖形架構(gòu)領(lǐng)域最棘手的挑戰(zhàn)之一。雖然某些工作負(fù)載因其獨(dú)立特性能實(shí)現(xiàn)良好擴(kuò)展,但另一些工作負(fù)載(尤其是幾何處理
    的頭像 發(fā)表于 12-01 10:12 ?805次閱讀
    如何通過交替式幾何<b class='flag-5'>處理</b>實(shí)現(xiàn)更優(yōu)的多核?<b class='flag-5'>GPU</b>?擴(kuò)展

    戴爾科技PowerStore如何釋放QLC閃存全部潛力

    轉(zhuǎn)眼間,QLC SSD問世已有幾個(gè)年頭,從問世之初被質(zhì)疑的“短命鬼”,到如今市場(chǎng)的又一大主流選擇,QLC和它的前輩們一樣,在批判中前進(jìn),在螺旋中上升。
    的頭像 發(fā)表于 11-30 09:25 ?812次閱讀

    基于米爾RK3576的環(huán)視實(shí)時(shí)性方案解析

    ,造成嚴(yán)重卡頓和延遲,也使得CPU再無余力處理其他系統(tǒng)任務(wù),此方案不具備產(chǎn)品化價(jià)值。GPU方案:潛力巨大,穩(wěn)定性是當(dāng)前關(guān)鍵瓶頸卓越的算力體現(xiàn): 在畸變矯正和投影變換環(huán)節(jié),Mali-G52 GP
    發(fā)表于 11-28 16:57

    Dell PowerScale助力企業(yè)充分釋放GPU投資價(jià)值

    盡管算力層面的“軍備競(jìng)賽”仍在持續(xù)加劇,但隨著GPU集群規(guī)模擴(kuò)展至數(shù)千臺(tái)服務(wù)器,存力作為支撐算力持續(xù)運(yùn)行的關(guān)鍵要素,已獲得與算力同等重要的戰(zhàn)略地位。
    的頭像 發(fā)表于 11-06 09:06 ?864次閱讀

    摩爾線程吳慶詳解 MUSA 軟件棧:以技術(shù)創(chuàng)新釋放 KUAE 集群潛能,引領(lǐng) GPU 計(jì)算新高度?

    的分享。GPU 計(jì)算軟件開發(fā)總監(jiān)吳慶登上講臺(tái),發(fā)表了題為《摩爾線程 MUSA 軟件棧助力 KUAE 集群釋放無限潛能》的演講。他從專業(yè)視角出發(fā),為在場(chǎng)聽眾深入剖析了 MUSA 軟件棧在驅(qū)動(dòng) KUAE 集群高效運(yùn)轉(zhuǎn)方面的核心技術(shù)與創(chuàng)新成果。 ? 摩爾線程
    的頭像 發(fā)表于 07-28 13:47 ?6474次閱讀
    摩爾線程吳慶詳解 MUSA 軟件棧:以技術(shù)創(chuàng)新<b class='flag-5'>釋放</b> KUAE 集群潛能,引領(lǐng) <b class='flag-5'>GPU</b> 計(jì)算新高度?

    aicube的n卡gpu索引該如何添加?

    請(qǐng)問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當(dāng)還是只能看到默認(rèn)的gpu0,顯示不了gpu1
    發(fā)表于 07-25 08:18

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計(jì)算的進(jìn)化之路圖形處理單元(GPU),作為現(xiàn)代計(jì)算機(jī)中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)
    的頭像 發(fā)表于 05-30 10:36 ?2048次閱讀
    <b class='flag-5'>GPU</b>架構(gòu)深度解析

    ARM Mali GPU 深度解讀

    ARM Mali GPU 深度解讀 ARM Mali 是 Arm 公司面向移動(dòng)設(shè)備、嵌入式系統(tǒng)和基礎(chǔ)設(shè)施市場(chǎng)設(shè)計(jì)的圖形處理器(GPU)IP 核,憑借其異構(gòu)計(jì)算架構(gòu)、能效優(yōu)化和生態(tài)協(xié)同,成為全球移動(dòng)
    的頭像 發(fā)表于 05-29 10:12 ?5016次閱讀
    新邵县| 遂昌县| 桃源县| 乐陵市| 德清县| 稷山县| 堆龙德庆县| 陈巴尔虎旗| 独山县| 东光县| 宁阳县| 灵寿县| 贺州市| 浠水县| 分宜县| 平利县| 永善县| 双城市| 连山| 神木县| 台江县| 怀柔区| 司法| 盘锦市| 古丈县| 桐柏县| 隆昌县| 郧西县| 栾城县| 泰和县| 阿尔山市| 阿坝| 清徐县| 通河县| 瑞丽市| 沈丘县| 资兴市| 沧州市| 开封市| 中阳县| 城市|