日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU如何克服負(fù)載計(jì)算工作量提升帶來(lái)的挑戰(zhàn)

lPCU_elecfans ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:電子發(fā)燒友網(wǎng) ? 2022-10-09 09:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))在AI和大數(shù)據(jù)時(shí)代到來(lái)之后,GPU單兵作戰(zhàn)就變成了奢望,以現(xiàn)在的數(shù)據(jù)中心和超算為例,動(dòng)輒就是成千上萬(wàn)張GPU,龐大的GPU網(wǎng)絡(luò)在交換機(jī)和光模塊的支持下代表了這個(gè)計(jì)算時(shí)代下最高的算力。但并非只有數(shù)據(jù)中心和超算里的GPU才需要這樣的擴(kuò)展性,嵌入式GPU和專業(yè)GPU同樣如此。

物理限制的嵌入式GPU隨著各種傳感器的性能持續(xù)走高,譬如多線激光雷達(dá)、高分辨率的圖像傳感器等,我們對(duì)邊緣計(jì)算單元尤其是GPU的需求也在持續(xù)增加。但在實(shí)現(xiàn)的過(guò)程中,我們還有一些物理限制沒(méi)法消除,像是尺寸、重量和功耗等。

為了解決這一系列問(wèn)題,美國(guó)政府和行業(yè)方案提供商們成立了SOSA聯(lián)盟,以求開發(fā)開放的標(biāo)準(zhǔn)和最好的方案來(lái)實(shí)現(xiàn)高性價(jià)比、互操作性強(qiáng)的傳感器系統(tǒng)。如何克服這些負(fù)載計(jì)算工作量提升帶來(lái)的挑戰(zhàn),又能不增加寶貴的物理資源呢?答案自然還是將GPU、DPU等技術(shù)集成到嵌入式結(jié)構(gòu)中去。

這類嵌入式GPU并非用來(lái)單獨(dú)售賣,而是交給合作伙伴整合到不同的邊緣計(jì)算系統(tǒng)中,比如研華、凌華、EIZO、Mercury Systems等,然后交付給美國(guó)空軍、洛克希德·馬丁這類軍事、航空、工業(yè)客戶。

即便選擇了嵌入式結(jié)構(gòu),也還有著不少的路線,比如GPU、FPGAASIC等等。SOSA聯(lián)盟主席,來(lái)自美國(guó)空軍的Ilya Lipkin表示,如果想要更快的運(yùn)行速度,快速部署軟件,自然是選擇GPU最好。但他們也面臨著空間的問(wèn)題,因?yàn)榍度胧紾PU往往會(huì)被塞到3U或者6U的服務(wù)器里,他們想要做到更小的體積,甚至是手掌大小,可這樣一來(lái)就不得不犧牲帶寬、容量。

所以,雖然嵌入式GPU仍然在這些嵌入式傳感系統(tǒng)中可以保持領(lǐng)先地位,但他們并沒(méi)有像獲得數(shù)據(jù)中心那樣不算嚴(yán)格的空間要求。目前的MXM嵌入式GPU可以做到PCIe GPU五分之一的尺寸,但這對(duì)于嵌入式GPU的擴(kuò)展性來(lái)說(shuō)還不算完美。在邊緣計(jì)算上,反倒是一些FPGA和ASIC方案在能耗比和擴(kuò)展性上占優(yōu),如果嵌入式GPU不能做到更強(qiáng)大的擴(kuò)展性,很有可能會(huì)被后來(lái)者顛覆。

顯卡交火時(shí)代的結(jié)束不管是最新發(fā)布的RTX4090消費(fèi)級(jí)顯卡,還是RTX 6000這樣的專業(yè)顯卡,都象征了英偉達(dá)在新架構(gòu)GPU上的又一次創(chuàng)新。在臺(tái)積電4N工藝的加持下,無(wú)論是晶體管數(shù)目還是CUDA核心都做到了極致。

然而,原本變成了專屬英偉達(dá)高端消費(fèi)顯卡和專業(yè)顯卡的交火技術(shù)NVLink,在RTX4090和RTX 6000上卻無(wú)處可尋,難不成英偉達(dá)徹底放棄顯卡交火技術(shù),也就此放棄NVLink了?根據(jù)英偉達(dá)CEO黃仁勛的說(shuō)法,他們省下了NVLink連接器的空間,釋放了更多的空間來(lái)處理更多的AI計(jì)算。

在上一代顯卡的NVLink中,通過(guò)連接兩塊英偉達(dá)顯卡,使用高端顯卡和專業(yè)顯卡的專業(yè)系統(tǒng)能夠獲得更高的帶寬和雙倍的顯存容量。這樣的提升對(duì)于個(gè)人或?qū)I(yè)用戶來(lái)說(shuō)是極大的提升,那么為何英偉達(dá)會(huì)放棄NVLink呢?筆者也在英偉達(dá)GTC的一次分享會(huì)議上提出了這一問(wèn)題。

英偉達(dá)方面表示,就RTX 6000這類專業(yè)顯卡而言,他們?nèi)∠鸑VLink后省下了足夠的空間,塞入了更多的計(jì)算單元來(lái)提升單卡的性能。與此同時(shí),雖然這些專業(yè)顯卡的NVLink支持被取消,不代表英偉達(dá)放棄了這一技術(shù)。英偉達(dá)決心將NVLink的重心放在數(shù)據(jù)中心產(chǎn)品上,比如Grace CPU、Hopper GPU,他們通過(guò)NVLink Die to Die和Chip to Chip的互聯(lián)可以實(shí)現(xiàn)更好的擴(kuò)展性。

但這確實(shí)象征著一個(gè)時(shí)代的結(jié)束,過(guò)去AMD的交火和英偉達(dá)的SLI也是兩家競(jìng)爭(zhēng)最火熱的一項(xiàng)技術(shù),可隨著AMD放棄了交火支持,英偉達(dá)的SLI在換成NVLink后如今也迎來(lái)了終結(jié)。

但顯卡交火的落幕也情有可原,且不說(shuō)這種互聯(lián)方式的受眾群體一再變少,要想享受到顯卡交火的性能也需要軟件追加更新支持?;蛟S專業(yè)顯卡的目標(biāo)還是追求單卡性能就好,多卡互聯(lián)的支持還是讓給數(shù)據(jù)中心吧。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2578

    文章

    55679

    瀏覽量

    794709
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5301

    瀏覽量

    136144
  • 顯卡
    +關(guān)注

    關(guān)注

    17

    文章

    2523

    瀏覽量

    71746
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41605

    瀏覽量

    302887

原文標(biāo)題:GPU在不同形態(tài)下的擴(kuò)展性問(wèn)題

文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    成功案例:象帝先計(jì)算技術(shù)與Imagination合作——面向現(xiàn)代圖形與計(jì)算工作負(fù)載的專業(yè)GPU

    為專業(yè)計(jì)算設(shè)計(jì)桌面GPU桌面GPU不僅用于游戲,還能加速?gòu)膶I(yè)可視化、高級(jí)模擬到數(shù)據(jù)密集型計(jì)算在內(nèi)的多種現(xiàn)代工作
    的頭像 發(fā)表于 03-09 09:17 ?517次閱讀
    成功案例:象帝先<b class='flag-5'>計(jì)算</b>技術(shù)與Imagination合作——面向現(xiàn)代圖形與<b class='flag-5'>計(jì)算</b><b class='flag-5'>工作</b><b class='flag-5'>負(fù)載</b>的專業(yè)<b class='flag-5'>GPU</b>

    展望2026存儲(chǔ)產(chǎn)業(yè)趨勢(shì):SSD將成AI性能提升關(guān)鍵

    AI和高性能計(jì)算的發(fā)展,正迎來(lái)關(guān)鍵轉(zhuǎn)折點(diǎn)。業(yè)界仍在孜孜不倦地追求GPU的強(qiáng)大性能,在這種情況下,存儲(chǔ)解決方案必須緊跟步伐,應(yīng)對(duì)日益先進(jìn)的計(jì)算工作負(fù)載
    的頭像 發(fā)表于 02-26 16:48 ?770次閱讀

    彈性負(fù)載均衡:現(xiàn)代 IT 架構(gòu)的高可用與高并發(fā)基石

    IT架構(gòu)中不可或缺的關(guān)鍵組件,負(fù)載均衡通過(guò)在網(wǎng)絡(luò)環(huán)境中智能分散工作負(fù)載,有效提高系統(tǒng)的響應(yīng)速度、吞吐與可靠性,尤其在大型分布式系統(tǒng)和云計(jì)算
    的頭像 發(fā)表于 01-20 09:58 ?309次閱讀
    彈性<b class='flag-5'>負(fù)載</b>均衡:現(xiàn)代 IT 架構(gòu)的高可用與高并發(fā)基石

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)

    需求進(jìn)行了優(yōu)化設(shè)計(jì)。無(wú)論是 CUDA 核心計(jì)算性能、實(shí)時(shí)渲染能力,還是 AI 推理效率,亦或顯存帶寬與容量的顯著提升,均使得新一代 RTX PRO 5000 Blackwell GPU 能夠輕松應(yīng)對(duì)更復(fù)雜、更嚴(yán)苛的
    的頭像 發(fā)表于 01-06 09:51 ?4574次閱讀
    NVIDIA RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度評(píng)測(cè)

    Arm架構(gòu)助力Azure Cobalt 100虛擬機(jī)工作負(fù)載性能提升

    的 32 個(gè)地區(qū)上線,并且持續(xù)快速擴(kuò)展,為新一代數(shù)據(jù)中心工作負(fù)載帶來(lái)了性能、能效和可擴(kuò)展性的大幅提升。這些提升源于專為賦能現(xiàn)代云原生應(yīng)用設(shè)計(jì)
    的頭像 發(fā)表于 12-15 14:42 ?862次閱讀
    Arm架構(gòu)助力Azure Cobalt 100虛擬機(jī)<b class='flag-5'>工作</b><b class='flag-5'>負(fù)載</b>性能<b class='flag-5'>提升</b>

    汽車中的GPU是如何使用的?

    (HMI)的發(fā)展尤為迅猛。隨著電子電氣架構(gòu)(EEA)的集中化,車輛對(duì)高性能計(jì)算能力的需求顯著提升,GPU(圖形處理單元)的靈活性、可擴(kuò)展性以及高效并行計(jì)算能力,使其成為支持這些創(chuàng)新應(yīng)用
    的頭像 發(fā)表于 12-03 14:45 ?9736次閱讀
    汽車中的<b class='flag-5'>GPU</b>是如何使用的?

    如何通過(guò)交替式幾何處理實(shí)現(xiàn)更優(yōu)的多核?GPU?擴(kuò)展

    在理論上,通過(guò)增加更多GPU核心來(lái)提升性能似乎很簡(jiǎn)單:核心越多,性能越強(qiáng)。但在實(shí)踐中,這是圖形架構(gòu)領(lǐng)域最棘手的挑戰(zhàn)之一。雖然某些工作負(fù)載因其
    的頭像 發(fā)表于 12-01 10:12 ?821次閱讀
    如何通過(guò)交替式幾何處理實(shí)現(xiàn)更優(yōu)的多核?<b class='flag-5'>GPU</b>?擴(kuò)展

    【產(chǎn)品介紹】Altair PBS Professional HPC工作負(fù)載管理器和作業(yè)調(diào)度管理系統(tǒng)

    ,并簡(jiǎn)化集群、云和超級(jí)計(jì)算機(jī)的管理——從最大的高性能計(jì)算(HPC)工作負(fù)載到數(shù)百萬(wàn)個(gè)小型、高吞吐作業(yè)。借助動(dòng)態(tài)策略、AI
    的頭像 發(fā)表于 09-19 17:03 ?853次閱讀
    【產(chǎn)品介紹】Altair PBS Professional HPC<b class='flag-5'>工作</b><b class='flag-5'>負(fù)載</b>管理器和作業(yè)調(diào)度管理系統(tǒng)

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    工作嗎? 從書中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。 其他的還是知道的,F(xiàn)PGA屬于AI芯片這個(gè)真不知道,以為它是數(shù)字芯片的,不曉得屬于AI芯片。 本節(jié)還詳細(xì)
    發(fā)表于 09-12 16:07

    如何加速實(shí)時(shí)工作負(fù)載

    對(duì)于需要實(shí)時(shí)響應(yīng)的數(shù)據(jù)中心工作負(fù)載,性能不僅是指原始吞吐或處理能力。挑戰(zhàn)在于:在保持吞吐和能效的同時(shí),實(shí)現(xiàn)確定性時(shí)延。
    的頭像 發(fā)表于 09-10 15:36 ?843次閱讀

    樹莓派5超頻指南:安全高效地提升性能!

    為什么要對(duì)樹莓派5進(jìn)行超頻?對(duì)樹莓派進(jìn)行超頻,可通過(guò)提高CPU和GPU的時(shí)鐘頻率來(lái)釋放額外的性能。在需要額外處理能力以提高響應(yīng)速度、減少延遲或處理更繁重工作負(fù)載的場(chǎng)景中,超頻尤其有益。性能提升
    的頭像 發(fā)表于 08-14 17:45 ?2961次閱讀
    樹莓派5超頻指南:安全高效地<b class='flag-5'>提升</b>性能!

    如何在多顯卡環(huán)境下配置OLLAMA實(shí)現(xiàn)GPU負(fù)載均衡

    本文將帶你深入了解如何在多顯卡環(huán)境下配置OLLAMA,實(shí)現(xiàn)GPU負(fù)載均衡,并分享生產(chǎn)環(huán)境中的最佳實(shí)踐。無(wú)論你是剛接觸GPU集群還是尋求性能優(yōu)化的老手,這篇文章都能給你帶來(lái)實(shí)用價(jià)值。
    的頭像 發(fā)表于 07-24 14:12 ?5108次閱讀

    別讓 GPU 故障拖后腿,捷智算GPU維修室來(lái)救場(chǎng)!

    在AI浪潮洶涌的當(dāng)下,GPU已然成為眾多企業(yè)與科研機(jī)構(gòu)的核心生產(chǎn)力。從深度學(xué)習(xí)模型訓(xùn)練,到影視渲染、復(fù)雜科學(xué)計(jì)算,GPU憑借強(qiáng)大并行計(jì)算能力,極大
    的頭像 發(fā)表于 07-17 18:56 ?1353次閱讀
    別讓 <b class='flag-5'>GPU</b> 故障拖后腿,捷智算<b class='flag-5'>GPU</b>維修室來(lái)救場(chǎng)!

    大模型推理顯存和計(jì)算估計(jì)方法研究

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)大模型在各個(gè)領(lǐng)域得到了廣泛應(yīng)用。然而,大模型的推理過(guò)程對(duì)顯存和計(jì)算資源的需求較高,給實(shí)際應(yīng)用帶來(lái)挑戰(zhàn)。為了解決這一問(wèn)題,本文將探討大模型推理顯存和計(jì)算
    發(fā)表于 07-03 19:43

    交流充電樁負(fù)載能效提升技術(shù)

    隨著電動(dòng)汽車普及率提升,交流充電樁的能效優(yōu)化成為降低運(yùn)營(yíng)成本、減少能源浪費(fèi)的核心課題。負(fù)載能效提升需從硬件設(shè)計(jì)、拓?fù)鋬?yōu)化、智能控制及熱管理等多維度展開,以下結(jié)合技術(shù)原理與實(shí)踐方案進(jìn)行闡述。 一、高效
    發(fā)表于 05-21 14:38
    安福县| 龙海市| 安塞县| 许昌市| 玉龙| 德惠市| 平遥县| 赫章县| 名山县| 汉寿县| 仙居县| 奈曼旗| 福贡县| 延庆县| 靖江市| 那曲县| 长阳| 馆陶县| 临城县| 永年县| 五原县| 南开区| 河北区| 马边| 永年县| 周至县| 昭通市| 城口县| 望奎县| 桦南县| 泊头市| 临颍县| 乃东县| 庆元县| 乐东| 沙河市| 阿城市| 商城县| 合作市| 鸡泽县| 安图县|