日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

美國正在開發(fā)用于圖處理的下一代ASIC

我快閉嘴 ? 來源:半導(dǎo)體行業(yè)觀察 ? 作者:David Schor ? 2020-09-28 15:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

現(xiàn)代微處理器通常能夠通過分層緩存來隱藏計算與內(nèi)存之間的大部分差距。這是因為許多負載表現(xiàn)出相對可預(yù)測的一般內(nèi)存模式,可以通過空間局部性和時間局部性加以利用。有些負載還尷尬地并行。例如,人工智能負載往往表現(xiàn)出這種行為。只要你持續(xù)為機器提供數(shù)據(jù),更多計算就相當于更高性能。人工智能負載往往具有非常可預(yù)測的內(nèi)存模式以及較高的數(shù)據(jù)重新利用能力,這有助于實現(xiàn)上述所有目標。

不幸的是,并非所有算法都具有這些理想的特性。圖就是這樣一個例子。企業(yè)廣泛地使用圖來處理大數(shù)據(jù)。這些數(shù)據(jù)結(jié)構(gòu)往往有上萬億個邊緣,并采用特殊的圖算法對數(shù)據(jù)進行操作。圖算法采用非常隨機的內(nèi)存訪問模式,導(dǎo)致負載受到內(nèi)存延遲的高度限制,迫使計算元素在很多時候陷入停滯。它本質(zhì)上是一個非常大的指針追逐問題,表現(xiàn)出與運行在GPUCPU上的大多數(shù)負載相矛盾的行為。

更糟的是,圖算法往往具有非常差的次線性縮放特性。你根本無法通過投入更多處理器來解決這個問題。由于數(shù)據(jù)的稀疏性和不規(guī)則性,下一個數(shù)據(jù)訪問通常是在一個完全不同的節(jié)點上,傳輸數(shù)據(jù)最終會導(dǎo)致整個系統(tǒng)出現(xiàn)瓶頸。

美國國防部分層識別驗證及利用計劃(DARPA HIVE)

分層識別驗證及利用(HIVE)計劃是美國國防部正在開展的一項計劃,目標是解決這些缺點。HIVE采用軟硬件雙管齊下的方式。針對該計劃的硬件部分,正在開發(fā)用于圖處理的下一代ASIC。針對軟件部分,正在開發(fā)一個新的全棧圖框架。美國國防部希望通過專門的圖處理器和優(yōu)化的軟件棧,實現(xiàn)比當前同類最佳的GPU高1000倍的性能效率。

在上個月底舉行的DARPA ERI峰會上,Peter Wang介紹了該項目的最新進展。Wang是Anaconda公司的聯(lián)合創(chuàng)始人兼首席技術(shù)官。他也是HIVE軟件架構(gòu)的首席研究員。

介紹英特爾PUMA團隊

英特爾負責HIVE的硬件架構(gòu)部分,他們正在開發(fā)一個新的架構(gòu)來解決這些問題。在英特爾的數(shù)據(jù)中心事業(yè)部內(nèi)部有一個名為PUMA的秘密團隊。他們負責圖分析(GA)處理器的開發(fā)。這是他們正在秘密開發(fā)的一個完整產(chǎn)品,英特爾打算最終將其商業(yè)化。

新的圖處理器基于一種新開發(fā)的架構(gòu),被稱為可編程統(tǒng)一內(nèi)存架構(gòu)或PUMA。這是一種新的架構(gòu),用于整個全局統(tǒng)一內(nèi)存空間的小型不規(guī)則內(nèi)存訪問。在這種架構(gòu)下,芯片放棄了現(xiàn)代CPU和GPU所使用的許多基本假設(shè)——它并不假設(shè)自己擁有附近所有內(nèi)存,它并不假設(shè)內(nèi)存訪問會在不久的將來重復(fù)執(zhí)行,它也不假設(shè)對特定地址的內(nèi)存訪問意味著附近的內(nèi)存地址也將被訪問。Wong說:“通過拋棄這些基本假設(shè),你可以圍繞對全局統(tǒng)一數(shù)據(jù)的小訪問而構(gòu)建一個完全不同的硬件架構(gòu)。然后,在每個階段,每當有一個有線互聯(lián)或者任何把一個計算單元連接到其它一些數(shù)據(jù)單元或其它計算單元的東西,每一個點都針對延遲進了優(yōu)化。” PUMA從根本上改變了與內(nèi)存訪問相關(guān)的行為,使內(nèi)存訪問更小、更有效,并使訪問這些內(nèi)存的延遲更長,但在整個系統(tǒng)中實現(xiàn)扁平化。

PUMA實現(xiàn)機箱級完全集成,可以跨處理元件和內(nèi)存進行良好的通信。它旨在擴展到大型系統(tǒng),在多個機架和多個集群上使用。

Wang根據(jù)英特爾的內(nèi)部模擬結(jié)果給出了一些初步性能數(shù)據(jù)。他說:“節(jié)點縮放確實是一個關(guān)鍵問題。當我們討論上萬億個邊緣的時候,我們知道這些數(shù)字會變得更大?!睘榇?,Wang報告了超過80%的縮放效率。他補充道:“這實際上讓我們能夠并行化解決圖問題的方法。”

軟件基礎(chǔ)設(shè)施

HIVE的第二階段是構(gòu)建軟件基礎(chǔ)設(shè)施。新軟件不僅必須與新硬件兼容,而且必須與現(xiàn)有CPU和GPU兼容。此外,新軟件必須支持數(shù)據(jù)科學(xué)屆使用的大量現(xiàn)有軟件?,F(xiàn)有的大量軟件都是為了以某種方式解決特定的圖問題而開發(fā)的。該計劃的部分目標是能夠?qū)F(xiàn)有的軟件和庫連接到HIVE軟件框架中,以便使其更易于投入使用。

當前的軟件包括通過API公開的算法、數(shù)據(jù)的內(nèi)部圖表示以及硬件后端(GPU、CPU、FPGA或ASIC)。Wang解釋說,在當前平臺下,必須做出重大取舍,無論是針對某種類型的硬件進行優(yōu)化還是針對某些算法進行優(yōu)化。Wang說: “如果你專門從事圖表示,那么你就會與數(shù)據(jù)科學(xué)生態(tài)系統(tǒng)脫節(jié),因為你被切斷了與一些重要庫的聯(lián)系。”

作為HIVE第二階段一部分,他們正在開發(fā)模塊化架構(gòu)框架?,F(xiàn)有軟件正在重新納入它們的組成部分,以便可以根據(jù)該軟件最佳功能將其插入到框架中。該結(jié)構(gòu)包括Workflow Scheduler和Dispatch Engine,用于把User API負載任務(wù)路由到后端。他們利用DASK任務(wù)調(diào)度程序來執(zhí)行此操作。這也是他們進行后端切換和調(diào)度的方式。順便說一句,值得注意的是,雖然他們正在與英特爾密切合作,共同開發(fā)這個框架,以便能夠通過PUMA架構(gòu)實現(xiàn)其性能目標,但是軟件框架并不是專門為PUMA設(shè)計的。事實上,它們完全針對廣泛的硬件,以便數(shù)據(jù)科學(xué)家立即能夠跨越CPU、GPU和FPGA,充分利用相同的軟件基礎(chǔ)設(shè)施。并最終使用相同的基礎(chǔ)架構(gòu),利用PUMA圖處理器來加速相同的負載。

值得一提的是,如果有必要,在后端,框架可包含一組能夠轉(zhuǎn)換不同格式數(shù)據(jù)的轉(zhuǎn)換器。

這種設(shè)計有兩大好處——集成新硬件意味著設(shè)計了一個新的硬件后端,如果數(shù)據(jù)模型與現(xiàn)有模型不同,則添加對數(shù)據(jù)模型的支持,并添加一個可以從現(xiàn)有數(shù)據(jù)模型轉(zhuǎn)換到新數(shù)據(jù)模型的轉(zhuǎn)換器。同樣,集成一個新的User API只需要在其中一個硬件上添加一個接口并至少采用一種算法。

最終,HIVE的總體目標就是統(tǒng)一和簡化“讓圖軟件與硬件進行優(yōu)化通信的”流程,只需讓硬件廠商提供其硬件并為其集成一個良好的后端,同時讓數(shù)據(jù)科學(xué)家能夠通過自己的API和算法來充分利用該硬件。

Wang透露,從明年開始,用戶有望看到開源的初始源代碼。
責任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1664

    文章

    22525

    瀏覽量

    639907
  • asic
    +關(guān)注

    關(guān)注

    34

    文章

    1278

    瀏覽量

    125023
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11346

    瀏覽量

    226127
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5298

    瀏覽量

    136135
  • 微處理器
    +關(guān)注

    關(guān)注

    11

    文章

    2440

    瀏覽量

    86215
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    嘉楠科技助力Tether開發(fā)下一代浸沒式冷卻礦機與計算系統(tǒng)

    算力板模塊(以下簡稱"模塊")。該模塊由嘉楠科技定制開發(fā),用于支持Tether下一代浸沒式冷卻礦機與計算系統(tǒng)。
    的頭像 發(fā)表于 05-09 09:29 ?370次閱讀

    電裝戰(zhàn)略注資NCT并攜手開發(fā)下一代高效能電機

    近日,電裝株式會社(以下簡稱“電裝”)正式宣布,已完成對Next Core Technologies株式會社(以下簡稱“NCT”)的注資,雙方將圍繞電機鐵芯*1領(lǐng)域共同開發(fā),并聚焦關(guān)鍵材料——鐵基非晶系合金*2的產(chǎn)業(yè)化應(yīng)用,旨在進步強化
    的頭像 發(fā)表于 04-29 10:11 ?182次閱讀

    IRP6VRM1:下一代處理器DC/DC轉(zhuǎn)換器的理想之選

    ,它為下一代處理器的DC/DC轉(zhuǎn)換器設(shè)計提供了站式的解決方案。 文件下載: IRP6VRM1-EV.pdf 產(chǎn)品概述 IRP6VRM1采用了200kHz同步降壓調(diào)節(jié)器拓撲結(jié)構(gòu),能夠?qū)崿F(xiàn)出色的效率,同時具備快速的負載響應(yīng)和精確
    的頭像 發(fā)表于 03-29 10:20 ?228次閱讀

    FT 5000 Smart Transceiver:下一代智能網(wǎng)絡(luò)芯片的卓越之選

    Transceiver 是 Echelon 公司推出的下一代智能網(wǎng)絡(luò)芯片,它是 LONWORKS? 2.0 平臺的關(guān)鍵產(chǎn)品。該平臺旨在大幅提升 LONWORKS 設(shè)備的性能和功能,同時降低開發(fā)和節(jié)點成本。FT 5000 集成了高性能的 Neuron?
    的頭像 發(fā)表于 03-28 09:05 ?312次閱讀

    DSP Concepts與AMD助力打造下一代汽車音頻

    DSP Concepts 與 AMD 正在將 Audio Weaver 嵌入式音頻框架引入 AMD 銳龍 AI 嵌入式 P100 系列處理器——從而實現(xiàn)下一代沉浸式車載音頻與數(shù)字座艙體驗。
    的頭像 發(fā)表于 03-19 09:40 ?4679次閱讀

    英飛凌下一代電磁閥驅(qū)動器評估套件使用指南

    英飛凌下一代電磁閥驅(qū)動器評估套件使用指南 引言 作為電子工程師,我們在開發(fā)電磁閥驅(qū)動相關(guān)項目時,款好用的評估套件能大大提高我們的開發(fā)效率。英飛凌的
    的頭像 發(fā)表于 12-21 15:50 ?756次閱讀

    英飛凌下一代電磁閥驅(qū)動器評估套件使用指南

    英飛凌下一代電磁閥驅(qū)動器評估套件使用指南 、前言 在電子工程師的日常工作中,電磁閥驅(qū)動器的評估和開發(fā)項重要任務(wù)。英飛凌推出的下一代電磁
    的頭像 發(fā)表于 12-21 11:30 ?1177次閱讀

    Amphenol 4 端口千兆以太網(wǎng)交換機:適用于下一代無人機、機器人和嵌入式應(yīng)用

    Amphenol 4 端口千兆以太網(wǎng)交換機:適用于下一代無人機、機器人和嵌入式應(yīng)用 在電子工程領(lǐng)域,為下一代無人機、機器人和嵌入式應(yīng)用開發(fā)先進的網(wǎng)絡(luò)解決方案至關(guān)重要。Amphenol
    的頭像 發(fā)表于 12-10 15:25 ?638次閱讀

    Telechips與Arm合作開發(fā)下一代IVI芯片Dolphin7

    Telechips宣布,將在與 Arm的戰(zhàn)略合作框架下,正式開發(fā)下一代車載信息娛樂系統(tǒng)(IVI)系統(tǒng)級芯片(SoC)“Dolphin7”。
    的頭像 發(fā)表于 10-13 16:11 ?1515次閱讀

    用于下一代 GGE 和 HSPA 手機的多模式/多頻段功率放大器模塊 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()用于下一代 GGE 和 HSPA 手機的多模式/多頻段功率放大器模塊相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有用于下一代 GGE 和 HSPA 手機的多模式/多頻段功率放大器
    發(fā)表于 09-08 18:33
    <b class='flag-5'>用于</b><b class='flag-5'>下一代</b> GGE 和 HSPA 手機的多模式/多頻段功率放大器模塊 skyworksinc

    用于下一代 GGE 和 HSPA 手機的多模/多頻段 PAM skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()適用于下一代 GGE 和 HSPA 手機的多模/多頻段 PAM相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有適用于下一代 GGE 和 HSPA 手機的多模/多頻段 PAM的引腳
    發(fā)表于 09-05 18:34
    適<b class='flag-5'>用于</b><b class='flag-5'>下一代</b> GGE 和 HSPA 手機的多模/多頻段 PAM skyworksinc

    四維新加速打造基于地平線征程6B的下一代輔助駕駛系統(tǒng)

    近日,四維新基于地平線征程6B芯片研發(fā)的下一代輔助駕駛系統(tǒng)方案,已順利完成底層平臺開發(fā),伴隨工程化落地進程加速,該方案已正式進入到客戶行泊體量產(chǎn)項目的聯(lián)合研發(fā)階段,并預(yù)計在2026
    的頭像 發(fā)表于 08-25 17:35 ?2107次閱讀

    安森美攜手英偉達推動下一代AI數(shù)據(jù)中心發(fā)展

    安森美(onsemi,美國納斯達克股票代號:ON)宣布與英偉達(NVIDIA)合作,共同推動向800V直流(VDC)供電架構(gòu)轉(zhuǎn)型。這變革性解決方案將推動下一代人工智能(AI)數(shù)據(jù)中心在能效、密度及可持續(xù)性方面實現(xiàn)顯著提升。
    的頭像 發(fā)表于 08-06 17:27 ?1764次閱讀

    下一代高速芯片晶體管解制造問題解決了!

    ,10埃)開始直使用到A7。 從這些外壁叉片晶體管的量產(chǎn)中獲得的知識可能有助于下一代互補場效應(yīng)晶體管(CFET)的生產(chǎn)。 目前,領(lǐng)先的芯片制造商——英特爾、臺積電和三星——正在利用
    發(fā)表于 06-20 10:40

    下一代PX5 RTOS具有哪些優(yōu)勢

    許多古老的RTOS設(shè)計至今仍在使用,包括Zephyr(1980年)、Nucleus(1990年)和FreeRTOS(2003年)。所有這些舊設(shè)計都有專有的API,通常更大、更慢,并且缺乏下一代RTOS的必要安全認證和功能。
    的頭像 發(fā)表于 06-19 15:06 ?1340次閱讀
    临桂县| 桐乡市| 安徽省| 沧源| 邯郸县| 宝山区| 台南县| 大悟县| 天台县| 建瓯市| 焉耆| 稻城县| 黄冈市| 佛坪县| 涡阳县| 区。| 齐齐哈尔市| 阜城县| 平湖市| 子洲县| 塔河县| 武功县| 吉木乃县| 临城县| 象山县| 公安县| 吉水县| 宁波市| 巴东县| 卢氏县| 无为县| 山东省| 民县| 长汀县| 凤山市| 枝江市| 玛沁县| 饶河县| 中卫市| 黑龙江省| 临沧市|