日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

SOK將HugeCTR中的高級(jí)特性進(jìn)行包裝使用

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:HugeCTR ? 2022-04-07 16:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1. Introduction

HugeCTR 能夠高效地利用 GPU 來(lái)進(jìn)行推薦系統(tǒng)的訓(xùn)練,為了使它還能直接被其他 DL 用戶,比如 TensorFlow 所直接使用,我們開(kāi)發(fā)了 SparseOperationKit (SOK),來(lái)將 HugeCTR 中的高級(jí)特性封裝為 TensorFlow 可直接調(diào)用的形式,從而幫助用戶在 TensorFlow 中直接使用 HugeCTR 中的高級(jí)特性來(lái)加速他們的推薦系統(tǒng)。

pYYBAGJOmyGAEKlZAACdxZaXMq8920.png

圖 1. SOK embedding 工作流程

SOK 以數(shù)據(jù)并行的方式接收輸入數(shù)據(jù),然后在 SOK 內(nèi)部做黑盒式地模型轉(zhuǎn)換,最后將計(jì)算結(jié)果以數(shù)據(jù)并行的方式傳遞給初始 GPU。這種方式可以盡可能少地修改用戶已有的代碼,以更方便、快捷地在多個(gè) GPU 上進(jìn)行擴(kuò)展。

SOK 不僅僅是加速了 TensorFlow 中的算子,而是根據(jù)業(yè)界中的實(shí)際需求提供了對(duì)應(yīng)的新解決方案,比如說(shuō) GPU HashTable。SOK 可以與 TensorFlow 1.15 和 TensorFlow 2.x 兼容使用;既可以使用 TensorFlow 自帶的通信工具,也可以使用 Horovod 等第三方插件來(lái)作為 embedding parameters 以為參數(shù)的通信工具。

2. TF2 Comparison/Performance

使用 MLPerf 的標(biāo)準(zhǔn)模型 DLRM 來(lái)對(duì) SOK 的性能進(jìn)行測(cè)試。

poYBAGJOmyiAeiA8AADnMNf4awU433.png

圖 2. SOK性能測(cè)試數(shù)據(jù)

相比于 NVIDIA 的 DeepLearning Examples,使用 SOK 可以獲得更快的訓(xùn)練速度以及更高的吞吐量。

3. API

SOK 提供了簡(jiǎn)潔的、類 TensorFlow 的 API;使用 SOK 的方式非常簡(jiǎn)單、直接;讓用戶通過(guò)修改幾行代碼就可以使用 SOK。

定義模型結(jié)構(gòu)

poYBAGJOmy2ARBajAADRQdPyK68016.png

左側(cè)是使用 TensorFlow 的 API 來(lái)搭建模型,右側(cè)是使用 SOK 的 API 來(lái)搭建相同的模型。使用 SOK 來(lái)搭建模型的時(shí)候,只需要將 TensorFlow 中的 Embedding Layer 替換為 SOK 對(duì)應(yīng)的 API 即可。

使用 Horovod 來(lái)定義 training loop

pYYBAGJOmziAPRIaAAEf6YbWwDc794.png

同樣的,左側(cè)是使用 TensorFlow 來(lái)定義 training loop,右側(cè)是使用 SOK 時(shí),training loop 的定義方式??梢钥吹剑褂?SOK 時(shí),只需要對(duì) Embedding Variables 和 Dense Variables 進(jìn)行分別處理即可。其中,Embedding Variables 部分由 SOK 管理,Dense Variables 由 TensorFlow 管理。

使用 tf.distribute.MirroredStrategy 來(lái)定義 training loop

poYBAGJOm0WAXaRPAAFOJm89KHA665.png

類似的,還可以使用 TensorFlow 自帶的通信工具來(lái)定義 training loop。

開(kāi)始訓(xùn)練

pYYBAGJOm02AGDvJAACSvcfi_CM767.png

在開(kāi)始訓(xùn)練過(guò)程時(shí),使用 SOK 與使用 TensorFlow 時(shí)所用代碼完全一致。

4. 結(jié)語(yǔ)

SOK 將 HugeCTR 中的高級(jí)特性包裝為 TensorFlow 可以直接使用的模塊,通過(guò)修改少數(shù)幾行代碼即可在已有模型代碼中利用上 HugeCTR 的的先進(jìn)設(shè)計(jì)。

關(guān)于作者

NVIDIA GPU 計(jì)算專家研發(fā)團(tuán)隊(duì)成立于2020年7月,主要面向全球用戶開(kāi)發(fā)基于英偉達(dá)通用計(jì)算產(chǎn)品的軟件解決方案。 目前團(tuán)隊(duì)致力于推薦系統(tǒng)訓(xùn)練框架 Merlin HugeCTR的開(kāi)發(fā)。作為Merlin 系統(tǒng)三大核心軟件之一,Merlin HugeCTR 是一套針對(duì)于推薦系統(tǒng)設(shè)計(jì)的模型訓(xùn)練框架。項(xiàng)目啟動(dòng)于2018年,目前產(chǎn)品應(yīng)用于多家國(guó)際互聯(lián)網(wǎng)公司,自2020年以來(lái),HugeCTR持續(xù)參與并推動(dòng)國(guó)際性競(jìng)賽MLPerf DLRM訓(xùn)練項(xiàng)目,從而實(shí)現(xiàn)了業(yè)界領(lǐng)先的優(yōu)化性能。 NVIDIA GPU 計(jì)算專家研發(fā)團(tuán)隊(duì)是一個(gè)小型國(guó)際化工程團(tuán)隊(duì),核心成員來(lái)自于多個(gè)國(guó)家(中國(guó),韓國(guó),荷蘭,德國(guó)),客戶分布于世界各地。日常工作使用英語(yǔ)溝通。 團(tuán)隊(duì)主要工作圍繞軟件產(chǎn)品開(kāi)發(fā)展開(kāi),涉及產(chǎn)品維護(hù)、文檔、測(cè)試、發(fā)布、部署,日常工作中與各國(guó)硬件、產(chǎn)品、工程、客戶支持團(tuán)隊(duì)有著緊密的合作。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5696

    瀏覽量

    110143
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5283

    瀏覽量

    136105
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    EdgePLC在智能倉(cāng)儲(chǔ)包裝系統(tǒng)的應(yīng)用解決方案

    發(fā)展,倉(cāng)儲(chǔ)包裝環(huán)節(jié)對(duì)訂單響應(yīng)速度、多設(shè)備協(xié)同效率及信息實(shí)時(shí)貫通提出了更高要求。本文結(jié)合EdgePLC BL245系列工業(yè)AI邊緣控制器的技術(shù)特性,探討其在智能倉(cāng)儲(chǔ)包裝系統(tǒng)的應(yīng)用方案,
    的頭像 發(fā)表于 04-23 17:20 ?975次閱讀

    EdgePLC在高速立式包裝機(jī)的應(yīng)用解決方案

    精度、溫度調(diào)節(jié)的響應(yīng)速度以及整機(jī)運(yùn)行的穩(wěn)定性提出了較高要求。本文結(jié)合EdgePLC BL245系列工業(yè)AI邊緣控制器的技術(shù)特性,探討其在高速立式包裝機(jī)控制系統(tǒng)的應(yīng)用方案,分析如何通過(guò)邊緣智能技術(shù)應(yīng)對(duì)多軸同步、精密溫控、遠(yuǎn)程運(yùn)維
    的頭像 發(fā)表于 04-17 15:14 ?134次閱讀

    EdgePLC在枕式包裝機(jī)的應(yīng)用解決方案

    枕式包裝機(jī)是食品、日化、醫(yī)藥等行業(yè)廣泛使用的自動(dòng)化包裝設(shè)備,用于產(chǎn)品封裝在枕形薄膜袋。隨著制造業(yè)數(shù)字化轉(zhuǎn)型的深入,傳統(tǒng)枕式包裝機(jī)在設(shè)備互
    的頭像 發(fā)表于 04-16 16:13 ?579次閱讀

    電子元件的帶盤(pán)包裝技術(shù)解析

    包裝形式,在自動(dòng)化生產(chǎn)中扮演著關(guān)鍵角色。本文深入探討帶盤(pán)包裝的相關(guān)技術(shù),結(jié)合Analog Devices的產(chǎn)品規(guī)格,為電子工程師們提供全面的參考。 文件下載: AD7724ACPZ-REEL.pdf 一、帶盤(pán)
    的頭像 發(fā)表于 03-30 10:30 ?305次閱讀

    Socionext 產(chǎn)品包裝規(guī)格變更通知

    日起,Socionext 公司引入新的包裝規(guī)格。 文件下載: MB90F342CESPQC-GSE2.pdf 二、變更對(duì)象 所有標(biāo)有 Socionext 公司的產(chǎn)品
    的頭像 發(fā)表于 03-28 12:50 ?338次閱讀

    NXP 產(chǎn)品包裝革新:輕量級(jí)卷軸的引入

    ,1.pdf 二、變更詳情 變更類別 此次變更屬于包裝/運(yùn)輸/標(biāo)簽類別。NXP 引入使用更少材料的新設(shè)計(jì)輕量級(jí)包裝卷軸,不過(guò)材料本身不會(huì)改變。 卷軸情況 NXP 在
    的頭像 發(fā)表于 03-25 14:10 ?270次閱讀

    工控一體機(jī)在泡罩包裝機(jī)的應(yīng)用

    佳維視工控一體機(jī)在泡罩包裝機(jī)主要承擔(dān)核心控制與智能化管理任務(wù),通過(guò)集成高性能計(jì)算、實(shí)時(shí)控制與多模態(tài)交互功能,顯著提升包裝設(shè)備的自動(dòng)化水平與生產(chǎn)效率。以下是其具體應(yīng)用場(chǎng)景與技術(shù)優(yōu)勢(shì):
    的頭像 發(fā)表于 03-24 15:22 ?171次閱讀

    面包自動(dòng)化包裝產(chǎn)線數(shù)據(jù)采集解決方案

    某企業(yè)從事各類面包糕點(diǎn)等食品的生產(chǎn)及銷售工作,市場(chǎng)規(guī)模持續(xù)擴(kuò)大。為應(yīng)對(duì)產(chǎn)能提升的挑戰(zhàn),已經(jīng)實(shí)現(xiàn)包裝環(huán)節(jié)的自動(dòng)化,實(shí)現(xiàn)從開(kāi)箱-套袋-裝箱-稱重-封箱的全過(guò)程?,F(xiàn)要求包裝產(chǎn)線設(shè)備數(shù)據(jù)采集起來(lái),對(duì)接到本地值班室
    的頭像 發(fā)表于 12-13 11:17 ?883次閱讀
    面包自動(dòng)化<b class='flag-5'>包裝</b>產(chǎn)線數(shù)據(jù)采集解決方案

    食品廠自動(dòng)包裝產(chǎn)線物聯(lián)網(wǎng)解決方案

    ,食品廠希望新的自動(dòng)包裝產(chǎn)線接入到MES平臺(tái)中,要求通過(guò)無(wú)線方式進(jìn)行通信,以避免停機(jī)布線并減少施工成本。對(duì)此,物通博聯(lián)提供高效可靠的物聯(lián)網(wǎng)解決方案。通過(guò)部署PLC數(shù)采網(wǎng)關(guān)接入控制器PLC,能夠?qū)崟r(shí)采集設(shè)備狀態(tài)、運(yùn)行參數(shù)、故障信
    的頭像 發(fā)表于 09-29 14:19 ?739次閱讀
    食品廠自動(dòng)<b class='flag-5'>包裝</b>產(chǎn)線物聯(lián)網(wǎng)解決方案

    中國(guó)包裝行業(yè)權(quán)威專家一行蒞臨匯川技術(shù)參觀指導(dǎo)

    8月27日,中國(guó)包裝行業(yè)權(quán)威專家——中國(guó)醫(yī)藥包裝協(xié)會(huì)特聘會(huì)長(zhǎng)、中國(guó)包裝聯(lián)合會(huì)包裝印刷與標(biāo)簽專業(yè)委員會(huì)主任許文才教授,包聯(lián)
    的頭像 發(fā)表于 09-03 18:03 ?993次閱讀

    用visionboard進(jìn)行視覺(jué)項(xiàng)目,如何openmv示例項(xiàng)目燒錄到開(kāi)發(fā)板脫機(jī)運(yùn)行?

    用visionboard進(jìn)行視覺(jué)項(xiàng)目,如何openmv示例項(xiàng)目燒錄到開(kāi)發(fā)板脫機(jī)運(yùn)行
    發(fā)表于 08-15 06:59

    羅克韋爾助力逸超包裝實(shí)現(xiàn)設(shè)備智能化升級(jí)

    例如,傳統(tǒng)的設(shè)備在生產(chǎn)過(guò)程要改變包裝速度,就必須先停機(jī)。然而面對(duì)市場(chǎng)競(jìng)爭(zhēng)的白熱化,逸超包裝提出了在生產(chǎn)過(guò)程實(shí)時(shí)動(dòng)態(tài)調(diào)整生產(chǎn)速度的需求,以便適配上下游的設(shè)備,與此同時(shí),還需要適配上游
    的頭像 發(fā)表于 07-23 14:16 ?999次閱讀

    滾珠導(dǎo)軌:物流輸送與包裝分揀的“高速軌道”

    滾珠導(dǎo)軌憑借其低摩擦、高剛性的特點(diǎn),廣泛應(yīng)用于輸送線、分揀機(jī)及包裝機(jī)械,確保貨物搬運(yùn)與包裝流程的穩(wěn)定性和速度,成為行業(yè)自動(dòng)化升級(jí)的關(guān)鍵部件。
    的頭像 發(fā)表于 07-21 17:54 ?1258次閱讀
    滾珠導(dǎo)軌:物流輸送與<b class='flag-5'>包裝</b>分揀的“高速軌道”

    油類包裝機(jī)遠(yuǎn)程監(jiān)控物聯(lián)網(wǎng)解決方案

    油類包裝機(jī)(油包機(jī))門用于包裝具有一定流動(dòng)性的粘體物品的設(shè)備,如方便面的調(diào)味醬包、果醬、番茄醬、發(fā)乳、醬類等產(chǎn)品,能夠?qū)崿F(xiàn)自動(dòng)計(jì)量、下料、制袋、封口、打標(biāo)、撕口等整套包裝流程。 在數(shù)
    的頭像 發(fā)表于 06-16 17:08 ?574次閱讀

    利用普源示波器進(jìn)行功率器件動(dòng)態(tài)特性測(cè)試的研究

    深度等優(yōu)點(diǎn),在功率器件動(dòng)態(tài)特性測(cè)試具有廣泛的應(yīng)用前景。本文旨在研究利用普源示波器進(jìn)行功率器件動(dòng)態(tài)特性測(cè)試的方法,為相關(guān)領(lǐng)域的研究和應(yīng)用提供參考。 功率器件動(dòng)態(tài)
    的頭像 發(fā)表于 06-12 17:03 ?799次閱讀
    利用普源示波器<b class='flag-5'>進(jìn)行</b>功率器件動(dòng)態(tài)<b class='flag-5'>特性</b>測(cè)試的研究
    睢宁县| 高清| 西丰县| 平果县| 韩城市| 开封县| 宁安市| 琼海市| 迁安市| 叶城县| 黎城县| 贵州省| 平乡县| 隆林| 库伦旗| 游戏| 平陆县| 资溪县| 广元市| 丹阳市| 西畴县| 荣昌县| 新郑市| 灵丘县| 油尖旺区| 宁安市| 涞源县| 剑川县| 阿荣旗| 尼勒克县| 淮阳县| 绥化市| 新绛县| 巴林右旗| 吉安市| 宁乡县| 芜湖县| 广东省| 乌什县| 高碑店市| 赣州市|