日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Merlin HugeCTRV 3.8/3.9版本新增內(nèi)容

NVIDIA英偉達(dá) ? 來(lái)源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-08-24 10:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Merlin HugeCTR(以下簡(jiǎn)稱 HugeCTR)是 GPU 加速的推薦程序框架,旨在在多個(gè) GPU 和節(jié)點(diǎn)之間分配訓(xùn)練并估計(jì)點(diǎn)擊率(Click-through rate)。

V3.8 版本新增內(nèi)容

1. 第三代 Embedding 的示例:

這個(gè)版本我們新增了一個(gè)示例筆記本,介紹了 Embedding 集合的 Python API 以及第三代 Embedding 的使用方法。

2. 用于分級(jí)參數(shù)服務(wù)器查找功能的 DLPack Python API:

這個(gè)版本我們引入了對(duì)使用 DLPack Python API 從分層參數(shù)服務(wù)器 (HPS) 查找 Embedding 的支持。新方法是 lookup_fromdlpack()。

3. 使用 Python API 從 HDFS 讀取 Parquet 數(shù)據(jù)集:

現(xiàn)在您可以通過(guò) DataSourceParams 來(lái)指定 Data Reader 的數(shù)據(jù)源的配置了,例如 Hadoop 分布式文件系統(tǒng)的 NameNode 的主機(jī)名和 NameNode 端口號(hào)。

4. 提高了日志記錄的性能。

5. 層類的改進(jìn):

全連接層現(xiàn)已支持 3 維輸入,Matrix Multiply 層現(xiàn)已支持 4 維輸入。

6. 文檔的改進(jìn):

a. 增加了導(dǎo)航長(zhǎng)頁(yè)面以提供更好的體驗(yàn)。

b. Criteo 1TB 點(diǎn)擊日志數(shù)據(jù)集的 URL 已更新。

7. 修復(fù)的問(wèn)題:

修復(fù)了 _metadata.json 配置文件內(nèi)的文件名和實(shí)際數(shù)據(jù)集文件名不一致的問(wèn)題。

修復(fù)了在 AUC 預(yù)熱期間在多個(gè) GPU 上運(yùn)行大型模型時(shí)發(fā)生的內(nèi)存崩潰問(wèn)題。

修復(fù)了 ETC 筆記本中鍵集生成的問(wèn)題。

修復(fù)了使用調(diào)試模式編譯時(shí)發(fā)生的編譯錯(cuò)誤。

修復(fù)多節(jié)點(diǎn)訓(xùn)練出現(xiàn)重復(fù)日志的問(wèn)題。

V3.9 版本新增內(nèi)容

1. 第三代 Embedding 的更新:

更新了 SOK 以使用 HugeCTR 第三代 Embedding 作為開(kāi)發(fā)者預(yù)覽版本。

啟用了基于 cuCollection的動(dòng)態(tài)Embedding 模式。動(dòng)態(tài)的Embedding能夠在用戶不配置內(nèi)存使用信息時(shí)自動(dòng)拓展。

2. 全新的多節(jié)點(diǎn)訓(xùn)練教程:

我們提供了一個(gè)全新的基于 HugeCTR 最新 Docker 容器使用多節(jié)點(diǎn)訓(xùn)練的實(shí)例。

3. 現(xiàn)已支持 MMoE 模型的離線推理并提供了 Per-class AUC 和平均 AUC 計(jì)算。

4. 對(duì) HPS TensorFlow 插件使用的文檔和實(shí)例更新:

一個(gè)新的簡(jiǎn)介文檔。

新的實(shí)例筆記本。

新的API文檔。

5. 修復(fù)的問(wèn)題:

修復(fù)了一個(gè)訓(xùn)練性能受到 GPU 例程檢查影響的問(wèn)題。該例程檢查輸入的 key 是否在規(guī)定的 Embedding Table 范圍內(nèi)。對(duì)于可以保證輸入的 key 能放在指定的 workspace_size_per_gpu_in_mb 的情況,我們提供了一種解決方法:通過(guò)設(shè)置環(huán)境變量 HUGECTR_DISABLE_OVERFLOW_CHECK=1 來(lái)關(guān)閉例程檢查,以便恢復(fù)訓(xùn)練性能。

我們修復(fù)了一個(gè) Softmax 層的正確性問(wèn)題。

我們刪除了一個(gè)未更新且不再使用的內(nèi)聯(lián)分析器。

已知問(wèn)題

以下是目前HugeCTR存在的已知問(wèn)題,我們將在之后的版本中盡快修復(fù)。

HugeCTR 使用 NCCL 在 rank 之間共享數(shù)據(jù),并且 NCCL 可能需要共享系統(tǒng)內(nèi)存用于 IPC 和固定(頁(yè)面鎖定)系統(tǒng)內(nèi)存資源。在容器內(nèi)使用 NCCL 時(shí),建議您通過(guò)發(fā)出以下命令來(lái)增加這些資源 -shm-size=1g -ulimit memlock=-1

另見(jiàn) NCCL 的 已知問(wèn)題。

還有 GitHub 問(wèn)題。

目前即使目標(biāo) Kafka broker 無(wú)響應(yīng),KafkaProducers 啟動(dòng)也會(huì)成功。為了避免與來(lái)自 Kafka 的流模型更新相關(guān)的數(shù)據(jù)丟失,您必須確保有足夠數(shù)量的 Kafka brokers 啟動(dòng)、正常工作并且可以從運(yùn)行 HugeCTR 的節(jié)點(diǎn)訪問(wèn)。

文件列表中的數(shù)據(jù)文件數(shù)量應(yīng)不小于數(shù)據(jù)讀取器的數(shù)量。否則,不同的 data reader worker 將被映射到同一個(gè)文件,導(dǎo)致數(shù)據(jù)加載不會(huì)按預(yù)期進(jìn)行。

正則化器暫時(shí)不支持聯(lián)合損失訓(xùn)練。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5283

    瀏覽量

    136101
  • python
    +關(guān)注

    關(guān)注

    58

    文章

    4889

    瀏覽量

    90330
  • GitHub
    +關(guān)注

    關(guān)注

    3

    文章

    489

    瀏覽量

    18770

原文標(biāo)題:HugeCTR v3.8 & v3.9 發(fā)布說(shuō)明

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    OpenAI正式發(fā)布ChatGPT Images 2.0版本

    在人工智能技術(shù)迅猛發(fā)展的浪潮中,OpenAI始終是引領(lǐng)行業(yè)變革的先鋒力量。近日,OpenAI正式發(fā)布ChatGPT Images 2.0版本,這一消息如同一顆重磅炸彈,在科技圈引發(fā)了強(qiáng)烈反響,在
    的頭像 發(fā)表于 04-22 11:32 ?2288次閱讀

    開(kāi)源歐拉社區(qū)正式發(fā)布o(jì)penEuler Embedded 26.03版本

    近日,開(kāi)源歐拉社區(qū)正式發(fā)布o(jì)penEuler Embedded 26.03版本。新版本基于開(kāi)源歐拉社區(qū)Intelligence BooM開(kāi)源全棧,成功孵化IB-Robot具身智能機(jī)器人軟件全棧項(xiàng)目
    的頭像 發(fā)表于 04-22 10:47 ?421次閱讀

    ASPICE 3.1 與 4.0 版本的核心差異:從軟件專屬到全系統(tǒng)覆蓋(四)

    軟件,4.0 新增硬件全流程管控 ASPICE v3.1版本 ASPICE 3.1 版本的核心聚焦于系統(tǒng)工程(SYS)與軟件工程(SWE) 兩大模塊,僅覆蓋車載軟件與系統(tǒng)級(jí)的研發(fā)過(guò)程要求, 完全
    發(fā)表于 04-08 09:48

    索尼更新相機(jī)遙控軟件開(kāi)發(fā)包2.01版本

    2026年2月03日,索尼(中國(guó))有限公司正式發(fā)布了可通過(guò)電腦遠(yuǎn)程操控索尼相機(jī)的相機(jī)遙控軟件開(kāi)發(fā)包(Camera Remote SDK)2.01版本,本次更新帶來(lái)了2個(gè)新功能,新增支持機(jī)型ILCE-7M5、PXW-Z380、DSC-RX1RM3等。
    的頭像 發(fā)表于 02-03 16:59 ?906次閱讀

    西門子PCB DFM分析工具Valor NPI 2510版本新增功能

    Valor NPI 2510 版本新增多項(xiàng)檢查功能、提升制造風(fēng)險(xiǎn)識(shí)別,并推出令人矚目的 3D 可視化增強(qiáng)特性,這標(biāo)志著產(chǎn)品的重大升級(jí)。Valor NPI 的 3D 視圖經(jīng)過(guò)重新設(shè)計(jì),讓可制造性設(shè)計(jì) (DFM) 結(jié)果的查看更直觀、精準(zhǔn)。
    的頭像 發(fā)表于 01-04 16:10 ?742次閱讀
    西門子PCB DFM分析工具Valor NPI 2510<b class='flag-5'>版本</b>的<b class='flag-5'>新增</b>功能

    NVIDIA CUDA 13.1版本新增功能與改進(jìn)

    NVIDIA CUDA 13.1 是自 CUDA 二十年前發(fā)明以來(lái),規(guī)模最大、內(nèi)容最全面的一次更新。
    的頭像 發(fā)表于 12-13 10:08 ?2490次閱讀

    瑞薩靈活配置軟件包FSP 6.2.0版本的更新內(nèi)容

    FSP(Flexible Software Package)靈活配置軟件包是瑞薩電子(Renesas)為RA系列微控制器(MCU)家族開(kāi)發(fā)的軟件包。FSP自發(fā)布以來(lái)經(jīng)過(guò)了數(shù)年的更新,現(xiàn)在已經(jīng)來(lái)到了6.2.0版本。
    的頭像 發(fā)表于 12-11 16:42 ?1271次閱讀
    瑞薩靈活配置軟件包FSP 6.2.0<b class='flag-5'>版本</b>的更新<b class='flag-5'>內(nèi)容</b>

    AMD Vivado Design Suite 2025.2版本現(xiàn)已發(fā)布

    AMD Vivado Design Suite 2025.2 版本現(xiàn)已發(fā)布,新增對(duì) AMD Versal 自適應(yīng) SoC 的設(shè)計(jì)支持,包含新器件支持、QoR 功能及易用性增強(qiáng)。
    的頭像 發(fā)表于 12-09 15:11 ?1378次閱讀

    連接標(biāo)準(zhǔn)聯(lián)盟正式推出Matter 1.5版本

    連接標(biāo)準(zhǔn)聯(lián)盟(Connectivity Standards Alliance, CSA)上周推出 Matter 1.5 版本。該標(biāo)準(zhǔn)新增多個(gè)頗具影響力的設(shè)備類型及應(yīng)用場(chǎng)景,包括對(duì)攝像頭、閉合設(shè)備
    的頭像 發(fā)表于 11-30 10:34 ?1336次閱讀

    RT-Thread Studio V2.3.0 版本正式發(fā)布!

    RT-ThreadStudioV2.3.0親愛(ài)的開(kāi)發(fā)者們,我們很高興地宣布RT-ThreadStudio版本更新啦!V2.3.0版正式發(fā)布!RT-ThreadStudioV2.3.0更新內(nèi)容1新增
    的頭像 發(fā)表于 11-29 09:29 ?1379次閱讀
    RT-Thread Studio V2.3.0 <b class='flag-5'>版本</b>正式發(fā)布!

    Quartus Prime Pro 25.1版本的安裝和使用

    如果用戶開(kāi)發(fā)板是基于Agilex 3、Agilex 5等高階器件,則需要安裝高版本的Quartus軟件比如Quartus Prime Pro 25.1版本,這個(gè)版本在安裝包和license獲取(免費(fèi))等方面跟以往的Quartus
    的頭像 發(fā)表于 10-07 13:06 ?3197次閱讀
    Quartus Prime Pro 25.1<b class='flag-5'>版本</b>的安裝和使用

    NVIDIA RAPIDS 25.06版本新增多項(xiàng)功能

    RAPIDS 是一套面向 Python 數(shù)據(jù)科學(xué)的 NVIDIA CUDA-X 庫(kù),最新發(fā)布的 25.06 版本引入了多項(xiàng)亮眼新功能,其中包括 Polars GPU 流執(zhí)行引擎——這是一種面向圖
    的頭像 發(fā)表于 09-09 09:54 ?1295次閱讀

    0.4 至 3.8 GHz SPDT 開(kāi)關(guān) skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()0.4 至 3.8 GHz SPDT 開(kāi)關(guān)相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊(cè),更有0.4 至 3.8 GHz SPDT 開(kāi)關(guān)的引腳圖、接線圖、封裝手冊(cè)、中文資料、英文資料,0.4 至
    發(fā)表于 08-01 18:34
    0.4 至 <b class='flag-5'>3.8</b> GHz SPDT 開(kāi)關(guān) skyworksinc

    CANoe產(chǎn)品體系19版本新特性及新增Option(上)

    版本持續(xù)助力當(dāng)前車輛E/E架構(gòu)中ECU開(kāi)發(fā)驗(yàn)證,同時(shí)賦能后續(xù)智能網(wǎng)聯(lián)電動(dòng)車型預(yù)研驗(yàn)證。新版本CANoe產(chǎn)品體系新增數(shù)據(jù)驅(qū)動(dòng)的DDS、車輛互聯(lián)服務(wù)和高效電機(jī)模型庫(kù),進(jìn)一步支持CANXL
    的頭像 發(fā)表于 06-11 10:03 ?3251次閱讀
    CANoe產(chǎn)品體系19<b class='flag-5'>版本</b>新特性及<b class='flag-5'>新增</b>Option(上)

    【案例3.9】電路板無(wú)法啟動(dòng)的故障分析

    【案例3.9】電路板無(wú)法啟動(dòng)的故障分析【現(xiàn)象描述】某設(shè)計(jì),CPU以菊花鏈的方式接兩片F(xiàn)lash存儲(chǔ)器,CPU的引導(dǎo)程序存儲(chǔ)在Flash存儲(chǔ)器中,兩片F(xiàn)lash存儲(chǔ)器互為冗余備份。上電測(cè)試發(fā)現(xiàn),多塊
    的頭像 發(fā)表于 06-07 09:04 ?941次閱讀
    【案例<b class='flag-5'>3.9</b>】電路板無(wú)法啟動(dòng)的故障分析
    常德市| 浦县| 交口县| 邹平县| 星子县| 灵宝市| 五华县| 朝阳市| 房山区| 五莲县| 鄄城县| 福泉市| 昭苏县| 班玛县| 聂荣县| 兰州市| 永川市| 潮州市| 若尔盖县| 兴安盟| 德惠市| 墨玉县| 遂溪县| 新民市| 东至县| 勃利县| 邯郸市| 沭阳县| 长岭县| 余干县| 塔城市| 光泽县| 奉节县| 和静县| 清水县| 噶尔县| 双江| 上蔡县| 金山区| 古蔺县| 新巴尔虎右旗|