日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾四大層面,提升DeepRec訓(xùn)練和推理能力

英特爾中國(guó) ? 來(lái)源:英特爾中國(guó) ? 作者:英特爾中國(guó) ? 2022-07-10 10:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從淘寶到天貓應(yīng)用,從搜索、推薦到廣告等場(chǎng)景,對(duì)井噴式的數(shù)據(jù)進(jìn)行超大規(guī)模訓(xùn)練推理的應(yīng)用,已經(jīng)在我們身邊落地開花。阿里巴巴集團(tuán)的開源推薦引擎 DeepRec (PAI-TF) 主要用于稀疏模型訓(xùn)練和預(yù)測(cè),可支撐千億特征、萬(wàn)億樣本的超大規(guī)模稀疏訓(xùn)練。

從2019 年開始,英特爾就與阿里巴巴PAI團(tuán)隊(duì)緊密合作,將英特爾 AI 技術(shù)應(yīng)用到 DeepRec 中。特別是英特爾處理器內(nèi)置的英特爾DL Boost (英特爾深度學(xué)習(xí)加速),為 DeepRec 實(shí)現(xiàn)了四個(gè)層面上的優(yōu)化:框架優(yōu)化、算子優(yōu)化、子圖優(yōu)化和模型優(yōu)化。

四大層面,提升DeepRec 訓(xùn)練和推理能力

自英特爾 至強(qiáng) 可擴(kuò)展處理器問(wèn)世以來(lái),通過(guò)從 AVX-256 升級(jí)到 AVX-512,英特爾將 AVX 的能力提高了一倍,極大地提升了深度學(xué)習(xí)訓(xùn)練和推理能力。第三代英特爾 至強(qiáng) 可擴(kuò)展處理器之后,英特爾推出支持 BFloat16 (BF16) 數(shù)據(jù)類型的指令集,也應(yīng)用到 DeepRec 的優(yōu)化中。

框架優(yōu)化:DeepRec 集成了英特爾開源的跨平臺(tái)深度學(xué)習(xí)性能加速庫(kù)oneDNN (oneAPI Deep Neural Network Library),該程序庫(kù)已經(jīng)針對(duì)大量主流算子實(shí)現(xiàn)了性能優(yōu)化。與搭載 BF16 指令的第三代英特爾至強(qiáng)可擴(kuò)展處理器同時(shí)使用,可顯著提高模型訓(xùn)練和推理性能。

算子優(yōu)化:搜索廣告推薦模型中存在著大量稀疏算子,調(diào)用 AVX-512 指令加以優(yōu)化后,大幅提升了數(shù)據(jù)讀寫效率和性能。

子圖優(yōu)化:圖優(yōu)化是 AI 性能優(yōu)化的主要有效手段之一。在大規(guī)模稀疏場(chǎng)景下,DeepRec 加入多種子圖融合功能,減少大量冗余操作,配合英特爾 AVX-512 指令加速,實(shí)現(xiàn)了子圖性能的明顯提升。

模型優(yōu)化:基于CPU 平臺(tái),英特爾在 DeepRec 構(gòu)建了涵蓋多個(gè)主流模型的獨(dú)有推薦模型集合,涉及召回、排序、多目標(biāo)等多種常見場(chǎng)景;并針對(duì)硬件平臺(tái)進(jìn)行性能優(yōu)化,相較于其他框架在 CPU 平臺(tái)上帶來(lái)跨越式性能提升。

阿里巴巴 PAI 團(tuán)隊(duì)的測(cè)試結(jié)果證明:基于 Criteo 數(shù)據(jù)集,使用BF16優(yōu)化后,模型WDL精度或AUC可以逼近FP32,并且BF16模型的訓(xùn)練性能提升達(dá)1.4倍,效果顯著。

未來(lái),英特爾還會(huì)從優(yōu)化器算子、attention 子圖、添加多目標(biāo)模型等多個(gè)角度進(jìn)一步實(shí)施優(yōu)化,更大程度地發(fā)揮 CPU 平臺(tái)硬件優(yōu)勢(shì)、尤其是新硬件特征的效果最大化,從而為稀疏場(chǎng)景打造更高性能的 CPU 解決方案。

當(dāng)然,英特爾為 DeepRec 的優(yōu)化并不僅限于 CPU 層面。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10326

    瀏覽量

    181130
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11332

    瀏覽量

    225991

原文標(biāo)題:發(fā)揮CPU平臺(tái)硬件優(yōu)勢(shì),英特爾助力DeepRec優(yōu)化超大規(guī)模稀疏訓(xùn)練

文章出處:【微信號(hào):英特爾中國(guó),微信公眾號(hào):英特爾中國(guó)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    凈利暴漲156%!英特爾釋出Q1財(cái)報(bào)“王炸”,CPU迎史詩(shī)級(jí)“價(jià)值回歸”?

    GPU業(yè)務(wù)被逐步稀釋,推理側(cè)業(yè)務(wù)被越來(lái)越多客戶以ASIC“搶奪”的局面。而英特爾反而借助AI Agent應(yīng)用對(duì)并發(fā)調(diào)度能力需求的暴增開始“逆風(fēng)翻盤”,作為Agentic AI性能提升
    的頭像 發(fā)表于 04-27 09:07 ?1832次閱讀
    凈利暴漲156%!<b class='flag-5'>英特爾</b>釋出Q1財(cái)報(bào)“王炸”,CPU迎史詩(shī)級(jí)“價(jià)值回歸”?

    英特爾炮轟,AMD回?fù)?!掌機(jī)市場(chǎng)芯片之爭(zhēng)

    英特爾推出的才是專為掌機(jī)設(shè)計(jì)的最新處理器,信心源于新一代旗艦產(chǎn)品Panther Lake處理器。該處理器是首款基于英特爾18A工藝節(jié)點(diǎn)制造的消費(fèi)級(jí)SoC,在“每瓦性能”數(shù)據(jù)上表現(xiàn)優(yōu)異,結(jié)合XeSS 3超級(jí)采樣技術(shù)和Arc核顯,英特爾
    的頭像 發(fā)表于 01-12 09:09 ?5418次閱讀

    英特爾至強(qiáng)6“芯”動(dòng)GTC 2026,為英偉達(dá)DCG Rubin解鎖系統(tǒng)級(jí)性能

    的關(guān)鍵階段,至強(qiáng)系列處理器為GPU加速AI系統(tǒng),提供架構(gòu)一致性與強(qiáng)大擴(kuò)展能力所發(fā)揮的重要支撐作用。 英特爾公司副總裁兼數(shù)據(jù)中心戰(zhàn)略項(xiàng)目總經(jīng)理Jeff McVeigh表示: “當(dāng)前,AI發(fā)展正從大規(guī)模訓(xùn)練加速階段,轉(zhuǎn)向由智能體AI
    的頭像 發(fā)表于 03-19 16:43 ?424次閱讀

    釋放極致游戲性能!英特爾酷睿Ultra 200S Plus發(fā)布

    英特爾酷睿Ultra 200S Plus的內(nèi)容創(chuàng)作性能至高可達(dá)同類產(chǎn)品的兩倍,游戲性能平均提升 15%。其中,酷睿 Ultra 7 270K Plus 是英特爾迄今最快的臺(tái)式機(jī)游戲處理器。 最新發(fā)
    的頭像 發(fā)表于 03-19 13:13 ?438次閱讀

    英特爾 18A 良率躍升,普迪飛成核心攻堅(jiān)力量|助力實(shí)現(xiàn)月度 7%-8% 穩(wěn)定增長(zhǎng)

    合作回顧英特爾攜手普迪飛,以數(shù)據(jù)協(xié)同重構(gòu)半導(dǎo)體行業(yè)效率新標(biāo)桿普迪飛&英特爾:數(shù)據(jù)驅(qū)動(dòng)下的半導(dǎo)體良率優(yōu)化實(shí)踐深度合作落地:技術(shù)驅(qū)動(dòng)半導(dǎo)體制造效率質(zhì)量雙提升英特爾召開2025年第
    的頭像 發(fā)表于 03-09 12:00 ?668次閱讀
    <b class='flag-5'>英特爾</b> 18A 良率躍升,普迪飛成核心攻堅(jiān)力量|助力實(shí)現(xiàn)月度 7%-8% 穩(wěn)定增長(zhǎng)

    銳寶智聯(lián)入選英特爾首批尊享級(jí)合作伙伴

    余年深耕物聯(lián)網(wǎng)領(lǐng)域的技術(shù)沉淀、持續(xù)創(chuàng)新能力及廣泛市場(chǎng)影響力,成功入選首批 “尊享級(jí)” 合作伙伴,成為英特爾生態(tài)中核心協(xié)同力量的重要一員。
    的頭像 發(fā)表于 12-02 18:16 ?1632次閱讀
    銳寶智聯(lián)入選<b class='flag-5'>英特爾</b>首批尊享級(jí)合作伙伴

    英特爾舉辦行業(yè)解決方案大會(huì),共同打造機(jī)器人“芯”動(dòng)脈

    11月19日,在2025英特爾行業(yè)解決方案大會(huì)上,英特爾展示了基于英特爾? 酷睿? Ultra平臺(tái)的最新邊緣AI產(chǎn)品及解決方案,并預(yù)覽了針對(duì)邊緣側(cè)的英特爾? 酷睿? Ultra處理器(
    的頭像 發(fā)表于 11-19 21:51 ?7156次閱讀
    <b class='flag-5'>英特爾</b>舉辦行業(yè)解決方案大會(huì),共同打造機(jī)器人“芯”動(dòng)脈

    特斯拉要自建超大型晶圓廠,馬斯克:與英特爾合作 “有必要”

    特斯拉CEO馬斯克周(6日) 盤后于股東大會(huì)上表示,隨著自動(dòng)駕駛與機(jī)器人應(yīng)用快速擴(kuò)張,特斯拉需要自行建造一座大型晶圓廠,以滿足未來(lái)龐大的運(yùn)算需求,并透露公司可能與芯片大廠英特爾展開合作。消息公布后,英特爾聞?dòng)嵈鬂q近4%。
    的頭像 發(fā)表于 11-07 18:07 ?2426次閱讀

    發(fā)力圖形工作站和AI推理市場(chǎng),英特爾大顯存GPU亮相灣芯展

    英特爾發(fā)布了面向?qū)I(yè)的銳炫Pro B50和B60。這兩款顯卡比較RTX2000和5660Ti,有哪些性能上的優(yōu)勢(shì)?在支持AI推理工作站和大模型部署上,B60有哪些獨(dú)到之處?10月16日,在深圳舉行的灣區(qū)半導(dǎo)體大會(huì)上,英特爾中國(guó)區(qū)
    的頭像 發(fā)表于 10-22 13:40 ?1.2w次閱讀
    發(fā)力圖形工作站和AI<b class='flag-5'>推理</b>市場(chǎng),<b class='flag-5'>英特爾</b>大顯存GPU亮相灣芯展

    英特爾Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持

    英特爾? Gaudi 2EAI加速器現(xiàn)已為DeepSeek-V3.1提供深度優(yōu)化支持。憑借出色的性能和成本效益,英特爾Gaudi 2E以更低的投入、更高的效率,實(shí)現(xiàn)從模型訓(xùn)練的深度突破到推理
    的頭像 發(fā)表于 08-26 19:18 ?3358次閱讀
    <b class='flag-5'>英特爾</b>Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持

    美國(guó)政府將入股英特爾?

    據(jù)彭博社報(bào)道稱,特朗普政府正在與芯片制造商英特爾進(jìn)行談判,希望美國(guó)政府入股這家陷入困境的公司,隨后該公司股價(jià)周上漲 7% 。 英特爾是唯一一家有能力在美國(guó)本土生產(chǎn)最快芯片的美國(guó)公司,
    的頭像 發(fā)表于 08-17 09:52 ?1280次閱讀

    使用英特爾? NPU 插件C++運(yùn)行應(yīng)用程序時(shí)出現(xiàn)錯(cuò)誤:“std::Runtime_error at memory location”怎么解決?

    使用OpenVINO?工具套件版本 2024.4.0 構(gòu)建C++應(yīng)用程序 使用英特爾? NPU 插件運(yùn)行了 C++ 應(yīng)用程序 遇到的錯(cuò)誤: Microsoft C++ exception: std::runtime_error at memory location
    發(fā)表于 06-25 08:01

    英特爾銳炫Pro B系列,邊緣AI的“智能引擎”

    2025年6月19日,上?!?在MWC 25上海期間,英特爾展示了一幅由英特爾銳炫? Pro B系列GPU所驅(qū)動(dòng)的“實(shí)時(shí)響應(yīng)、安全高效、成本可控”的邊緣AI圖景。 英特爾客戶端計(jì)算事業(yè)部邊緣計(jì)算
    的頭像 發(fā)表于 06-20 17:32 ?1080次閱讀
    <b class='flag-5'>英特爾</b>銳炫Pro B系列,邊緣AI的“智能引擎”

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾銳炫Pro B60和英特爾
    的頭像 發(fā)表于 05-20 12:27 ?5712次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來(lái)新選擇

    Pro B50 GPU,搭載了為AI推理和專業(yè)工作站量身定制的配置,擴(kuò)展了英特爾銳炫Pro產(chǎn)品系列。 英特爾 ? Gaudi 3 AI 加速器: 英特爾Gaud
    發(fā)表于 05-20 11:03 ?1930次閱讀
    乐昌市| 大理市| 明溪县| 嘉禾县| 宁强县| 怀柔区| 洛川县| 潍坊市| 新竹市| 鄄城县| 云林县| 安徽省| 宝坻区| 北碚区| 新安县| 禄丰县| 临清市| 贵阳市| 邵阳县| 安塞县| 永春县| 广安市| 澄城县| 伊宁市| 精河县| 泸定县| 车致| 准格尔旗| 万宁市| 麻栗坡县| 延吉市| 淅川县| 安庆市| 长葛市| 海林市| 宁德市| 库伦旗| 梓潼县| 平顺县| 洛南县| 来凤县|