日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

異構(gòu)計(jì)算助拳,緩解參數(shù)服務(wù)器瓶頸

英特爾中國(guó) ? 來(lái)源:英特爾中國(guó) ? 作者:英特爾中國(guó) ? 2022-07-10 10:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

昨晚睡得好嗎?睡不好可以刷快手的《11 點(diǎn)睡吧》。這部當(dāng)代人睡眠困境的微綜藝,總曝光量達(dá)到 107 億,不但科普睡眠知識(shí),更深度探討都市人的喜怒哀樂(lè)[1]。驚人的曝光量背后,是快手對(duì)用戶畫(huà)像數(shù)據(jù)的精準(zhǔn)分析,離不開(kāi)強(qiáng)大技術(shù)支持下的推薦系統(tǒng),得以讓優(yōu)質(zhì)的內(nèi)容被更多喜歡它的人看到。

作為超 3 億日活、日均千萬(wàn)級(jí)短視頻上傳、強(qiáng)調(diào)社區(qū)普惠的短視頻 APP,快手推薦系統(tǒng)在大規(guī)模復(fù)雜業(yè)務(wù)中面臨著巨大性能挑戰(zhàn)。想要化解算力瓶頸,異構(gòu)計(jì)算是一個(gè)重要選項(xiàng),這種使用不同類型指令集和體系架構(gòu)的計(jì)算單元組成系統(tǒng)的計(jì)算方式,能夠針對(duì)不同任務(wù)選擇最優(yōu)的計(jì)算架構(gòu),從而充分揮各種計(jì)算機(jī)構(gòu)的優(yōu)勢(shì),協(xié)同完成復(fù)雜的工作任務(wù)。

1

異構(gòu)計(jì)算助拳,緩解參數(shù)服務(wù)器瓶頸

快手作為短視頻內(nèi)容平臺(tái),內(nèi)容生產(chǎn)、內(nèi)容理解、內(nèi)容分發(fā)、內(nèi)容消費(fèi)、用戶互動(dòng)這些環(huán)節(jié),構(gòu)成了大規(guī)模的復(fù)雜業(yè)務(wù),對(duì)算力產(chǎn)生更多元的需求。舉例來(lái)說(shuō):在推薦業(yè)務(wù)場(chǎng)景中,需要根據(jù)用戶畫(huà)像推薦感興趣的內(nèi)容,就要從海量信息中選擇與用戶特征相關(guān)的結(jié)果,再通過(guò)“排序”來(lái)劃分內(nèi)容的優(yōu)先級(jí)別。在這一過(guò)程中,參數(shù)服務(wù)器的作用非常重要,它負(fù)責(zé)存儲(chǔ)、處理海量數(shù)據(jù)特征以及排序模型參數(shù),保證任務(wù)高效、準(zhǔn)確地完成。

8a99da9c-fea9-11ec-ba43-dac502259ad0.png

快手推薦系統(tǒng)采用計(jì)算與存儲(chǔ)分離的架構(gòu)模式

快手的推薦系統(tǒng)為了應(yīng)對(duì)海量數(shù)據(jù)沖擊,在架構(gòu)上分離了計(jì)算與存儲(chǔ)。參數(shù)服務(wù)器屬于存儲(chǔ)型服務(wù),該服務(wù)要保存和實(shí)時(shí)更新上億規(guī)模的用戶畫(huà)像、數(shù)十億規(guī)模的短視頻特征、以及千億規(guī)模的排序模型參數(shù)。受限于容量和帶寬的參數(shù)服務(wù)器,還要支撐每秒數(shù)億次的 KV 請(qǐng)求,耗費(fèi)大量 CPU 資源。

要解決此類瓶頸,最佳方案是使用不同計(jì)算設(shè)備處理不同負(fù)載??焓值腖aoFe NDP 近數(shù)據(jù)架構(gòu),在計(jì)算體系結(jié)構(gòu)上實(shí)現(xiàn)創(chuàng)新,使用英特爾 至強(qiáng)可擴(kuò)展處理器、英特爾Agilex FPGA和英特爾傲騰 持久內(nèi)存,借助軟硬一體化、領(lǐng)域?qū)S眉铀倨髟O(shè)計(jì),從而做到網(wǎng)絡(luò)、存儲(chǔ)、計(jì)算三重加速,為各個(gè)業(yè)務(wù)系統(tǒng)提供低延遲、高并發(fā)、高吞吐、低總體擁有成本的基礎(chǔ)資源。

8ab88ca8-fea9-11ec-ba43-dac502259ad0.png

快手LaoFe NDP異構(gòu)計(jì)算架構(gòu)

2

持久內(nèi)存+FGPA 專用硬件,

確保三重加速創(chuàng)新

在網(wǎng)絡(luò)層面,LaoFe NDP 架構(gòu)將 CPU的網(wǎng)絡(luò)數(shù)據(jù)處理轉(zhuǎn)移到英特爾 Stratix 10 FPGA 上,同時(shí)基于該 FPGA 實(shí)現(xiàn)了“軟件定義遠(yuǎn)程直接內(nèi)存訪問(wèn)”協(xié)議(SD-RDMA),大幅降低了請(qǐng)求延時(shí)。

在存儲(chǔ)層面,該架構(gòu)打造了支持 SSD、英特爾 傲騰 持久內(nèi)存、以及 DRAM 的 Key-Value 存儲(chǔ)引擎,將 CPU 層面的存儲(chǔ)操作也轉(zhuǎn)移到 FPGA 中,最大程度發(fā)揮 FPGA 的能力,相比 CPU 方案,將存儲(chǔ)引擎的吞吐能力提升 5 倍以上。該引擎還利用英特爾 傲騰 持久內(nèi)存的特性,讓基于異構(gòu)存儲(chǔ)的索引系統(tǒng)幾乎達(dá)到純 DRAM 相同的性能指標(biāo),成本降低 30%。同時(shí)相比之前小時(shí)級(jí)的故障恢復(fù)速度,異構(gòu)存儲(chǔ)的索引系統(tǒng)只需幾分鐘就能重新上線。

LaoFe NDP 的計(jì)算加速仰仗 FPGA 作為領(lǐng)域?qū)S锰幚?,可以更有效地并行處理?shù)據(jù),提供更高效的內(nèi)存層次結(jié)構(gòu)與定制化的執(zhí)行單元,從而支持機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和大數(shù)據(jù)等場(chǎng)景。英特爾 FPGA 具備富于彈性的可編程硬件能力,延時(shí)低且可精確控制,單位算力功耗低、片上內(nèi)存大,適合于快手延時(shí)要求高、批處理比較小、并發(fā)性和重復(fù)性強(qiáng)的應(yīng)用場(chǎng)景。

8ac6f964-fea9-11ec-ba43-dac502259ad0.png

快手LaoFe NDP 架構(gòu)在英特爾軟硬件優(yōu)化下,最終實(shí)現(xiàn)了如下優(yōu)勢(shì):

■系統(tǒng)吞吐顯著提升,延時(shí)顯著降低:參數(shù)服務(wù)器的吞吐性能提升了 5-6 倍,整體請(qǐng)求延時(shí)降低了 70%-80%,提供更好的用戶體驗(yàn)。

■更好地控制 TCO:FPGA 的強(qiáng)大性能提供遠(yuǎn)超傳統(tǒng)方案的吞吐能力,僅需部署少量的服務(wù)器就能滿足特性的性能指標(biāo)要求,替代比可達(dá)到1:5,有效降低 TCO。

■降低性能抖動(dòng):基于CPU的軟件方案常因需要進(jìn)行高頻率更新而出現(xiàn)性能抖動(dòng),而通過(guò)FPGA來(lái)處理負(fù)載,能大幅減少性能抖動(dòng)。

通過(guò)快手的實(shí)踐能夠看出,以異構(gòu)計(jì)算加速不同負(fù)載,能夠顯著提升在推薦等場(chǎng)景下的系統(tǒng)吞吐與延時(shí)表現(xiàn)。未來(lái),英特爾還會(huì)和快手等合作伙伴一起,推進(jìn)面向未來(lái)數(shù)據(jù)中心的異構(gòu)參考架構(gòu),通過(guò) CPU、IPU、XPU 的產(chǎn)品組合以及軟件堆棧,以及智能網(wǎng)絡(luò)結(jié)構(gòu),提供跨越整個(gè)數(shù)據(jù)管道的解決方案,高效挖掘海量數(shù)據(jù)中的智慧,讓用戶與用戶、用戶與內(nèi)容、用戶與商品可及時(shí)按需建立高效、有溫度的連接互動(dòng)。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10327

    瀏覽量

    181155
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    14

    文章

    10377

    瀏覽量

    91777
  • 異構(gòu)計(jì)算
    +關(guān)注

    關(guān)注

    2

    文章

    112

    瀏覽量

    17248

原文標(biāo)題:英特爾助力快手實(shí)現(xiàn)異構(gòu)計(jì)算加速,顯著提升性能,降低系統(tǒng)TCO

文章出處:【微信號(hào):英特爾中國(guó),微信公眾號(hào):英特爾中國(guó)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    什么是企業(yè)云服務(wù)器-云計(jì)算

    企業(yè)云服務(wù)器是指為企業(yè)提供的基于云計(jì)算技術(shù)的服務(wù)器解決方案。華納云是一家云計(jì)算服務(wù)提供商,為企業(yè)客戶提供云
    的頭像 發(fā)表于 12-29 17:57 ?1140次閱讀

    結(jié)合AI算法的邊緣計(jì)算服務(wù)器,在城市管理場(chǎng)景有什么作用?

    在智慧城市建設(shè)的棋盤(pán)上,邊緣計(jì)算服務(wù)器正成為激活全城AI細(xì)胞的"神經(jīng)突觸"。當(dāng)算法模型走出數(shù)據(jù)中心,通過(guò)邊緣計(jì)算服務(wù)器、邊緣計(jì)算盒子、邊緣
    的頭像 發(fā)表于 10-17 15:31 ?576次閱讀
    結(jié)合AI算法的邊緣<b class='flag-5'>計(jì)算</b><b class='flag-5'>服務(wù)器</b>,在城市管理場(chǎng)景有什么作用?

    天波科普:算力超過(guò)30T的邊緣計(jì)算服務(wù)器可以做什么?

    邊緣計(jì)算服務(wù)器憑借其強(qiáng)大的本地化處理能力,正在重塑人工智能與物聯(lián)網(wǎng)應(yīng)用的邊界。這類設(shè)備不僅能解決云端計(jì)算延遲問(wèn)題,還能在復(fù)雜環(huán)境中實(shí)現(xiàn)實(shí)時(shí)決策與深度分析。但AI邊緣計(jì)算盒子、邊緣
    的頭像 發(fā)表于 09-28 11:18 ?876次閱讀
    天波科普:算力超過(guò)30T的邊緣<b class='flag-5'>計(jì)算</b><b class='flag-5'>服務(wù)器</b>可以做什么?

    異構(gòu)計(jì)算解決方案(兼容不同硬件架構(gòu))

    異構(gòu)計(jì)算解決方案通過(guò)整合不同類型處理(如CPU、GPU、NPU、FPGA等),實(shí)現(xiàn)硬件資源的高效協(xié)同與兼容,滿足多樣化計(jì)算需求。其核心技術(shù)與實(shí)踐方案如下: 一、硬件架構(gòu)設(shè)計(jì) 異構(gòu)處理
    的頭像 發(fā)表于 06-23 07:40 ?1093次閱讀

    硅谷GPU云服務(wù)器是什么意思?使用指南詳解

    硅谷GPU云服務(wù)器本質(zhì)上是一種IaaS(基礎(chǔ)設(shè)施即服務(wù))產(chǎn)品,它將物理服務(wù)器上的GPU資源通過(guò)虛擬化技術(shù)分割成可彈性調(diào)配的云服務(wù)。與普通CPU云服務(wù)
    的頭像 發(fā)表于 06-16 09:41 ?753次閱讀

    如何釋放異構(gòu)計(jì)算的潛能?Imagination與Baya Systems的系統(tǒng)架構(gòu)實(shí)踐啟示

    報(bào)告作者:PallaviSharma,Imaginaiton產(chǎn)品管理總監(jiān)Dr.EricNorige,BayaSystems首席軟件架構(gòu)師關(guān)注Imagination公眾號(hào),消息框發(fā)送【異構(gòu)計(jì)算】,即可
    的頭像 發(fā)表于 06-13 08:33 ?1426次閱讀
    如何釋放<b class='flag-5'>異構(gòu)計(jì)算</b>的潛能?Imagination與Baya Systems的系統(tǒng)架構(gòu)實(shí)踐啟示

    AIO-GS1N2:雙核異構(gòu)服務(wù)器主板

    的超大容量SSD。適用于智能網(wǎng)關(guān)服務(wù)器等類型產(chǎn)品及多個(gè)行業(yè)領(lǐng)域。雙核心板模組設(shè)計(jì)主板采用雙核心異構(gòu)設(shè)計(jì),兩核心模組獨(dú)立工作,其一模組可執(zhí)行通用計(jì)算,另一模組進(jìn)行AI
    的頭像 發(fā)表于 06-11 16:32 ?1178次閱讀
    AIO-GS1N2:雙核<b class='flag-5'>異構(gòu)</b>的<b class='flag-5'>服務(wù)器</b>主板

    能效提升3倍!異構(gòu)計(jì)算架構(gòu)讓AI跑得更快更省電

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)異構(gòu)計(jì)算架構(gòu)通過(guò)集成多種不同類型的處理單元(如CPU、GPU、NPU、FPGA、DSP等),針對(duì)不同計(jì)算任務(wù)的特點(diǎn)進(jìn)行分工協(xié)作,從而在性能、能效和靈活性之間實(shí)現(xiàn)最優(yōu)平衡
    的頭像 發(fā)表于 05-25 01:55 ?4307次閱讀

    ARM服務(wù)器解決方案

    ARM服務(wù)器解決方案已成為異構(gòu)計(jì)算領(lǐng)域的重要技術(shù)路徑,其核心優(yōu)勢(shì)與多元化場(chǎng)景適配性正加速產(chǎn)業(yè)滲透。以下為關(guān)鍵要點(diǎn)分析: 一、核心優(yōu)勢(shì)與架構(gòu)設(shè)計(jì) 能效比優(yōu)化? ARM架構(gòu)基于RISC指令集,單節(jié)點(diǎn)功耗
    的頭像 發(fā)表于 05-16 07:44 ?1311次閱讀
    ARM<b class='flag-5'>服務(wù)器</b>解決方案
    三原县| 平泉县| 葫芦岛市| 麻城市| 汉阴县| 庆阳市| 千阳县| 化州市| 宁国市| 育儿| 治县。| 甘南县| 革吉县| 博罗县| 绥德县| 三门峡市| 海淀区| 海城市| 娄底市| 三都| 邹城市| 沙雅县| 平定县| 丽水市| 枣强县| 肇东市| 万盛区| 堆龙德庆县| 西峡县| 福州市| 鄂托克前旗| 保定市| 乌拉特中旗| 大宁县| 布尔津县| 丰顺县| 巴楚县| 宁晋县| 德安县| 乌恰县| 遵化市|