日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

華為數(shù)據(jù)存儲(chǔ)與「DaoCloud 道客」發(fā)布AI推理加速聯(lián)合解決方案

科技訊息 ? 來源:科技訊息 ? 作者:科技訊息 ? 2025-11-28 10:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI產(chǎn)業(yè)已從“追求模型能力極限”轉(zhuǎn)向“追求推理體驗(yàn)最優(yōu)化”,推理體驗(yàn)決定用戶與AI的交互質(zhì)感。當(dāng)前推理應(yīng)用快速發(fā)展,Token調(diào)用量爆發(fā)式增長,推理遇到“推不動(dòng)、推得慢、推得貴”三大瓶頸,成為產(chǎn)業(yè)規(guī)?;l(fā)展的攔路虎。在有限算力下,長序列輸入導(dǎo)致首Token時(shí)延(TTFT)增加,甚至超長序列超出模型上下文窗口限制;隨著并發(fā)數(shù)增加,推理吞吐開始下降,任務(wù)頻繁卡頓;歷史對(duì)話和行業(yè)知識(shí)的重復(fù)調(diào)用造成算力浪費(fèi),加大推理成本。如何優(yōu)化推理效率,是AI產(chǎn)業(yè)突破發(fā)展瓶頸的關(guān)鍵。

算力的有效利用對(duì)AI推理性能和成本優(yōu)化發(fā)揮著至關(guān)重要的作用,是企業(yè)核心競(jìng)爭(zhēng)力。算力平臺(tái)需適配多元存儲(chǔ)、Kubernetes集群及推理框架,但硬件生態(tài)碎片化、資源分配僵化、調(diào)度缺乏AI任務(wù)感知、運(yùn)維可觀性不足等技術(shù)兼容難題,正嚴(yán)重制約推理應(yīng)用發(fā)展。

近日,華為數(shù)據(jù)存儲(chǔ)與「DaoCloud 道客」聯(lián)合推出了AI推理加速聯(lián)合解決方案。該方案融合了華為UCM(Unified Cache Manager)推理記憶數(shù)據(jù)管理技術(shù)和道客d.run算力調(diào)度平臺(tái),圍繞大模型歷史數(shù)據(jù),實(shí)現(xiàn)KV Cache數(shù)據(jù)池化管理,以資源的精細(xì)化管理和智能調(diào)度提升算力利用率,為AI推理加速提供全方位技術(shù)支撐。

道客d.run算力調(diào)度平臺(tái)可支持算力與顯存資源的細(xì)粒度切分及池化,通過多種調(diào)度策略實(shí)現(xiàn)算力資源的最大化利用。調(diào)度器具備拓?fù)涓兄芰Γ蓛?yōu)化任務(wù)在xPU間的通信效率,保障AI任務(wù)穩(wěn)定低耗運(yùn)行。平臺(tái)提供企業(yè)級(jí)運(yùn)維支持,提供多租戶隔離、資源配額管理、完整的監(jiān)控告警及計(jì)費(fèi)計(jì)量等功能,滿足企業(yè)級(jí)使用與運(yùn)維需求。同時(shí)具備多元生態(tài)兼容性,適配NVIDIA、華為昇騰、寒武紀(jì)等多種品牌AI算力,支持TensorFlow等主流AI框架,借助Kubernetes的CSI無縫對(duì)接華為OceanStor AI存儲(chǔ),簡(jiǎn)化管理并為AI任務(wù)數(shù)據(jù)讀寫提供穩(wěn)定支撐。

華為UCM是以KV Cache為核心,構(gòu)建多級(jí)緩存空間的分層管理與智能流動(dòng)機(jī)制,實(shí)現(xiàn)數(shù)據(jù)在高性能緩存HBM、內(nèi)存DRAM和外置OceanStor A系列存儲(chǔ)的分級(jí)緩存和查詢,確保推理記憶知識(shí)全量保存。并且,UCM還融合多項(xiàng)創(chuàng)新加速算法:自適應(yīng)全局Prefix Cache支持公共前綴、歷史對(duì)話和RAG知識(shí)塊多種拼接組合場(chǎng)景的復(fù)用,通過以查代算,最大程度改善TTFT;全流程稀疏加速算法提供Prefill階段的超長KV分片卸載和增量稀疏,以及Decode階段的動(dòng)態(tài)稀疏,提升長序列推理吞吐。

在Qwen3-32B模型上,測(cè)試問答助手場(chǎng)景,開啟Prefix Cache和RAG Chunk功能。測(cè)試數(shù)據(jù)表明,首Token時(shí)延降低約55%,且隨著序列長度越長,TTFT降低效果越明顯,通過“以查代算”的方式,避免了大量歷史對(duì)話信息的重復(fù)計(jì)算。

wKgZPGkpAvGAKeHhAAEP1aPeZ3M080.png

圖1 問答助手場(chǎng)景對(duì)比開關(guān)UCM的TTFT

測(cè)試長文檔推理場(chǎng)景,設(shè)定序列長度輸入32K+輸出1K,開啟Chunk Prefill和GSA稀疏化功能。測(cè)試數(shù)據(jù)表明,在并發(fā)數(shù)為30時(shí),TTFT最大降低47%,端到端吞吐最大提升75%。

wKgZO2kpAvGAE5kwAABaWm9WI3o473.png

圖2 長文檔推理場(chǎng)景對(duì)比開關(guān)UCM的TTFT

wKgZPGkpAvKAetkFAABZTGktrWw833.png

圖3 長文檔推理場(chǎng)景對(duì)比開關(guān)UCM的E2E吞吐

關(guān)閉UCM,當(dāng)并發(fā)數(shù)超17時(shí),請(qǐng)求開始排隊(duì);開啟UCM,當(dāng)并發(fā)數(shù)超32時(shí),請(qǐng)求開始排隊(duì)。在以上情況下,開啟UCM對(duì)比關(guān)閉UCM場(chǎng)景,并發(fā)能力提升88.24%。

wKgZO2kpAvOANQmgAABOXLrZ1B0980.png

圖4 長文檔推理場(chǎng)景對(duì)比開關(guān)UCM的并發(fā)能力

目前,該方案正在電力、金融等行業(yè)試點(diǎn)。未來,雙方將持續(xù)深化技術(shù)合作,推動(dòng)技術(shù)迭代與行業(yè)適配,助力AI技術(shù)在更多行業(yè)的落地應(yīng)用。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 華為
    +關(guān)注

    關(guān)注

    218

    文章

    36212

    瀏覽量

    262722
  • 數(shù)據(jù)存儲(chǔ)

    關(guān)注

    5

    文章

    1038

    瀏覽量

    53020
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41305

    瀏覽量

    302687
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    華為破解HBM依賴!AI推理黑科技UCM上線,9月正式開源

    8月12日,在2025金融AI推理應(yīng)用落地與發(fā)展論壇上,華為公司副總裁、數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁周越峰宣布,
    的頭像 發(fā)表于 08-13 08:58 ?1.1w次閱讀
    <b class='flag-5'>華為</b>破解HBM依賴!<b class='flag-5'>AI</b><b class='flag-5'>推理</b>黑科技UCM上線,9月正式開源

    中軟國際聯(lián)合華為發(fā)布多個(gè)解決方案

    大會(huì)論壇中,中軟國際聯(lián)合華為共同發(fā)布化工智慧工廠解決方案、智慧園區(qū)業(yè)態(tài)聯(lián)合方案及《Al Camp
    的頭像 發(fā)表于 03-24 10:57 ?325次閱讀

    華為發(fā)布人工智能教學(xué)中心(AIEC)解決方案,加速普教AI通識(shí)教育普及

    華為聯(lián)合行業(yè)伙伴發(fā)布面向普教行業(yè)的人工智能教學(xué)中心(AI Education Center, 以下簡(jiǎn)稱"AIEC")解決方案,旨在
    的頭像 發(fā)表于 03-06 17:40 ?424次閱讀
    <b class='flag-5'>華為</b><b class='flag-5'>發(fā)布</b>人工智能教學(xué)中心(AIEC)<b class='flag-5'>解決方案</b>,<b class='flag-5'>加速</b>普教<b class='flag-5'>AI</b>通識(shí)教育普及

    華為發(fā)布全新升級(jí)星河AI園區(qū)網(wǎng)絡(luò)解決方案

    華為全聯(lián)接大會(huì)2025期間,在以“AI時(shí)代,星河AI網(wǎng)絡(luò)智聯(lián)新啟航”數(shù)據(jù)通信峰會(huì)上,華為面向全球發(fā)布
    的頭像 發(fā)表于 09-25 09:41 ?1014次閱讀

    華為發(fā)布星河AI園區(qū)全域安全解決方案

    華為全聯(lián)接大會(huì)2025期間,在以“共建AI Campus,躍升行業(yè)數(shù)智化”為主題的智慧園區(qū)創(chuàng)新峰會(huì)上,華為發(fā)布星河AI園區(qū)全域安全
    的頭像 發(fā)表于 09-19 17:40 ?1492次閱讀

    中軟國際攜手華為發(fā)布醫(yī)藥聯(lián)合解決方案

    近日,在華為全聯(lián)接大會(huì)2025“智慧園區(qū)與智算圓桌”活動(dòng)上,中軟國際華為技術(shù)與解決方案集團(tuán)模型工場(chǎng)業(yè)務(wù)部總裁張偉受邀出席。會(huì)上,在華為智算服務(wù)聯(lián)合
    的頭像 發(fā)表于 09-19 14:16 ?1137次閱讀

    此芯科技發(fā)布“合一”AI加速計(jì)劃,賦能邊緣與端側(cè)AI創(chuàng)新

    此芯科技正式發(fā)布“合一”AI加速計(jì)劃,旨在為邊緣計(jì)算和端側(cè)AI場(chǎng)景提供高能效的全棧算力解決方案。該計(jì)劃由此芯科技
    的頭像 發(fā)表于 09-15 11:53 ?2011次閱讀
    此芯科技<b class='flag-5'>發(fā)布</b>“合一”<b class='flag-5'>AI</b><b class='flag-5'>加速</b>計(jì)劃,賦能邊緣與端側(cè)<b class='flag-5'>AI</b>創(chuàng)新

    軟通動(dòng)力入選828精選AI行業(yè)聯(lián)合解決方案

    近日,第四屆828 B2B企業(yè)節(jié)開幕式上,華為云攜手生態(tài)伙伴,以精準(zhǔn)的行業(yè)洞察與聯(lián)合創(chuàng)新,集中推出多款AI行業(yè)聯(lián)合解決方案,釋放
    的頭像 發(fā)表于 09-01 11:37 ?1056次閱讀

    DaoCloud 與星融元達(dá)成戰(zhàn)略合作|走向高效、開放的算力集群建設(shè)

    上海道網(wǎng)絡(luò)科技有限公司(以下簡(jiǎn)稱“「DaoCloud 」”)與星融元數(shù)據(jù)技術(shù)(蘇州)有限公司(以下簡(jiǎn)稱“星融元”)宣布簽署戰(zhàn)略合作協(xié)議
    的頭像 發(fā)表于 08-19 14:04 ?1604次閱讀
    <b class='flag-5'>DaoCloud</b> 與星融元達(dá)成戰(zhàn)略合作|走向高效、開放的算力集群建設(shè)

    華為亮相2025金融AI推理應(yīng)用落地與發(fā)展論壇

    創(chuàng)新技術(shù)——UCM推理記憶數(shù)據(jù)管理器,旨在推動(dòng)AI推理體驗(yàn)升級(jí),提升推理性價(jià)比,加速
    的頭像 發(fā)表于 08-15 09:45 ?1406次閱讀

    今日看點(diǎn)丨華為發(fā)布AI推理創(chuàng)新技術(shù)UCM;比亞迪汽車出口暴增130%

    ? ? 降低HBM依賴,華為發(fā)布AI推理創(chuàng)新技術(shù)UCM ? 日前,華為正式發(fā)布
    發(fā)表于 08-13 09:45 ?5743次閱讀

    廣汽華為聯(lián)合AI解決方案入選國際電聯(lián)全球標(biāo)桿案例

    。峰會(huì)期間,ITU正式發(fā)布《人工智能向善:創(chuàng)新擴(kuò)大影響案例集》(AI for Good - Innovate for Impact Report)2025年中期報(bào)告,其中,廣汽集團(tuán)聯(lián)合華為
    的頭像 發(fā)表于 07-24 14:34 ?1498次閱讀

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    網(wǎng)絡(luò)智能診斷平臺(tái)。通過對(duì)私有化網(wǎng)絡(luò)數(shù)據(jù)的定向訓(xùn)練,信而泰打造了高性能、高可靠性的網(wǎng)絡(luò)診斷模型,顯著提升了AI輔助診斷的精準(zhǔn)度與實(shí)用性。該方案實(shí)現(xiàn)了網(wǎng)絡(luò)全流量深度解析能力與AI智能
    發(fā)表于 07-16 15:29

    軟通動(dòng)力攜手華為云推出AI知識(shí)引擎與數(shù)據(jù)工程融合創(chuàng)新解決方案

    華為開發(fā)者大會(huì)2025中,軟通動(dòng)力攜手華為云以華為云昇騰AI、盤古大模型、ModelArts等為技術(shù)底座,全新升級(jí)數(shù)據(jù)治理基線
    的頭像 發(fā)表于 06-28 17:07 ?1802次閱讀

    華為AI UBB解決方案加速網(wǎng)絡(luò)邁向高階智能

    解決方案,包括AI FAN、AI OTN、AI WAN和ADN四大部分,端到端覆蓋家庭網(wǎng)絡(luò)、承載網(wǎng)絡(luò)和UBB智能管控系統(tǒng)。AI UBB
    的頭像 發(fā)表于 06-23 15:56 ?1579次閱讀
    商都县| 霍城县| 威信县| 万山特区| 惠州市| 门头沟区| 舟曲县| 陕西省| 房山区| 高唐县| 阿拉善左旗| 孝感市| 偏关县| 安国市| 唐河县| 浮梁县| 古浪县| 灵宝市| 庄河市| 柳河县| 南昌县| 海城市| 金乡县| 德清县| 丰顺县| 衡南县| 监利县| 海兴县| 清苑县| 莱州市| 镇康县| 桃江县| 略阳县| 连城县| 东城区| 望城县| 栖霞市| 敦化市| 牙克石市| 疏附县| 新源县|