日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

潤和軟件StackRUNS異構(gòu)分布式推理框架的應(yīng)用案例

潤和軟件 ? 來源:潤和軟件 ? 2025-06-13 09:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

江蘇潤和軟件股份有限公司(以下簡(jiǎn)稱“潤和軟件”)自主研發(fā)的StackRUNS異構(gòu)分布式推理框架已在實(shí)際場(chǎng)景中取得顯著成效,成功應(yīng)用于大型園區(qū)多模態(tài)模型演練及高校滿血版DeepSeek-MoE 671B的運(yùn)行,有效推動(dòng)了大模型技術(shù)的快速落地。

案例一:大型園區(qū)多模態(tài)模型演練

案例背景:

由于建設(shè)分期不同及承建單位多樣,該智慧園區(qū)的AI基礎(chǔ)設(shè)施呈現(xiàn)出高度異構(gòu)特征,包括NVIDIA T4、NVIDIA 3090、Atlas 300I DUO等多種AI加速設(shè)備,并在不同場(chǎng)景下協(xié)同運(yùn)行。這些設(shè)備承擔(dān)著包括人流密度監(jiān)測(cè)、人臉識(shí)別、車牌抓拍等計(jì)算機(jī)視覺任務(wù),系統(tǒng)負(fù)載、資源調(diào)度與運(yùn)維策略已形成穩(wěn)定運(yùn)行機(jī)制。

近期,該園區(qū)在安防升級(jí)過程中面臨一項(xiàng)臨時(shí)但復(fù)雜的智能分析挑戰(zhàn):在突發(fā)事件響應(yīng)、演練預(yù)警或夜間非業(yè)務(wù)時(shí)段,需臨時(shí)部署并運(yùn)行多模態(tài)大模型,實(shí)現(xiàn)圖文聯(lián)合理解、行為鏈條分析、場(chǎng)景異常檢測(cè)等復(fù)雜推理任務(wù)。該需求需在不增加硬件投入、不影響現(xiàn)有業(yè)務(wù)運(yùn)行的前提下完成。

應(yīng)對(duì)方案:

為應(yīng)對(duì)這一挑戰(zhàn),潤和軟件自研的StackRUNS異構(gòu)分布式推理框架成為關(guān)鍵解決方案。該框架具備以下核心能力:

1. 異構(gòu)算力識(shí)別與建模:自動(dòng)識(shí)別各設(shè)備的計(jì)算能力、顯存規(guī)格與精度支持能力,為模型切片和任務(wù)分配提供實(shí)時(shí)依據(jù);

2. 模型智能切分與并行執(zhí)行:支持基于專家路由與自動(dòng)切分策略,將超大模型按需劃分為多個(gè)計(jì)算子任務(wù),分布式調(diào)度到可用節(jié)點(diǎn);

3. 輕量級(jí)調(diào)度與動(dòng)態(tài)推理通路編排:在不干擾現(xiàn)有CV業(yè)務(wù)的前提下,構(gòu)建獨(dú)立推理通路,臨時(shí)占用空閑資源執(zhí)行推理任務(wù),任務(wù)完成后自動(dòng)回收;

4. 混合精度與量化模型支持:支持INT8、INT4等低精度模型快速加載,提升內(nèi)存利用率與執(zhí)行效率;

5. 統(tǒng)一通信與高效協(xié)同機(jī)制:通過通信適配層封裝多協(xié)議通信接口,實(shí)現(xiàn)多設(shè)備間高效數(shù)據(jù)傳輸與協(xié)同執(zhí)行。

60eaf6f6-45df-11f0-b715-92fbcf53809c.png

StackRUNS多模態(tài)模型場(chǎng)景圖

應(yīng)用效果:

StackRUNS幫助超大模型在資源受限、基礎(chǔ)設(shè)施異構(gòu)的環(huán)境中,實(shí)現(xiàn)“即需即調(diào)、彈性運(yùn)行、無感部署”的能力,顯著提升園區(qū)對(duì)突發(fā)安防場(chǎng)景的智能響應(yīng)水平,為大模型在城市級(jí)AI基礎(chǔ)設(shè)施中的靈活應(yīng)用提供了可復(fù)制范式。

案例二:高校運(yùn)行滿血版DeepSeek-MoE 671B

案例背景:

某高校在人工智能教學(xué)與科研實(shí)踐中,面臨運(yùn)行超大規(guī)模模型的現(xiàn)實(shí)挑戰(zhàn)。一方面,教學(xué)樓、實(shí)驗(yàn)樓與計(jì)算中心分布著多種異構(gòu)計(jì)算資源,包括GPU、NPU設(shè)備及部分高性能CPU節(jié)點(diǎn);另一方面,受限于經(jīng)費(fèi)與硬件條件,難以通過集中式部署滿足超大模型推理需求。

為此,該高校引入潤和軟件自研的StackRUNS異構(gòu)分布式推理框架,成功在現(xiàn)有資源基礎(chǔ)上部署并運(yùn)行了DeepSeek-MoE 671B級(jí)別的多模態(tài)大模型。

攻克難點(diǎn):

1. 通信開銷高,跨設(shè)備、節(jié)點(diǎn)推理效率受限:傳統(tǒng)通信架構(gòu)難以適配異構(gòu)環(huán)境,頻繁阻塞;

2. 模型規(guī)模大、結(jié)構(gòu)復(fù)雜度高:單個(gè)子模型或路由后激活路徑仍需百GB級(jí)顯存支撐,傳統(tǒng)GPU、NPU單卡難以支撐模型加載與中間態(tài)存儲(chǔ);

3. 切片并行策略自動(dòng)生成難:模型需劃分為跨卡跨節(jié)點(diǎn)子圖,兼顧通信代價(jià)、算子依賴與硬件負(fù)載能力,自動(dòng)化策略生成復(fù)雜;

4. 模型運(yùn)行狀態(tài)監(jiān)控與可視化困難:推理過程中需監(jiān)控路由結(jié)果、設(shè)備負(fù)載、通信代價(jià)、緩存命中率等。

6105b7de-45df-11f0-b715-92fbcf53809c.png

通過StackRUNS部署滿血版DeepSeek示例圖

最終效果:

借助StackRUNS,高校成功打通了異構(gòu)設(shè)備之間的算力協(xié)同壁壘,實(shí)現(xiàn)了超大模型的低門檻部署與高效推理,廣泛應(yīng)用于圖文語義理解、跨模態(tài)知識(shí)挖掘、學(xué)生AI實(shí)驗(yàn)等場(chǎng)景。該方案不僅顯著提升了設(shè)備利用率與推理任務(wù)執(zhí)行效率,也加速了人工智能專業(yè)課程與科研課題向真實(shí)算力環(huán)境的落地驗(yàn)證,真正實(shí)現(xiàn)了“在資源有限條件下,用分布式智能拼出超級(jí)算力”,為高校人工智能教學(xué)與科研提供了強(qiáng)有力的技術(shù)支撐。

江蘇潤和軟件股份有限公司(簡(jiǎn)稱“潤和軟件”)成立于2006年,2012年在深圳證券交易所創(chuàng)業(yè)板上市(證券代碼:300339),是國家重點(diǎn)規(guī)劃布局內(nèi)的大型軟件企業(yè)。公司總部位于南京,在北京、上海、深圳、香港等22個(gè)國內(nèi)主要城市設(shè)有研發(fā)中心或分子公司,在日本、美國、新加坡等國設(shè)有海外分支機(jī)構(gòu),全球員工約13000人,擁有全球化的技術(shù)整合、客戶響應(yīng)與服務(wù)到達(dá)能力。

秉承“做民族軟件脊梁,擔(dān)世界進(jìn)步責(zé)任”的使命,潤和軟件致力成為“中國數(shù)智技術(shù)與服務(wù)創(chuàng)新的引領(lǐng)者”,通過國產(chǎn)化、數(shù)字化、智能化創(chuàng)新技術(shù),軟硬件一體化解決方案能力及全生命周期軟件服務(wù)體系,激活行業(yè)新動(dòng)能、發(fā)展新質(zhì)生產(chǎn)力,助力廣大客戶數(shù)字化轉(zhuǎn)型和智能化升級(jí)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41315

    瀏覽量

    302691
  • 潤和軟件
    +關(guān)注

    關(guān)注

    1

    文章

    420

    瀏覽量

    2303
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3797

    瀏覽量

    5278

原文標(biāo)題:潤和軟件StackRUNS異構(gòu)分布式推理框架行業(yè)應(yīng)用案例

文章出處:【微信號(hào):hoperun300339,微信公眾號(hào):潤和軟件】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI Ceph 分布式存儲(chǔ)教程資料大模型學(xué)習(xí)資料2026

    的 S3 兼容接口設(shè)計(jì),使得 AI 框架可以無縫對(duì)接底層的硬件設(shè)施,實(shí)現(xiàn)了上層應(yīng)用與底層存儲(chǔ)的解耦。 四、 賦能推理部署:高并發(fā)與低延遲的平衡 分布式存儲(chǔ)不僅服務(wù)于訓(xùn)練,更是大模型推理
    發(fā)表于 05-01 17:35

    分布式光伏發(fā)電接入配電網(wǎng)技術(shù)規(guī)定中關(guān)于“四可”裝置的內(nèi)容解析

    測(cè)、可調(diào)、可控)裝置的技術(shù)要求,將其從行業(yè)推薦性能力升級(jí)為剛性并網(wǎng)門檻。詳細(xì)了解光伏四可裝置可咨詢:1.3.7-5.0.0.4-6.2.0.0。這些規(guī)定既搭建了統(tǒng)一的技術(shù)框架,又為地方電網(wǎng)差異化落地預(yù)留空間,是分布式光伏合規(guī)并網(wǎng)、高效消納的核心遵循。
    的頭像 發(fā)表于 02-06 16:39 ?2898次閱讀
    <b class='flag-5'>分布式</b>光伏發(fā)電接入配電網(wǎng)技術(shù)規(guī)定中關(guān)于“四可”裝置的內(nèi)容解析

    分布式 IO 選型注意事項(xiàng)

    在工業(yè) 4.0 浪潮推動(dòng)下,分布式 IO 作為工業(yè)互聯(lián)的核心底層設(shè)備,已成為制造業(yè)實(shí)現(xiàn)設(shè)備互聯(lián)、數(shù)據(jù)采集、柔性生產(chǎn)的關(guān)鍵支撐。本文將助力企業(yè)避開選型誤區(qū),最大化發(fā)揮分布式 IO 的應(yīng)用價(jià)值。? 產(chǎn)品
    的頭像 發(fā)表于 12-30 14:14 ?550次閱讀
    <b class='flag-5'>分布式</b> IO 選型注意事項(xiàng)

    SC-3568HA:解鎖鴻蒙全權(quán)限API與分布式能力的工業(yè)控制平臺(tái)

    傳統(tǒng)嵌入開發(fā)面臨硬件碎片化、高權(quán)限功能缺失、分布式協(xié)同復(fù)雜及自動(dòng)化測(cè)試不足等痛點(diǎn)。SC-3568HA開發(fā)板基于鴻蒙系統(tǒng),通過統(tǒng)一內(nèi)核抽象層和硬件驅(qū)動(dòng)框架解決兼容問題,開放全量系統(tǒng)API支持高權(quán)限
    的頭像 發(fā)表于 12-18 11:27 ?7618次閱讀
    SC-3568HA:解鎖鴻蒙全權(quán)限API與<b class='flag-5'>分布式</b>能力的工業(yè)控制平臺(tái)

    如何解決分布式光伏計(jì)量難題?

    分布式光伏成增長主力 據(jù)《2025-2030年中國分布式光伏行業(yè)市場(chǎng)前景預(yù)測(cè)及未來發(fā)展趨勢(shì)研究報(bào)告》顯示,2024年中國分布式光伏新增裝機(jī)118.18GW,同比增長23%,占光伏新增裝機(jī)總量的43
    的頭像 發(fā)表于 11-07 14:55 ?437次閱讀
    如何解決<b class='flag-5'>分布式</b>光伏計(jì)量難題?

    工業(yè)數(shù)采網(wǎng)關(guān)在分布式設(shè)備運(yùn)維管理中的作用

    支撐。以下從核心功能與運(yùn)維價(jià)值兩個(gè)維度展開分析: 一、核心功能:打通分布式設(shè)備的數(shù)據(jù)孤島 多協(xié)議兼容與數(shù)據(jù)統(tǒng)一采集 分布式設(shè)備常涉及PLC、傳感器、工業(yè)機(jī)器人等異構(gòu)設(shè)備,采用Modbus、Profinet、OPC UA等不同協(xié)議
    的頭像 發(fā)表于 09-19 10:53 ?857次閱讀
    工業(yè)數(shù)采網(wǎng)關(guān)在<b class='flag-5'>分布式</b>設(shè)備運(yùn)維管理中的作用

    【節(jié)能學(xué)院】Acrel-1000DP分布式光伏監(jiān)控系統(tǒng)在奉賢平高食品 4.4MW 分布式光伏中應(yīng)用

    摘要:在“雙碳”和新型電力系統(tǒng)建設(shè)背景下,分布式光伏接入比例不斷提高,對(duì)配電網(wǎng)電壓、調(diào)度運(yùn)行及調(diào)峰等環(huán)節(jié)造成強(qiáng)烈沖擊。本文設(shè)計(jì)包含平臺(tái)層、設(shè)備層二層架構(gòu)體系的分布式光伏管控平臺(tái),以及小容量工商業(yè)
    的頭像 發(fā)表于 08-23 08:04 ?3689次閱讀
    【節(jié)能學(xué)院】Acrel-1000DP<b class='flag-5'>分布式</b>光伏監(jiān)控系統(tǒng)在奉賢平高食品 4.4MW <b class='flag-5'>分布式</b>光伏中應(yīng)用

    分布式光伏發(fā)電監(jiān)測(cè)系統(tǒng)技術(shù)方案

    分布式光伏發(fā)電監(jiān)測(cè)系統(tǒng)技術(shù)方案 柏峰【BF-GFQX】一、系統(tǒng)目標(biāo) :分布式光伏發(fā)電監(jiān)測(cè)系統(tǒng)旨在通過智能化的監(jiān)測(cè)手段,實(shí)現(xiàn)對(duì)分布式光伏電站的全方位、高精度、實(shí)時(shí)化管理。該系統(tǒng)能
    的頭像 發(fā)表于 08-22 10:51 ?3505次閱讀
    <b class='flag-5'>分布式</b>光伏發(fā)電監(jiān)測(cè)系統(tǒng)技術(shù)方案

    對(duì)于當(dāng)下分布式光伏發(fā)電市場(chǎng)前景預(yù)判

    自從531后,分布式光伏發(fā)電項(xiàng)目應(yīng)該是相對(duì)減少了許多,但是依然還是會(huì)有,未來趨勢(shì)是怎么樣,是儲(chǔ)能+自發(fā)自用余電不上網(wǎng),還是有什么新的政策,歡迎討論。
    發(fā)表于 07-25 08:58

    分布式光伏總出問題?安科瑞分布式光伏監(jiān)控系統(tǒng)來“救場(chǎng)”

    一、分布式光伏的痛點(diǎn)大揭秘 在 “雙碳” 目標(biāo)的大力推動(dòng)下,分布式光伏作為綠色能源領(lǐng)域的重要力量,正以前所未有的速度蓬勃發(fā)展,越來越多的企業(yè)和家庭選擇安裝分布式光伏系統(tǒng)。然而,隨著分布式
    的頭像 發(fā)表于 07-16 16:50 ?976次閱讀
    <b class='flag-5'>分布式</b>光伏總出問題?安科瑞<b class='flag-5'>分布式</b>光伏監(jiān)控系統(tǒng)來“救場(chǎng)”

    雙電機(jī)分布式驅(qū)動(dòng)汽車高速穩(wěn)定性機(jī)電耦合控制

    摘要:為了利用所設(shè)計(jì)的雙電機(jī)防滑差速驅(qū)動(dòng)系統(tǒng)來提高分布式驅(qū)動(dòng)汽車的動(dòng)力學(xué)性能,在前期同軸耦合驅(qū)動(dòng)控制理論研究的基礎(chǔ)上,開展該車的高速穩(wěn)定性機(jī)電耦合控制研究。建立并驗(yàn)證包含所設(shè)計(jì)驅(qū)動(dòng)系統(tǒng)在內(nèi)的分布式
    發(fā)表于 06-18 16:37

    軟件發(fā)布StackRUNS異構(gòu)分布式推理框架

    當(dāng)下,AI模型規(guī)模持續(xù)膨脹、多模態(tài)應(yīng)用場(chǎng)景日益復(fù)雜,企業(yè)正面臨異構(gòu)算力資源碎片化帶來的嚴(yán)峻挑戰(zhàn)。為應(yīng)對(duì)行業(yè)痛點(diǎn),江蘇軟件股份有限公司(以下簡(jiǎn)稱“
    的頭像 發(fā)表于 06-13 09:10 ?1622次閱讀
    <b class='flag-5'>潤</b>和<b class='flag-5'>軟件</b>發(fā)布<b class='flag-5'>StackRUNS</b><b class='flag-5'>異構(gòu)</b><b class='flag-5'>分布式</b><b class='flag-5'>推理</b><b class='flag-5'>框架</b>

    曙光存儲(chǔ)領(lǐng)跑中國分布式存儲(chǔ)市場(chǎng)

    近日,賽迪顧問發(fā)布《中國分布式存儲(chǔ)市場(chǎng)研究報(bào)告(2025)》,指出2024 年中國分布式存儲(chǔ)市場(chǎng)首次超過集中式存儲(chǔ),規(guī)模達(dá) 198.2 億元,增速 43.7%。
    的頭像 發(fā)表于 05-19 16:50 ?1481次閱讀

    上海電信攜手華為打造分布式云邊協(xié)同訓(xùn)推方案

    Deepseek加速行業(yè)推理應(yīng)用,面向企業(yè)算力租用以及推理數(shù)據(jù)不出園區(qū)的用算需求,上海電信基于“智云上?!毙滦突A(chǔ)架構(gòu),部署華為星河路由器打造400GE IP智算城域POD,提供分布式云邊協(xié)同
    的頭像 發(fā)表于 05-19 11:20 ?1075次閱讀

    分布式光伏電力問題層出不窮?安科瑞分布式光伏運(yùn)維系統(tǒng)來“救場(chǎng)”

    一、分布式光伏電力運(yùn)維,痛點(diǎn)大揭秘? ? 分布式光伏作為實(shí)現(xiàn)綠色能源轉(zhuǎn)型的關(guān)鍵一環(huán),近年來在我國得到了迅猛發(fā)展。國家能源局?jǐn)?shù)據(jù)顯示,截至 2023 年底,中國分布式光伏電站累計(jì)并網(wǎng)容量約為 2.5
    的頭像 發(fā)表于 05-07 17:14 ?1114次閱讀
    <b class='flag-5'>分布式</b>光伏電力問題層出不窮?安科瑞<b class='flag-5'>分布式</b>光伏運(yùn)維系統(tǒng)來“救場(chǎng)”
    合川市| 武冈市| 毕节市| 苍山县| 新安县| 五莲县| 嘉义县| 乌拉特中旗| 昌吉市| 河津市| 玉环县| 中阳县| 东源县| 鄱阳县| 武平县| 海兴县| 丰顺县| 杭锦后旗| 高碑店市| 新安县| 尼玛县| 新田县| 沁水县| 将乐县| 巴林右旗| 中卫市| 绥化市| 逊克县| 浦东新区| 韶关市| 丹阳市| 耿马| 湘潭市| 涞源县| 汕头市| 西青区| 互助| 黄陵县| 类乌齐县| 鹿泉市| 五寨县|