日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

沐曦助力上海創(chuàng)智學(xué)院siiRL 2.0全面升級(jí)

沐曦MetaX ? 來(lái)源:沐曦MetaX ? 2025-09-29 11:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能加速邁向大模型與智能體時(shí)代的今天,強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)已經(jīng)成為推動(dòng)智能系統(tǒng)演化的關(guān)鍵技術(shù)。隨著強(qiáng)化學(xué)習(xí)訓(xùn)練規(guī)模不斷擴(kuò)大,對(duì)底層算力提出了前所未有的挑戰(zhàn)。近日,上海創(chuàng)智學(xué)院 AI Infra 團(tuán)隊(duì)發(fā)布的 siiRL 2.0,以其卓越特性為強(qiáng)化學(xué)習(xí)的發(fā)展帶來(lái)了新的突破,沐曦則憑借自身優(yōu)勢(shì)為 siiRL 2.0 的升級(jí)提供了堅(jiān)實(shí)支撐,共同推動(dòng)強(qiáng)化學(xué)習(xí)正式邁入 “千卡級(jí)”時(shí)代。

siiRL:全分布式架構(gòu)的顛覆性突破

上海創(chuàng)智學(xué)院AI Infra團(tuán)隊(duì)發(fā)布siiRL 2.0,聚焦性能、生態(tài)與前沿探索全面升級(jí):

卓越性能與擴(kuò)展性

基于全分布式架構(gòu),實(shí)現(xiàn)千卡級(jí)近線性擴(kuò)展與業(yè)界領(lǐng)先吞吐,性能在7B~235B(Dense/MoE)等大規(guī)模模型上穩(wěn)定驗(yàn)證。

自主可控,擁抱國(guó)產(chǎn)算力

全面適配多家主流國(guó)產(chǎn)芯片并完成千卡級(jí)擴(kuò)展驗(yàn)證,為AI基礎(chǔ)設(shè)施夯實(shí)自主可控的算力底座。

靈活易用與生態(tài)兼容

獨(dú)創(chuàng)DAG工作流支持無(wú)代碼算法實(shí)驗(yàn),兼容Megatron/FSDP等主流后端,極大提升研發(fā)效率。

面向前沿,支持多智能體研究

內(nèi)建強(qiáng)大的多智能體協(xié)同訓(xùn)練框架,為探索“智能涌現(xiàn)”等前沿課題提供關(guān)鍵基礎(chǔ)設(shè)施。

9b4e6c46-9829-11f0-8c8f-92fbcf53809c.png

圖 1:siiRL架構(gòu)概覽

技術(shù)論文:https://arxiv.org/abs/2507.13833

開(kāi)源代碼倉(cāng)庫(kù):https://github.com/sii-research/siiRL

在本次siiRL的升級(jí)適配工作中,沐曦做了一系列針對(duì)性優(yōu)化:

siiRL框架高效適配

基于沐曦自研的MXMACA軟件棧,已經(jīng)完整適配了siiRL需要的所有后端引擎(Vllm/Pytorch fsdp/Megatron-LM/Ray)以及深度優(yōu)化的mccl高性能通信庫(kù),不需要其他額外的適配工作,實(shí)現(xiàn)了siiRL框架的高效適配。

超節(jié)點(diǎn)scale up

沐曦Dragonfly超節(jié)點(diǎn),提供了64卡的光互連高速通信帶寬。在訓(xùn)練過(guò)程中,通過(guò)設(shè)置fsdp_size=64,可以充分利用超節(jié)點(diǎn)內(nèi)的帶寬,提升模型的訓(xùn)練效率。

顯存優(yōu)化

通過(guò)設(shè)置模型參數(shù)offload選項(xiàng),在共置集群上,有效降低了rollout和training階段的峰值顯存,可以采用更優(yōu)的切分方式,進(jìn)一步提升計(jì)算效率。

分布式策略調(diào)整

結(jié)合實(shí)際負(fù)載與硬件拓?fù)?,?yōu)化了不同模型的分布式訓(xùn)練參數(shù)切分方式,并調(diào)整了親和性配置,以提升通信效率。

通過(guò)上述優(yōu)化,siiRL框架在沐曦超節(jié)點(diǎn)集群上實(shí)現(xiàn)了從64卡到1024卡的穩(wěn)定擴(kuò)展,系統(tǒng)保持了超過(guò)92%的高線性度拓展效率。在模型精度上,與國(guó)際主流生態(tài) GPU的訓(xùn)練結(jié)果相比,沐曦超節(jié)點(diǎn)集群在驗(yàn)證集上的平均絕對(duì)誤差控制在0.5%以內(nèi),滿足實(shí)際應(yīng)用場(chǎng)景的精度要求。

9bc2af0c-9829-11f0-8c8f-92fbcf53809c.png

圖 2:siiRL在沐曦超節(jié)點(diǎn)集群上的擴(kuò)展性評(píng)估,

展示了64卡到1024GPU規(guī)模下的高線性擴(kuò)展能力

隨著 AI 技術(shù)逐漸成為國(guó)家科技競(jìng)爭(zhēng)的核心,構(gòu)建自主可控的算力基礎(chǔ)設(shè)施已經(jīng)成為產(chǎn)業(yè)發(fā)展的必然選擇。沐曦與上海創(chuàng)智學(xué)院 AI Infra 團(tuán)隊(duì)的攜手合作,不僅驗(yàn)證了國(guó)產(chǎn) GPU 在前沿 AI 應(yīng)用上的可行性與先進(jìn)性,更為中國(guó)科研機(jī)構(gòu)、產(chǎn)業(yè)界提供了面向未來(lái)的堅(jiān)實(shí)算力底座。沐曦將持續(xù)與產(chǎn)學(xué)研伙伴深度協(xié)作,推動(dòng)大模型框架與國(guó)產(chǎn) GPU 的深度適配和生態(tài)完善,加速?gòu)?qiáng)化學(xué)習(xí)、大模型、智能體等關(guān)鍵領(lǐng)域的創(chuàng)新應(yīng)用落地。

關(guān)于沐曦

沐曦致力于自主研發(fā)全棧高性能GPU芯片及計(jì)算平臺(tái),為智算、通用計(jì)算、云渲染等前沿領(lǐng)域提供高能效、高通用性的算力支撐,助力數(shù)字經(jīng)濟(jì)發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5283

    瀏覽量

    136101
  • 沐曦
    +關(guān)注

    關(guān)注

    1

    文章

    103

    瀏覽量

    1885
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3797

    瀏覽量

    5280

原文標(biāo)題:強(qiáng)化學(xué)習(xí)進(jìn)入“千卡級(jí)”時(shí)代,沐曦助力 siiRL 2.0 全面升級(jí)

文章出處:【微信號(hào):沐曦MetaX,微信公眾號(hào):沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    股份開(kāi)源TileLang-Metax并入駐TileAI社區(qū)

    4月27日,股份面向GPU的TileLang適配支持與優(yōu)化項(xiàng)目TileLang-Metax正式成為T(mén)ileAI社區(qū)官方主線版本,代碼已開(kāi)源并托管于TileAI組織之下,與Til
    的頭像 發(fā)表于 04-28 15:57 ?193次閱讀

    股份Day 0適配DeepSeek-V4-Flash模型

    4月24日,股份攜手FlagOS,已完對(duì)DeepSeek最新開(kāi)源的DeepSeek-V4-Flash模型的Day 0適配。同日,股份還聯(lián)合
    的頭像 發(fā)表于 04-28 15:53 ?469次閱讀

    股份與上海聯(lián)通正式簽署戰(zhàn)略合作協(xié)議

    4月17日,股份與中國(guó)聯(lián)合網(wǎng)絡(luò)通信有限公司上海市分公司(簡(jiǎn)稱(chēng)“上海聯(lián)通”)正式簽署戰(zhàn)略合作協(xié)議,此次簽約標(biāo)志著雙方在算力基礎(chǔ)設(shè)施建設(shè)、人工智能產(chǎn)業(yè)賦能等領(lǐng)域的合作邁入深度融合的新階
    的頭像 發(fā)表于 04-23 14:33 ?1609次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份與<b class='flag-5'>上海</b>聯(lián)通正式簽署戰(zhàn)略合作協(xié)議

    股份攜手合作伙伴完成全棧產(chǎn)品兼容性互認(rèn)證

    近日,股份攜手粵港澳大灣區(qū)國(guó)家技術(shù)創(chuàng)新中心工業(yè)軟件產(chǎn)業(yè)發(fā)展中心(以下簡(jiǎn)稱(chēng)“國(guó)創(chuàng)工軟”)、國(guó)產(chǎn)高性能服務(wù)器與操作系統(tǒng)合作伙伴,以及十灃科技、邁軟件、適
    的頭像 發(fā)表于 04-23 14:27 ?359次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份攜手合作伙伴完成全棧產(chǎn)品兼容性互認(rèn)證

    股份聯(lián)合上海人工智能實(shí)驗(yàn)室發(fā)布高性能GPU算子生成系統(tǒng)Kernel-Smith

    近日,上海人工智能實(shí)驗(yàn)室和股份聯(lián)合發(fā)布了高性能GPU算子生成系統(tǒng)—— Kernel-Smith。
    的頭像 發(fā)表于 04-08 15:39 ?359次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份聯(lián)合<b class='flag-5'>上海</b>人工智能實(shí)驗(yàn)室發(fā)布高性能GPU算子生成系統(tǒng)Kernel-Smith

    股份北京AI研究院暨企業(yè)開(kāi)源中心正式揭牌啟動(dòng)

    3月20日,股份北京AI研究院暨“企業(yè)開(kāi)源中心”正式揭牌啟動(dòng)?;顒?dòng)以“芯生,開(kāi)源共創(chuàng)”為主題,標(biāo)志著
    的頭像 發(fā)表于 03-24 10:11 ?356次閱讀

    股份CXO預(yù)科班2026冬令營(yíng)圓滿收官

    2月6日,由集成電路(上海)股份有限公司(股票代碼:688802,簡(jiǎn)稱(chēng)“股份”)主辦、之江實(shí)驗(yàn)室大力支持、
    的頭像 發(fā)表于 02-25 16:29 ?1317次閱讀

    與Arm、熠知一同到訪清華大學(xué)交流座談

    助力頂尖學(xué)府清華大學(xué)在“AI+教科研”領(lǐng)域取得新突破,培養(yǎng)具備AI創(chuàng)新能力的人才,1月12日,集成電路(上海)股份有限公司(股票代碼:688802)、半導(dǎo)體頭部企業(yè)Arm控股有限
    的頭像 發(fā)表于 01-14 13:52 ?511次閱讀

    股份在上海證券交易所科創(chuàng)板掛牌上市

    近日,股份正式在上海證券交易所科創(chuàng)板掛牌上市,股票代碼:688802.SH。作為國(guó)內(nèi)高性
    的頭像 發(fā)表于 12-24 09:03 ?3233次閱讀

    DLInfer聯(lián)手股份實(shí)現(xiàn)數(shù)據(jù)生成場(chǎng)景的實(shí)際落地

    近期,上海 AI 實(shí)驗(yàn)室 DeepLink 團(tuán)隊(duì)推出的 DLInfer 通過(guò)支持 LMDeploy 主流模型推理,助力股份云 C500
    的頭像 發(fā)表于 12-09 14:55 ?894次閱讀
    DLInfer聯(lián)手<b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份實(shí)現(xiàn)數(shù)據(jù)生成場(chǎng)景的實(shí)際落地

    股份與上海電信完成首期GPU生態(tài)專(zhuān)家認(rèn)證培訓(xùn)

    近期,集成電路(上海)股份有限公司(以下簡(jiǎn)稱(chēng)“股份”)攜手上海電信天翼云能力運(yùn)營(yíng)中心(以
    的頭像 發(fā)表于 10-31 10:33 ?708次閱讀

    首款全國(guó)產(chǎn)通用GPU芯片發(fā)布 集成推出云C600

    ,并支持MetaXLink超節(jié)點(diǎn)擴(kuò)展技術(shù),在硬件性能和軟件兼容上完全滿足下一代生成式AI的訓(xùn)練和推理需求。 而且,股份與中國(guó)科學(xué)院合作的國(guó)產(chǎn)千卡集群,已完成多個(gè)大模型全參數(shù)訓(xùn)練,證實(shí)國(guó)產(chǎn)算力已具備大模型預(yù)訓(xùn)練能力。 公開(kāi)資料
    的頭像 發(fā)表于 10-19 20:04 ?4.7w次閱讀

    GPU與龍蜥操作系統(tǒng)完成適配

    集成電路(上海)股份有限公司(以下簡(jiǎn)稱(chēng)"")于 2020 年 9 月成立于上海,其擁有技
    的頭像 發(fā)表于 10-17 15:06 ?1424次閱讀

    書(shū)生大模型實(shí)戰(zhàn)營(yíng)魔樂(lè)專(zhuān)場(chǎng)MeetUP精彩回顧

    近日,由書(shū)生大模型社區(qū)、、魔樂(lè)社區(qū)、算豐和 DaoCloud 道客等聯(lián)合打造的「書(shū)生大模型實(shí)戰(zhàn)營(yíng)魔樂(lè)專(zhuān)場(chǎng) MeetUP 暨頒獎(jiǎng)儀式」在上海
    的頭像 發(fā)表于 08-20 11:33 ?1268次閱讀

    硅基流動(dòng)攜手首發(fā)基于云的Kimi K2推理服務(wù)

    今天,硅基流動(dòng)聯(lián)合集成電路(上海)股份有限公司(簡(jiǎn)稱(chēng)“”),全球首發(fā)基于
    的頭像 發(fā)表于 07-23 17:33 ?2191次閱讀
    巢湖市| 南召县| 聂荣县| 化隆| 保康县| 大丰市| 新平| 通许县| 海晏县| 班玛县| 西乌珠穆沁旗| 陵川县| 晋城| 云浮市| 芒康县| 渭南市| 通渭县| 武义县| 宁城县| 清徐县| 黑龙江省| 永修县| 汉沽区| 甘谷县| 若尔盖县| 临夏市| 建阳市| 长岭县| 彭阳县| 安溪县| 瑞丽市| 定襄县| 许昌县| 永靖县| 凌海市| 兰溪市| 桃园市| 乃东县| 开封县| 手机| 城口县|