日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮信息發(fā)布源2.0-M32開源大模型,模算效率大幅提升

浪潮AIHPC ? 來源:浪潮AIHPC ? 2024-05-29 09:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

5月28日,浪潮信息發(fā)布“源2.0-M32”開源大模型。“源2.0-M32”在基于”源2.0”系列大模型已有工作基礎(chǔ)上,創(chuàng)新性地提出和采用了“基于注意力機(jī)制的門控網(wǎng)絡(luò)”技術(shù),構(gòu)建包含32個(gè)專家(Expert)的混合專家模型(MoE),并大幅提升了模型算力效率,模型運(yùn)行時(shí)激活參數(shù)為37億,在業(yè)界主流基準(zhǔn)評測中性能全面對標(biāo)700億參數(shù)的LLaMA3開源大模型。

算法層面源2.0-M32提出并采用了一種新型的算法結(jié)構(gòu):基于注意力機(jī)制的門控網(wǎng)絡(luò)(Attention Router),針對MoE模型核心的專家調(diào)度策略,這種新的算法結(jié)構(gòu)關(guān)注專家模型之間的協(xié)同性度量,有效解決傳統(tǒng)門控網(wǎng)絡(luò)下,選擇兩個(gè)或多個(gè)專家參與計(jì)算時(shí)關(guān)聯(lián)性缺失的問題,使得專家之間協(xié)同處理數(shù)據(jù)的水平大為提升。源2.0-M32采用源2.0-2B為基礎(chǔ)模型設(shè)計(jì),沿用并融合局部過濾增強(qiáng)的注意力機(jī)制(LFA, Localized Filtering-based Attention),通過先學(xué)習(xí)相鄰詞之間的關(guān)聯(lián)性,然后再計(jì)算全局關(guān)聯(lián)性的方法,能夠更好地學(xué)習(xí)到自然語言的局部和全局的語言特征,對于自然語言的關(guān)聯(lián)語義理解更準(zhǔn)確,進(jìn)而提升了模型精度。

9ad71f44-1cea-11ef-b74b-92fbcf53809c.png

Figure1基于注意力機(jī)制的門控網(wǎng)絡(luò)(Attention Router)

■ 數(shù)據(jù)層面,源2.0-M32基于2萬億的token進(jìn)行訓(xùn)練、覆蓋萬億量級的代碼、中英文書籍、百科、論文及合成數(shù)據(jù)。大幅擴(kuò)展代碼數(shù)據(jù)占比至47.5%,從6類最流行的代碼擴(kuò)充至619類,并通過對代碼中英文注釋的翻譯,將中文代碼數(shù)據(jù)量增大至1800億token。結(jié)合高效的數(shù)據(jù)清洗流程,滿足大模型訓(xùn)練“豐富性、全面性、高質(zhì)量”的數(shù)據(jù)集需求?;谶@些數(shù)據(jù)的整合和擴(kuò)展,源2.0-M32在代碼生成、代碼理解、代碼推理、數(shù)學(xué)求解等方面有著出色的表現(xiàn)。

■ 算力層面,源2.0-M32采用了非均勻流水并行的方法,綜合運(yùn)用流水線并行+數(shù)據(jù)并行的策略,顯著降低了大模型對芯片間P2P帶寬的需求,為硬件差異較大訓(xùn)練環(huán)境提供了一種高性能的訓(xùn)練方法。針對MoE模型的稀疏專家計(jì)算,采用合并矩陣乘法的方法,模算效率得到大幅提升。

基于在算法、數(shù)據(jù)和算力方面全面創(chuàng)新,源2.0-M32的性能得以大幅提升,在多個(gè)業(yè)界主流的評測任務(wù)中,展示出了較為先進(jìn)的能力表現(xiàn),在MATH(數(shù)學(xué)競賽)、ARC-C(科學(xué)推理)榜單上超越了擁有700億參數(shù)的LLaMA3大模型。

9b0363c4-1cea-11ef-b74b-92fbcf53809c.jpg

Figure2 源2.0-M32業(yè)界主流評測任務(wù)表現(xiàn)

源2.0-M32大幅提升了模型算力效率,在實(shí)現(xiàn)與業(yè)界領(lǐng)先開源大模型性能相當(dāng)?shù)耐瑫r(shí),顯著降低了在模型訓(xùn)練、微調(diào)和推理所需的算力開銷。在模型推理運(yùn)行階段,M32處理每token所需算力為7.4GFLOPs,而LLaMA3-70B所需算力為140GFLOPs。在模型微調(diào)訓(xùn)練階段,對1萬條平均長度為1024 token的樣本進(jìn)行全量微調(diào),M32消耗算力約0.0026PD(PetaFLOPs/s-day),而LLaMA3消耗算力約為0.05PD。M32憑借特別優(yōu)化設(shè)計(jì)的模型架構(gòu),在僅激活37億參數(shù)的情況下,取得了和700億參數(shù)LLaMA3相當(dāng)?shù)男阅芩?,而所消耗算力僅為LLaMA3的1/19,從而實(shí)現(xiàn)了更高的模算效率。

浪潮信息人工智能首席科學(xué)家吳韶華表示:當(dāng)前業(yè)界大模型在性能不斷提升的同時(shí),也面臨著所消耗算力大幅攀升的問題,對企業(yè)落地應(yīng)用大模型帶來了極大的困難和挑戰(zhàn)。源2.0-M32是浪潮信息在大模型領(lǐng)域持續(xù)耕耘的最新探索成果,通過在算法、數(shù)據(jù)、算力等方面的全面創(chuàng)新,M32不僅可以提供與業(yè)界領(lǐng)先開源大模型相當(dāng)?shù)男阅埽梢源蠓档痛竽P退杷懔ο摹?strong>大幅提升的模算效率將為企業(yè)開發(fā)應(yīng)用生成式AI提供模型高性能、算力低門檻的高效路徑。M32開源大模型配合企業(yè)大模型開發(fā)平臺(tái)EPAI(Enterprise Platform of AI),將助力企業(yè)實(shí)現(xiàn)更快的技術(shù)迭代與高效的應(yīng)用落地,為人工智能產(chǎn)業(yè)的發(fā)展提供堅(jiān)實(shí)的底座和成長的土壤,加速產(chǎn)業(yè)智能化進(jìn)程。


審核編輯:劉清
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50376

    瀏覽量

    267087
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3805

    瀏覽量

    5280
  • 生成式AI
    +關(guān)注

    關(guān)注

    0

    文章

    538

    瀏覽量

    1135

原文標(biāo)題:浪潮信息發(fā)布源2.0-M32開源大模型,模算效率大幅提升,37億激活參數(shù)性能對標(biāo)LLaMA3-700億

文章出處:【微信號:浪潮AIHPC,微信公眾號:浪潮AIHPC】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    天數(shù)智芯Day 0適配MiniMax最新開源M2.7大模型

      4月12 日,MiniMax 最新開源 M2.7 大模型正式發(fā)布,憑借自主迭代能力與優(yōu)異的工程、辦公性能引發(fā)行業(yè)關(guān)注。天數(shù)智芯與FlagOS 統(tǒng)一
    的頭像 發(fā)表于 04-15 15:42 ?892次閱讀

    昆侖芯科技完成MiniMax M2.7模型極速適配

    今日,MiniMax正式開源MiniMax M2.7模型。昆侖芯同步完成對該模型的Day 0適配與深度優(yōu)化,成為首批實(shí)現(xiàn)適配的國產(chǎn)力廠商之
    的頭像 發(fā)表于 04-13 17:07 ?533次閱讀

    小馬智行發(fā)布PonyWorld世界模型2.0

    4月10日,小馬智行正式發(fā)布其在物理AI領(lǐng)域的最新技術(shù)成果——PonyWorld世界模型2.0。
    的頭像 發(fā)表于 04-10 17:21 ?1184次閱讀

    浪潮信息直播發(fā)布業(yè)界首個(gè)企業(yè)級OpenClaw方案“企千蝦”

    月2日,浪潮信息直播發(fā)布業(yè)界首個(gè)企業(yè)級OpenClaw方案——「企千蝦」,為企業(yè)規(guī)?;渴?、管理和應(yīng)用OpenClaw,打造了安全、高效、易用的全鏈路方案。實(shí)操演示了「企千蝦」基于元腦服務(wù)器實(shí)現(xiàn)
    的頭像 發(fā)表于 04-05 17:44 ?2134次閱讀

    阿里巴巴開源全新一代大模型千問Qwen3.5-Plus

    千問3.5實(shí)現(xiàn)了底層模型架構(gòu)的全面革新,此次發(fā)布的Qwen3.5-Plus版本總參數(shù)為3970億,激活僅170億,以小勝大,性能超過萬億參數(shù)的Qwen3-Max模型,部署顯存占用降低60%,推理
    的頭像 發(fā)表于 02-26 15:40 ?1290次閱讀
    阿里巴巴<b class='flag-5'>開源</b>全新一代大<b class='flag-5'>模型</b>千問Qwen3.5-Plus

    壁仞科技壁礪166M產(chǎn)品適配思智能MOSS-TTS Family模型

    2月10日,由上海創(chuàng)智學(xué)院孵化的思智能及OpenMOSS團(tuán)隊(duì)正式發(fā)布開源了MOSS-TTS Family。模型發(fā)布后,壁仞科技(0608
    的頭像 發(fā)表于 02-11 16:54 ?1466次閱讀

    月之暗面全新開源旗艦模型Kimi K2.5上線力方舟

    力方舟平臺(tái)現(xiàn)已上線來自月之暗面(Moonshot AI)發(fā)布的全新開源旗艦模型Kimi K2.5。
    的頭像 發(fā)表于 01-29 10:20 ?1283次閱讀
    月之暗面全新<b class='flag-5'>開源</b>旗艦<b class='flag-5'>模型</b>Kimi K2.5上線<b class='flag-5'>模</b>力方舟

    云知聲山海知音大模型2.0重磅發(fā)布

    隨著智能體時(shí)代到來,云知聲在“山?!tlas”通用智基座持續(xù)演進(jìn)基礎(chǔ)上,年前實(shí)現(xiàn)了“山?!ぶt(yī)”5.0醫(yī)療大模型升級,今天迎來了“山?!ぶ簟?b class='flag-5'>2.0的重磅發(fā)布,正在完成“一基兩翼”
    的頭像 發(fā)表于 01-27 14:08 ?348次閱讀
    云知聲山海知音大<b class='flag-5'>模型</b><b class='flag-5'>2.0</b>重磅<b class='flag-5'>發(fā)布</b>

    今日看點(diǎn):小米正式發(fā)布開源模型 MiMo-V2-Flash;磷酸鐵鋰開啟漲價(jià)潮

    小米正式發(fā)布開源模型 MiMo-V2-Flash 近日小米正式發(fā)布開源模型 MiMo-V
    的頭像 發(fā)表于 12-17 09:42 ?4518次閱讀

    華為發(fā)布AI容器技術(shù)Flex:ai,力平均利用率提升30%

    電子發(fā)燒友網(wǎng)綜合報(bào)道 2025年11月21日,在上海舉辦的“2025 AI容器應(yīng)用落地與發(fā)展論壇”上,華為正式發(fā)布開源了創(chuàng)新AI容器技術(shù)Flex:ai,為解決算力資源利用難題帶來了全新的思路和解
    的頭像 發(fā)表于 11-26 08:31 ?7829次閱讀

    開源模型力革命下:電子谷連接技術(shù)的堅(jiān)守與未來

    隨著開源模型參數(shù)規(guī)模邁入萬億級時(shí)代,力基礎(chǔ)設(shè)施正面臨前所未有的挑戰(zhàn)。2025年以來,DeepSeekR1、Qwen2.5-72B等開源模型
    的頭像 發(fā)表于 09-19 08:03 ?645次閱讀
    <b class='flag-5'>開源</b>大<b class='flag-5'>模型</b><b class='flag-5'>算</b>力革命下:電子谷連接技術(shù)的堅(jiān)守與未來

    浪潮信息發(fā)布&quot;元腦SD200&quot;超節(jié)點(diǎn),面向萬億參數(shù)大模型創(chuàng)新設(shè)計(jì)

    北京2025年8月8日 /美通社/ -- 8月7日,浪潮信息發(fā)布面向萬億參數(shù)大模型的超節(jié)點(diǎn)AI服務(wù)器"元腦SD200"。該產(chǎn)品基于浪潮信息創(chuàng)新研發(fā)的多主機(jī)低延遲內(nèi)存語義通信架構(gòu),以開放
    的頭像 發(fā)表于 08-08 22:17 ?795次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b>&quot;元腦SD200&quot;超節(jié)點(diǎn),面向萬億參數(shù)大<b class='flag-5'>模型</b>創(chuàng)新設(shè)計(jì)

    萬億參數(shù)!元腦企智一體機(jī)率先支持Kimi K2大模型

    應(yīng)用大模型提供高處理性能和完善的軟件工具平臺(tái)支持。 ? Kimi K2是月之暗面推出的開源萬億參數(shù)大模型,創(chuàng)新使用了MuonClip優(yōu)化器進(jìn)行訓(xùn)練,大幅
    的頭像 發(fā)表于 07-22 09:27 ?722次閱讀
    萬億參數(shù)!元腦企智一體機(jī)率先支持Kimi K2大<b class='flag-5'>模型</b>

    飛利信與浪潮信息達(dá)成戰(zhàn)略合作

    近日,2025年浪潮信息北京ISP戰(zhàn)略伙伴簽約授牌儀式成功舉辦。浪潮信息與北京飛利信電子技術(shù)有限公司等22家戰(zhàn)略合作伙伴達(dá)成簽約,其中將面向北京人工智能應(yīng)用大市場,在產(chǎn)品技術(shù)共創(chuàng)、行業(yè)場景深化及區(qū)域
    的頭像 發(fā)表于 06-24 17:37 ?1259次閱讀

    維諦技術(shù):AI普惠浪潮下,如何打造新一代力中樞?

    DeepSeek的橫空出世,為AI行業(yè)注入了新的變量。它憑借開源可用、低成本調(diào)用的特性,大幅降低了大模型技術(shù)的使用門檻,加速了AI能力向各行各業(yè)的滲透。在這場力“民主化”運(yùn)動(dòng)中,成千
    的頭像 發(fā)表于 05-12 14:42 ?843次閱讀
    維諦技術(shù):AI普惠<b class='flag-5'>浪潮</b>下,如何打造新一代<b class='flag-5'>算</b>力中樞?
    宾阳县| 翁源县| 贵德县| 凤城市| 双江| 巴林右旗| 曲周县| 沙洋县| 阿巴嘎旗| 昭觉县| 乌苏市| 富川| 新建县| 保定市| 屏东市| 万全县| 冕宁县| 报价| 德清县| 定结县| 基隆市| 老河口市| 永泰县| 荆门市| 淮安市| 浪卡子县| 维西| 手机| 杭州市| 枞阳县| 甘孜| 恭城| 宁强县| 全椒县| 措美县| 镇安县| 辛集市| 凌海市| 东明县| 昔阳县| 普陀区|