日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

沐曦GPU跑通DeepSeek開源代碼庫(kù)FlashMLA

沐曦MetaX ? 來(lái)源:沐曦MetaX ? 2025-02-25 16:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

DeepSeek 開源周

今日,DeepSeek正式啟動(dòng)"開源周"計(jì)劃,首發(fā)代碼庫(kù)FlashMLA一經(jīng)開源即引發(fā)全網(wǎng)關(guān)注。截至發(fā)稿,該項(xiàng)目已在GitHub斬獲超7.2K Star!

沐曦技術(shù)團(tuán)隊(duì)在FlashMLA開源后迅速響應(yīng),僅用2小時(shí)即完成與沐曦GPU的適配工作,并于當(dāng)日將代碼提交至開源社區(qū)。本次適配成功后,MXMACA平臺(tái)也可完美運(yùn)行FlashMLA,這充分驗(yàn)證了沐曦GPGPU架構(gòu)與MXMACA軟件平臺(tái)在生態(tài)兼容性方面的先天優(yōu)勢(shì)!

FlashMLA通過(guò)MLA解碼優(yōu)化與分頁(yè)KV緩存技術(shù)等顯著提升硬件利用率,可加速大語(yǔ)言模型解碼過(guò)程,有效提升響應(yīng)速度與吞吐量,尤其適用于聊天機(jī)器人等實(shí)時(shí)生成場(chǎng)景。沐曦在適配中應(yīng)用矩陣吸收算法將低秩投影融入Flash Attention 2核函數(shù),在保證計(jì)算效率的同時(shí)顯著降低顯存占用。同步構(gòu)建了MXMACA自動(dòng)化測(cè)試體系覆蓋常規(guī)及邊界場(chǎng)景,確保功能準(zhǔn)確性與數(shù)值穩(wěn)定性,為長(zhǎng)文本生成等顯存敏感場(chǎng)景提供顯著性能增益。沐曦本次提交的代碼不僅突破了官方實(shí)現(xiàn)中對(duì)Hopper架構(gòu)的依賴,還新增支持64以外的多樣化page size配置,大幅提升框架適用性,為開源社區(qū)帶來(lái)實(shí)質(zhì)性技術(shù)貢獻(xiàn)。

明天,DeepSeek開源計(jì)劃第二彈即將揭曉,敬請(qǐng)期待后續(xù)動(dòng)態(tài)!

關(guān)于沐曦

沐曦致力于為異構(gòu)計(jì)算提供安全可靠的GPU芯片及解決方案,打造全棧GPU芯片產(chǎn)品,推出曦思N系列GPU用于智算推理,曦云C系列GPU用于通用計(jì)算,以及曦彩G系列GPU用于圖形渲染,滿足“高能效”及“高通用性”的算力需求。沐曦產(chǎn)品均采用完全自主研發(fā)的GPU IP,擁有完全自主的指令集和架構(gòu),配以兼容主流GPU生態(tài)的完整軟件棧(MXMACA),具備高能效和高通用性的天然優(yōu)勢(shì),能夠?yàn)榭蛻魳?gòu)建軟硬件一體的全面生態(tài)解決方案,是“雙碳”背景下推動(dòng)數(shù)字經(jīng)濟(jì)建設(shè)和產(chǎn)業(yè)數(shù)字化、智能化轉(zhuǎn)型升級(jí)的算力基石。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5289

    瀏覽量

    136112
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    4375

    瀏覽量

    46482
  • 沐曦
    +關(guān)注

    關(guān)注

    1

    文章

    103

    瀏覽量

    1887
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    857

    瀏覽量

    3418

原文標(biāo)題:2小時(shí)極速適配!沐曦GPU率先跑通DeepSeek開源代碼庫(kù)FlashMLA!

文章出處:【微信號(hào):沐曦MetaX,微信公眾號(hào):沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    股份開源TileLang-Metax并入駐TileAI社區(qū)

    4月27日,股份面向GPU的TileLang適配支持與優(yōu)化項(xiàng)目TileLang-Metax正式成為TileAI社區(qū)官方主線版本,
    的頭像 發(fā)表于 04-28 15:57 ?204次閱讀

    股份Day 0適配DeepSeek-V4-Flash模型

    4月24日,股份攜手FlagOS,已完對(duì)DeepSeek最新開源DeepSeek-V4-Flash模型的Day 0適配。同日,
    的頭像 發(fā)表于 04-28 15:53 ?525次閱讀

    股份云C系列GPU產(chǎn)品Day 0適配騰訊混元Hy3 preview語(yǔ)言模型

    4月23日,騰訊混元團(tuán)隊(duì)正式發(fā)布并開源Hy3 preview語(yǔ)言模型。股份旗下云 C 系列 GPU已完成Day 0適配,為率先支持該模
    的頭像 發(fā)表于 04-28 15:51 ?820次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b>云C系列<b class='flag-5'>GPU</b>產(chǎn)品Day 0適配騰訊混元Hy3 preview語(yǔ)言模型

    股份云C系列GPU產(chǎn)品Day 0適配MiniMax M2.7模型

    4月12日,MiniMax新一代Agent旗艦大模型M2.7開源股份云C系列GPU已完成對(duì) M2.7的Day 0深度適配,將為M2.
    的頭像 發(fā)表于 04-13 17:08 ?897次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b>云C系列<b class='flag-5'>GPU</b>產(chǎn)品Day 0適配MiniMax M2.7模型

    股份云C系列GPU產(chǎn)品Day 0適配智譜GLM-5.1旗艦?zāi)P?/a>

    4月8日,智譜新一代旗艦?zāi)P虶LM-5.1實(shí)現(xiàn)開源。目前,股份云 C 系列 GPU已完成該系列模型Day 0 全量適配,再度以全棧自主
    的頭像 發(fā)表于 04-09 11:25 ?437次閱讀

    股份北京AI研究院暨企業(yè)開源中心正式揭牌啟動(dòng)

    3月20日,股份北京AI研究院暨“企業(yè)開源中心”正式揭牌啟動(dòng)?;顒?dòng)以“芯生,開源共創(chuàng)”為
    的頭像 發(fā)表于 03-24 10:11 ?363次閱讀

    股份GPU產(chǎn)品正式接入華佗開源生態(tài)

    股份堅(jiān)持“自主創(chuàng)新與開放兼容”雙軌戰(zhàn)略,以自研MXMACA軟件棧為核心,構(gòu)建硬件與應(yīng)用的橋梁,并承載開源核心使命。該棧于2025年2月正式開源,致力于打造開放的
    的頭像 發(fā)表于 03-16 14:40 ?1725次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>GPU</b>產(chǎn)品正式接入華佗<b class='flag-5'>開源</b>生態(tài)

    云C500/C550 GPU產(chǎn)品深度適配MiniMax M2.5模型

    2月13日晚間,MiniMax正式開源MiniMax M2.5模型。技術(shù)團(tuán)隊(duì)依托MXMACA軟件棧,在24小時(shí)內(nèi)完成云C500/C550 對(duì)該模型的深度適配。
    的頭像 發(fā)表于 02-26 14:19 ?1191次閱讀

    云C500/C550 GPU產(chǎn)品適配智譜GLM-OCR模型

    今天,智譜AI正式發(fā)布并開源GLM-OCR,以 “小尺寸、高精度” 實(shí)現(xiàn)文檔解析能力新標(biāo)桿。股份云C500/C550 GPU充分發(fā)揮高
    的頭像 發(fā)表于 02-03 11:36 ?966次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C500/C550 <b class='flag-5'>GPU</b>產(chǎn)品適配智譜GLM-OCR模型

    股份正式推出索X系列全新GPU品牌與產(chǎn)品線

    1月27日,股份(股票代碼:688802.SH)正式推出索X系列全新GPU品牌與產(chǎn)品線。該系列產(chǎn)品是面向科學(xué)智能場(chǎng)景深度優(yōu)化的高性能計(jì)
    的頭像 發(fā)表于 01-28 17:14 ?880次閱讀

    股份云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型

    12月8日智譜AI發(fā)布并開源 GLM-4.6V 系列多模態(tài)大模型,股份云C系列GPU完成Day 0適配。
    的頭像 發(fā)表于 12-17 14:28 ?868次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b>云C系列<b class='flag-5'>GPU</b> Day 0適配智譜GLM-4.6V多模態(tài)大模型

    首款全國(guó)產(chǎn)通用GPU芯片發(fā)布 集成推出云C600

    集成電路(南京)有限公司近日正式發(fā)布了首款全國(guó)產(chǎn)通用GPU——云C600,這標(biāo)志著國(guó)產(chǎn)高性能GPU實(shí)現(xiàn)歷史性突破。 據(jù)新華日?qǐng)?bào)報(bào)道顯示
    的頭像 發(fā)表于 10-19 20:04 ?4.7w次閱讀

    GPU與龍蜥操作系統(tǒng)完成適配

    集成電路(上海)股份有限公司(以下簡(jiǎn)稱"")于 2020 年 9 月成立于上海,其擁有技術(shù)完備、設(shè)計(jì)和產(chǎn)業(yè)化經(jīng)驗(yàn)豐富的團(tuán)隊(duì),曾主導(dǎo)過(guò)十多款世界主流高性能
    的頭像 發(fā)表于 10-17 15:06 ?1428次閱讀

    云C系列產(chǎn)品已支持TileLang

    近日,DeepSeek宣布在其新版本中擁抱國(guó)產(chǎn)GPU語(yǔ)言TileLang,引發(fā)業(yè)界廣泛關(guān)注。作為國(guó)產(chǎn)高性能GPU的代表,
    的頭像 發(fā)表于 10-14 09:25 ?1369次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C系列產(chǎn)品已支持TileLang

    硅基流動(dòng)攜手首發(fā)基于云的Kimi K2推理服務(wù)

    天網(wǎng)絡(luò)”)運(yùn)營(yíng)的云C550 三千卡通用 GPU 國(guó)產(chǎn)集群。此次合作標(biāo)志著硅基流動(dòng)正式將該國(guó)產(chǎn)集群納入算力網(wǎng)絡(luò),進(jìn)一步為大模型產(chǎn)業(yè)落地提供充沛的高性能國(guó)產(chǎn)算力。
    的頭像 發(fā)表于 07-23 17:33 ?2192次閱讀
    革吉县| 巴彦县| 阿拉善右旗| 若尔盖县| 堆龙德庆县| 额尔古纳市| 枣强县| 河西区| 内丘县| 靖江市| 海伦市| 香港| 华蓥市| 古交市| 双流县| 尖扎县| 黄龙县| 泗水县| 永和县| 当雄县| 龙州县| 安阳县| 肇东市| 西乌| 九龙坡区| 泸西县| 南溪县| 安吉县| 同心县| 招远市| 文登市| 云霄县| 龙山县| 藁城市| 定襄县| 彰化市| 曲阜市| 丁青县| 阿瓦提县| 昌江| 岚皋县|