日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

摩爾線程預(yù)訓(xùn)練語(yǔ)言模型MusaBert榮登CLUE榜單TOP10

摩爾線程 ? 來(lái)源:摩爾線程 ? 作者:摩爾線程 ? 2022-12-19 10:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摩爾線程聯(lián)合潞晨科技研發(fā)的預(yù)訓(xùn)練語(yǔ)言模型MusaBert(MUSA為摩爾線程提出的通用元計(jì)算架構(gòu)),在12月16日的中文語(yǔ)言理解領(lǐng)域權(quán)威CLUE榜單上進(jìn)入TOP 10,最終以82.889得分在CLUE1.1總排行榜中排名(除人類成績(jī)以外)第9,并在AFQMC任務(wù)中以86.92分取得排名第一的成績(jī),這意味著摩爾線程AI在語(yǔ)義理解與匹配能力上超越了人類水平。同時(shí),這也是潞晨科技的AI大模型開發(fā)系統(tǒng)Colossal-AI在自然語(yǔ)言處理領(lǐng)域應(yīng)用的重要進(jìn)展。

eafabd56-7f42-11ed-8abf-dac502259ad0.png

(2022年12月16日CLUE1.1總排行榜最新成績(jī))

相較于CLUE總排行榜TOP 10的其他中文預(yù)訓(xùn)練模型,MusaBert僅包含3億參數(shù)量,是前十名中規(guī)模最小的模型,并且為單模型(single model),沒(méi)有進(jìn)行任何集成。此外,摩爾線程基于MusaBert的語(yǔ)義嵌入模型MusaSim在AFQMC任務(wù)上擊敗一眾大規(guī)模模型,取得第一名,不僅為檢索系統(tǒng)、分類對(duì)話等更深度語(yǔ)義理解研究打下堅(jiān)固基石,也證明了摩爾線程在中文自然語(yǔ)言處理領(lǐng)域和低資源大模型訓(xùn)練方面的強(qiáng)大能力。

一直以來(lái),語(yǔ)義理解都是NLP(自然語(yǔ)言處理)技術(shù)的重要目標(biāo),通過(guò)一系列AI算法,可將文本解析為結(jié)構(gòu)化的、機(jī)器可讀的意圖與詞槽信息。通常來(lái)說(shuō),訓(xùn)練數(shù)據(jù)的獲取與處理、模型的迭代和訓(xùn)練等都是NLP技術(shù)的落地難點(diǎn)。MusaBert僅使用了極少的參數(shù)量便取得了比肩甚至超越百億參數(shù)大模型的成績(jī),主要是得益于多方面獲得的突破性進(jìn)展:

▼技術(shù)層面:摩爾線程擁有“軟硬一體”的技術(shù)能力,使得MusaBert能夠從底到上進(jìn)行優(yōu)化;摩爾線程多功能GPU內(nèi)置AI加速和并行計(jì)算等硬件模塊,能夠提供AI和科學(xué)計(jì)算在內(nèi)的全棧功能,能夠?yàn)锳I推理計(jì)算加速、低資源大模型訓(xùn)練等應(yīng)用場(chǎng)景提供通用、高性價(jià)比、節(jié)能環(huán)保的AI能力。

▼算法層面:MusaBert使用了潞晨科技的AI大模型開發(fā)系統(tǒng)Colossal-AI,在上游訓(xùn)練方面,充分發(fā)揮了該系統(tǒng)的易用性及強(qiáng)大的并行訓(xùn)練性能,同時(shí)MusaBert針對(duì)模型數(shù)據(jù)預(yù)處理使用的DataLoader進(jìn)行了優(yōu)化,可以在低資源的條件下快速處理大規(guī)模數(shù)據(jù);在下游任務(wù)方面,摩爾線程通過(guò)采用合適的優(yōu)化建模、在領(lǐng)域內(nèi)進(jìn)行數(shù)據(jù)增強(qiáng)以及在模型的訓(xùn)練優(yōu)化中采用了先進(jìn)的Adan優(yōu)化器等方式,盡可能發(fā)掘和展現(xiàn)出預(yù)訓(xùn)練語(yǔ)言模型強(qiáng)大的語(yǔ)義理解能力。摩爾線程自研的語(yǔ)義嵌入模型MusaSim以MusaBert為基座模型,使用對(duì)比學(xué)習(xí)方法進(jìn)行精調(diào),并利用了摩爾線程收集的百萬(wàn)對(duì)有監(jiān)督數(shù)據(jù)。得益于MusaBert和高質(zhì)量的數(shù)據(jù)集,MusaSim不僅在語(yǔ)義相似度任務(wù)上超越了眾多更大規(guī)模的模型,在意圖識(shí)別、情緒分析等分類任務(wù)上,也能得到較好的效果。

▼數(shù)據(jù)層面:MusaBert除使用了摩爾線程自身收集的高質(zhì)量語(yǔ)義相似數(shù)據(jù)以外,還使用了200GB悟道開源數(shù)據(jù)和80GB的CLUE社區(qū)數(shù)據(jù),以及浪潮電子信息產(chǎn)業(yè)股份有限公司提供的1T高質(zhì)量數(shù)據(jù)集。大規(guī)模高質(zhì)量的數(shù)據(jù)使得模型在相對(duì)小的規(guī)模下仍然保持了較高的性能。

目前,MusaBert作為基座模型,已經(jīng)應(yīng)用于摩爾線程研發(fā)的智能客服與數(shù)字人等項(xiàng)目,并相繼在下游語(yǔ)義相似度、情緒識(shí)別、閱讀理解、聲韻識(shí)別等領(lǐng)域落地。

為了更進(jìn)一步降低大模型開發(fā)和應(yīng)用的門檻,MusaBert代碼現(xiàn)已開源到Colossal-AI倉(cāng)庫(kù)(https://github.com/hpcaitech/ColossalAI/tree/main/examples/language/roberta),使用該腳本,可在短時(shí)間內(nèi)訓(xùn)練出高質(zhì)量的中文Bert模型。包括MusaBert和MusaSim在內(nèi)的一系列高質(zhì)量模型也將在近期開源以貢獻(xiàn)中文NLP社區(qū)。此外,經(jīng)摩爾線程與潞晨科技的嚴(yán)格測(cè)試,僅通過(guò)摩爾線程多功能GPU單卡,即可進(jìn)行MusaBert甚至是更大規(guī)模的GPT2的訓(xùn)練,大大降低了預(yù)訓(xùn)練成本,這也為雙方實(shí)現(xiàn)低資源大模型訓(xùn)練的共同愿景,邁出了堅(jiān)實(shí)一步。

作為中文語(yǔ)言理解領(lǐng)域最具權(quán)威性的測(cè)評(píng)基準(zhǔn)之一,CLUE 涵蓋文本相似度、分類、自然語(yǔ)言推理、閱讀理解等眾多語(yǔ)義分析和理解類子任務(wù),工業(yè)界和學(xué)術(shù)界紛紛用 CLUE 作為預(yù)訓(xùn)練算法能力的驗(yàn)證和衡量標(biāo)準(zhǔn)。此次進(jìn)入CLUE榜單TOP 10,代表了摩爾線程與潞晨科技聯(lián)合研發(fā)團(tuán)隊(duì)在中文預(yù)訓(xùn)練研究領(lǐng)域已達(dá)到業(yè)內(nèi)領(lǐng)先水平。

展望未來(lái),摩爾線程還將與潞晨科技緊密合作,著手更適當(dāng)規(guī)模的自然語(yǔ)言大模型研究,充分利用上游數(shù)據(jù),產(chǎn)出能力更強(qiáng)的模型并且開源。同時(shí),保持算法和系統(tǒng)兩個(gè)層面并行,持續(xù)優(yōu)化大模型在摩爾線程多功能GPU上的訓(xùn)練能力,尤其在單張消費(fèi)級(jí)顯卡等低資源場(chǎng)景下的訓(xùn)練能力,可以大大降低使用大模型訓(xùn)練的門檻和成本,進(jìn)一步促進(jìn)AI民主化。

▼ 關(guān)于潞晨科技

潞晨科技是一家致力于“解放AI生產(chǎn)力”的全球性公司,核心產(chǎn)品面向大模型時(shí)代的通用深度學(xué)習(xí)系統(tǒng) Colossal-AI,可實(shí)現(xiàn)高效快速部署AI大模型訓(xùn)練和推理,降低AI大模型應(yīng)用成本。自開源以來(lái),Colossal-AI已經(jīng)多次在GitHub熱榜位列世界第一,獲得GitHub Star約七千顆,并成功入選SC、AAAI、PPoPP等國(guó)際AI與HPC頂級(jí)會(huì)議的官方教程。相關(guān)解決方案已成功在自動(dòng)駕駛、云計(jì)算、零售、醫(yī)藥、芯片等行業(yè)知名廠商落地應(yīng)用、廣受好評(píng)。

▼ 關(guān)于摩爾線程

摩爾線程是一家以 GPU 芯片設(shè)計(jì)為主的集成電路高科技公司,專注于研發(fā)設(shè)計(jì)全功能 GPU 芯片及相關(guān)產(chǎn)品,能夠?yàn)橹袊?guó)科技生態(tài)合作伙伴提供強(qiáng)大的計(jì)算加速能力。公司成立于 2020年10月,致力于創(chuàng)新面向元計(jì)算應(yīng)用的新一代 GPU,構(gòu)建融合視覺(jué)計(jì)算、3D 圖形計(jì)算、科學(xué)計(jì)算及人工智能計(jì)算的綜合計(jì)算平臺(tái),建立基于云原生 GPU計(jì)算的生態(tài)系統(tǒng),助力驅(qū)動(dòng)數(shù)字經(jīng)濟(jì)發(fā)展。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI算法
    +關(guān)注

    關(guān)注

    0

    文章

    276

    瀏覽量

    13199
  • 自然語(yǔ)言處理
    +關(guān)注

    關(guān)注

    1

    文章

    630

    瀏覽量

    14737
  • 摩爾線程
    +關(guān)注

    關(guān)注

    2

    文章

    289

    瀏覽量

    6672

原文標(biāo)題:Colossal-AI助力,摩爾線程預(yù)訓(xùn)練語(yǔ)言模型MusaBert榮登CLUE榜單TOP10

文章出處:【微信號(hào):moorethreads,微信公眾號(hào):摩爾線程】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    銳成芯微榮登2026中國(guó)IC設(shè)計(jì)Fabless100榜單TOP10 IP公司

    ,Actt)憑借持續(xù)精進(jìn)的創(chuàng)新實(shí)力、完善的IP產(chǎn)品布局與深厚的產(chǎn)業(yè)價(jià)值,繼2023、2024、2025年后,第四年入選“TOP 10 IP公司”榜單,以穩(wěn)定優(yōu)異的綜合表現(xiàn),持續(xù)展現(xiàn)國(guó)產(chǎn)IP企業(yè)的技術(shù)實(shí)力與市場(chǎng)競(jìng)爭(zhēng)力。
    的頭像 發(fā)表于 04-03 14:39 ?645次閱讀

    英諾達(dá)榮登2026中國(guó)IC設(shè)計(jì)Fabless100榜單TOP10 EDA公司

    2026年3月31日,在由AspenCore主辦的2026國(guó)際集成電路展覽會(huì)暨研討會(huì)(IIC Shanghai)上,英諾達(dá)(成都)電子科技有限公司連續(xù)第三年榮登中國(guó)IC設(shè)計(jì)Fabless 100榜單
    的頭像 發(fā)表于 04-03 14:23 ?2068次閱讀

    敏芯股份榮登2026中國(guó)IC設(shè)計(jì)Fabless100排行榜TOP10傳感器公司

    3月31日,著名電子行業(yè)媒體集團(tuán)ASPENCORE發(fā)布了最新《China Fabless 100》榜單。榜單以中國(guó)上市IC設(shè)計(jì)公司為評(píng)選對(duì)象,并分列出10大細(xì)分技術(shù)領(lǐng)域TOP10企業(yè)名
    的頭像 發(fā)表于 04-02 14:59 ?523次閱讀
    敏芯股份<b class='flag-5'>榮登</b>2026中國(guó)IC設(shè)計(jì)Fabless100排行榜<b class='flag-5'>TOP10</b>傳感器公司

    潤(rùn)石科技榮登2026中國(guó)IC設(shè)計(jì)Fabless100排行榜TOP10模擬芯片公司

    、射頻與通信網(wǎng)絡(luò)、傳感器、模擬信號(hào)鏈?zhǔn)蠹夹g(shù)類別以及Top10上市公司、Top10 EDA公司,Top10 IP公司,展現(xiàn)百家企業(yè)的技術(shù)探索與實(shí)踐經(jīng)驗(yàn),為產(chǎn)業(yè)發(fā)展提供觀察視角,ChinaFabless100排行榜已經(jīng)成為中國(guó)IC
    的頭像 發(fā)表于 04-01 14:22 ?4921次閱讀
    潤(rùn)石科技<b class='flag-5'>榮登</b>2026中國(guó)IC設(shè)計(jì)Fabless100排行榜<b class='flag-5'>TOP10</b>模擬芯片公司

    東軟集團(tuán)入選醫(yī)療健康行業(yè)年度標(biāo)桿AI Agent TOP10榜單

    近日,東軟“添翼”AI 2.0憑借在醫(yī)療行業(yè)深度場(chǎng)景滲透、全鏈路技術(shù)創(chuàng)新及超百家醫(yī)療機(jī)構(gòu)規(guī)模化落地成效,強(qiáng)勢(shì)入選“醫(yī)療健康行業(yè)年度標(biāo)桿AI Agent TOP10榜單。這不僅是對(duì)東軟在AI醫(yī)療賽道
    的頭像 發(fā)表于 01-15 14:22 ?458次閱讀

    摩爾線程新一代大語(yǔ)言模型對(duì)齊框架URPO入選AAAI 2026

    近日,摩爾線程在人工智能前沿領(lǐng)域取得重要突破,其提出的新一代大語(yǔ)言模型對(duì)齊框架——URPO統(tǒng)一獎(jiǎng)勵(lì)與策略優(yōu)化,相關(guān)研究論文已被人工智能領(lǐng)域的國(guó)際頂級(jí)學(xué)術(shù)會(huì)議AAAI 2026收錄。這一
    的頭像 發(fā)表于 11-17 16:03 ?620次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>新一代大<b class='flag-5'>語(yǔ)言</b><b class='flag-5'>模型</b>對(duì)齊框架URPO入選AAAI 2026

    易華錄入選全國(guó)數(shù)智企業(yè)TOP10榜單

    近日,2025全球數(shù)字貿(mào)易博覽會(huì)——西湖論劍·數(shù)字安全大會(huì)在杭州召開?;顒?dòng)現(xiàn)場(chǎng),北京交通大學(xué)教授張向宏發(fā)布《全國(guó)數(shù)智產(chǎn)業(yè)發(fā)展研究報(bào)告(2024-2025)》,并推出全國(guó)首個(gè)數(shù)智產(chǎn)業(yè)動(dòng)態(tài)化智能圖譜及《全國(guó)數(shù)智企業(yè)TOP10榜單》,旨在為數(shù)智產(chǎn)業(yè)的高質(zhì)量發(fā)展提供參考與指引。
    的頭像 發(fā)表于 10-13 15:13 ?913次閱讀

    摩爾線程發(fā)布大模型訓(xùn)練仿真工具SimuMax v1.0

    近日,摩爾線程正式發(fā)布并開源大模型分布式訓(xùn)練仿真工具SimuMax 1.0版本。該版本在顯存和性能仿真精度上實(shí)現(xiàn)突破性提升,同時(shí)引入多項(xiàng)關(guān)鍵功能,進(jìn)一步增強(qiáng)了
    的頭像 發(fā)表于 09-11 18:19 ?3946次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>發(fā)布大<b class='flag-5'>模型</b><b class='flag-5'>訓(xùn)練</b>仿真工具SimuMax v1.0

    深演智能入選最具全球發(fā)展?jié)摿Φ闹袊?guó)Agent TOP10榜單

    智能從 150 家參評(píng)企業(yè)、近 300 個(gè)產(chǎn)品 / 解決方案中脫穎而出,成功入選 “最具全球發(fā)展?jié)摿Φ闹袊?guó) Agent” TOP10 榜單,再度印證其在 AI Agent 領(lǐng)域的技術(shù)硬實(shí)力與全球化發(fā)展?jié)摿Α?/div>
    的頭像 發(fā)表于 09-01 16:00 ?1276次閱讀

    潤(rùn)和軟件“潤(rùn)知“知識(shí)處理大模型榮登“2025中國(guó)大模型TOP30”榜單

    ”知識(shí)處理大模型成功入選。這一榮譽(yù)不僅體現(xiàn)了潤(rùn)和軟件在多模態(tài)大模型技術(shù)上的領(lǐng)先地位,也標(biāo)志著其在推動(dòng)企業(yè)智能化轉(zhuǎn)型方面邁出了堅(jiān)實(shí)一步。 ?潤(rùn)和軟件“潤(rùn)知”知識(shí)處理大模型榮登“2025中
    的頭像 發(fā)表于 08-22 10:13 ?4446次閱讀

    摩爾線程“AI工廠”:五大核心技術(shù)支撐,打造大模型訓(xùn)練超級(jí)工廠

    演講中表示,為應(yīng)對(duì)生成式AI爆發(fā)式增長(zhǎng)下的大模型訓(xùn)練效率瓶頸,摩爾線程將通過(guò)系統(tǒng)級(jí)工程創(chuàng)新,構(gòu)建新一代AI訓(xùn)練基礎(chǔ)設(shè)施,致力于為AGI時(shí)代打
    的頭像 發(fā)表于 07-28 11:28 ?4874次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>“AI工廠”:五大核心技術(shù)支撐,打造大<b class='flag-5'>模型</b><b class='flag-5'>訓(xùn)練</b>超級(jí)工廠

    摩爾線程“AI工廠”:以系統(tǒng)級(jí)創(chuàng)新定義新一代AI基礎(chǔ)設(shè)施

    演講中表示,為應(yīng)對(duì)生成式AI爆發(fā)式增長(zhǎng)下的大模型訓(xùn)練效率瓶頸,摩爾線程將通過(guò)系統(tǒng)級(jí)工程創(chuàng)新,構(gòu)建新一代AI訓(xùn)練基礎(chǔ)設(shè)施,致力于為AGI時(shí)代打
    發(fā)表于 07-28 10:34 ?2940次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>“AI工廠”:以系統(tǒng)級(jí)創(chuàng)新定義新一代AI基礎(chǔ)設(shè)施

    贛鋒鋰電榮登全球新能源品牌榜TOP10

    近日,由全球綠色能源理事會(huì)(GGIEC)、亞太新能源行業(yè)協(xié)會(huì)(NEIAAP)、亞洲光伏產(chǎn)業(yè)協(xié)會(huì)(APVIA)聯(lián)合主辦的 “全球新能源品牌榜 TOP10” 頒獎(jiǎng)典禮在國(guó)家會(huì)展中心(上海)舉行。
    的頭像 發(fā)表于 07-18 17:56 ?1325次閱讀

    天合儲(chǔ)能榮獲自產(chǎn)電池系統(tǒng)TOP10榜單

    近日,在2025高工儲(chǔ)能產(chǎn)業(yè)TOP50企業(yè)的頒獎(jiǎng)典禮上,天合儲(chǔ)能憑借深厚的全棧自研能力、卓越的系統(tǒng)集成優(yōu)勢(shì)和強(qiáng)大的全球化交付實(shí)力,榮膺 “自產(chǎn)電池·系統(tǒng)” TOP10榜單。這一獎(jiǎng)項(xiàng)不僅是對(duì)天合儲(chǔ)能技術(shù)實(shí)力與市場(chǎng)地位的認(rèn)可,更是對(duì)
    的頭像 發(fā)表于 07-11 17:44 ?1361次閱讀

    華工科技2025年6月大事記回顧

    近日,光通信行業(yè)知名市場(chǎng)分析機(jī)構(gòu)LightCounting發(fā)布2025全球十大光器件廠商TOP10榜單,華工科技核心子公司華工正源再次榮登全球光模塊 TOP10
    的頭像 發(fā)表于 07-04 17:14 ?1810次閱讀
    林州市| 永和县| 广南县| 石渠县| 长宁县| 徐水县| 宁陕县| 恩施市| 密山市| 岐山县| 和田县| 洱源县| 光山县| 衢州市| 秀山| 涟源市| 迁安市| 牙克石市| 都安| 平阳县| 肥西县| 宁陵县| 鄂尔多斯市| 上杭县| 潞西市| 五大连池市| 永康市| 象州县| 同德县| 高淳县| 宁明县| 专栏| 平利县| 灌南县| 嘉义市| 诸暨市| 昌吉市| 永兴县| 临江市| 翁源县| 上思县|