日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

SuperGLUE正式上線:NLP模型們,來(lái)迎接挑戰(zhàn)吧!

DPVg_AI_era ? 來(lái)源:lq ? 2019-09-13 16:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Facebook AI Research、Google DeepMind、華盛頓大學(xué)和紐約大學(xué)合作,共同推出了SuperGLUE,這是一系列用來(lái)衡量現(xiàn)代高性能語(yǔ)言理解AI表現(xiàn)的基準(zhǔn)測(cè)試任務(wù),SuperGLUE針對(duì)的是已經(jīng)達(dá)到挑戰(zhàn)上限的會(huì)話式AI深度學(xué)習(xí)模型,為其提供更難的挑戰(zhàn),其比GLUE基準(zhǔn)任務(wù)更負(fù)責(zé),旨在構(gòu)建能處理更加復(fù)雜和掌握更細(xì)微差別的語(yǔ)言模型。

目前NLP主要著眼在多任務(wù)學(xué)習(xí)和語(yǔ)言模型預(yù)訓(xùn)練,從而孕育出各種模型,如BERT、Transformer、Elmo、MT-DNN、GPT-2等。為了評(píng)估這些模型的精準(zhǔn)度,GLUE基準(zhǔn)應(yīng)運(yùn)而生。

SuperGLUE正式上線:NLP模型們,來(lái)迎接挑戰(zhàn)吧!

GLUE全稱是通用語(yǔ)言理解評(píng)估(General Language Understanding Evaluation),基于已有的9種英文語(yǔ)言理解任務(wù),涵蓋多種數(shù)據(jù)集大小、文本類型和難度。終極目標(biāo)是推動(dòng)研究,開(kāi)發(fā)通用和強(qiáng)大的自然語(yǔ)言理解系統(tǒng)。

但隨著NLP模型狂飆似的發(fā)展速度,僅推出一年時(shí)間的GLUE基準(zhǔn),已經(jīng)顯得有些力不從心。于是,F(xiàn)acebook AI研究院、谷歌DeepMind、華盛頓大學(xué)以及紐約大學(xué)4家公司和高校開(kāi)始攜手打造進(jìn)化版新基準(zhǔn):SuperGLUE!

近日,進(jìn)化后的基準(zhǔn)也正式宣布上線,可供大家使用了!

地址:

https://gluebenchmark.com

因?yàn)锽ERT在GLUE上是當(dāng)前最成功的方法,所以SuperGLUE也使用BERT-LARGE-CASED variant.11作為模型性能基準(zhǔn)。

什么是SuperGLUE?

如果你搜索SuperGLUE,出現(xiàn)在首頁(yè)的一定的各種膠水。這也是科技公司在給產(chǎn)品起名時(shí)特別喜歡玩兒的一個(gè)梗:利用命名的首字母縮寫(xiě)成為一個(gè)十分普通、十分常見(jiàn)的英文單詞,這個(gè)單詞經(jīng)常和實(shí)際的科技產(chǎn)品毫不相關(guān)。

實(shí)際上,我們今天要介紹的SuperGLUE,全稱是超(級(jí))通用語(yǔ)言理解評(píng)估(Super General-Purpose Language Understanding Evaluation)。

據(jù)SuperGLUE團(tuán)隊(duì)介紹,為了獲得更強(qiáng)悍的任務(wù)集,他們向各個(gè)NLP社區(qū)發(fā)出了征集令,并最終獲得一個(gè)包含約30種不同NLP任務(wù)的列表。隨后按照如下標(biāo)準(zhǔn)篩選:

任務(wù)本質(zhì):即測(cè)試系統(tǒng)理解英語(yǔ)的能力

任務(wù)難度:即超出當(dāng)前最先進(jìn)模型的能力

可評(píng)估性:具備自動(dòng)評(píng)斷機(jī)制,同時(shí)還需要能夠準(zhǔn)確對(duì)應(yīng)人類的判斷或表現(xiàn)

公開(kāi)數(shù)據(jù):擁有可公開(kāi)的數(shù)據(jù)

任務(wù)格式:提升輸入值的復(fù)雜程度,允許出現(xiàn)復(fù)雜句子、段落和文章等

任務(wù)許可:所用數(shù)據(jù)必須獲得研究和重新分發(fā)的許可

最終獲得一個(gè)包含7個(gè)任務(wù)的集合。然后,以這7個(gè)任務(wù)為基礎(chǔ)構(gòu)建公開(kāi)排行榜。

此外,SuperGLUE還包含基于已有數(shù)據(jù)的抽取、單個(gè)數(shù)值的表現(xiàn)指標(biāo),以及一套分析工具包jiant。 下載地址: https://jiant.info/

相比GLUE有哪些變化?效果如何?

進(jìn)化后的新基準(zhǔn),難度有了大幅提升,應(yīng)對(duì)起當(dāng)前這些發(fā)育迅猛的NLP模型更加得心應(yīng)手,從而可以鼓勵(lì)構(gòu)建能夠掌握更復(fù)雜,或具有更細(xì)微差別的語(yǔ)言的模型。

相比上一代GLUE,首先研究人員向原有的11項(xiàng)任務(wù)開(kāi)刀,直接砍掉其中的9項(xiàng),并對(duì)剩下的2項(xiàng)任務(wù)進(jìn)行了升級(jí),這兩項(xiàng)任務(wù)分別是識(shí)別文本蘊(yùn)涵(RTE)和Winograd模式挑戰(zhàn)賽(WSC)。

之后,5項(xiàng)新的評(píng)估基準(zhǔn)也被添加進(jìn)來(lái),用于測(cè)試模型在回答問(wèn)題、指代消解和常識(shí)推理方面的能力。這5項(xiàng)新任務(wù)分別是:CB,COPA,GAP,MultiRC和WiC。

初始的SuperGLUE基準(zhǔn)版本包含了人類水平估計(jì)結(jié)果,擴(kuò)展了GLUE中的句子和句子的分類,還包含了共指消解、句子完成和問(wèn)答。

SuperGLUE任務(wù)集合比較多樣化,為了幫助研究者能夠開(kāi)發(fā)出統(tǒng)一的新方法,SuperGLUE團(tuán)隊(duì)還貼心的為研究人員提供了一套基于PyTorch和AllenNLP、用來(lái)操作NLP的預(yù)訓(xùn)練、多任務(wù)學(xué)習(xí)和遷移學(xué)習(xí)的模塊化建模工具包。

此外,因?yàn)榭紤]到公平性、信息的豐富性,管理SuperGLUE排行榜的規(guī)則也有很多地方和GLUE有所區(qū)別,以期能充分體現(xiàn)數(shù)據(jù)和任務(wù)創(chuàng)建者的貢獻(xiàn)。

研究人員用主流NLP模型對(duì)新基準(zhǔn)進(jìn)行了測(cè)試,效果如下圖:

任務(wù)示例:

值得一提的是,即使是當(dāng)前最先進(jìn)的BERT模型,量化后的綜合分?jǐn)?shù),比人類低了約16.8%。這樣的表現(xiàn),恐怕只能勉強(qiáng)算過(guò)得去而已。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    575

    瀏覽量

    11349
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1240

    瀏覽量

    26264
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    491

    瀏覽量

    23347

原文標(biāo)題:超難NLP新基準(zhǔn)SuperGLUE正式發(fā)布:橫掃SOTA模型BERT勉強(qiáng)過(guò)關(guān)

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    智譜新一代旗艦模型GLM-5.1上線華為云

    4月8日,智譜正式發(fā)布新一代旗艦模型GLM-5.1,發(fā)布當(dāng)天已上線華為云,并成功對(duì)接華為云多款產(chǎn)品。該模型整體能力全面提升,是目前全球最強(qiáng)的開(kāi)源模型,Coding能力刷新全球最佳成績(jī),
    的頭像 發(fā)表于 04-10 10:11 ?365次閱讀

    月之暗面全新開(kāi)源旗艦模型Kimi K2.5上線模力方舟

    模力方舟平臺(tái)現(xiàn)已上線來(lái)自月之暗面(Moonshot AI)發(fā)布的全新開(kāi)源旗艦模型Kimi K2.5。
    的頭像 發(fā)表于 01-29 10:20 ?1296次閱讀
    月之暗面全新開(kāi)源旗艦<b class='flag-5'>模型</b>Kimi K2.5<b class='flag-5'>上線</b>模力方舟

    百度文心大模型5.0正式版上線

    今天,在百度文心Moment大會(huì)現(xiàn)場(chǎng),文心大模型5.0正式版上線。
    的頭像 發(fā)表于 01-23 16:48 ?1552次閱讀

    中德開(kāi)集團(tuán)與蔚來(lái)能源首批共建換電站上線交付

    2025年12月1日,隨著蔚來(lái)換電站|沈陽(yáng)站西廣場(chǎng)站正式上線,中德園開(kāi)發(fā)建設(shè)集團(tuán)有限公司(下稱“中德開(kāi)集團(tuán)”)與武漢蔚來(lái)能源有限公司(下稱“蔚來(lái)能源”)首批5座共建換電站完成
    的頭像 發(fā)表于 12-05 17:40 ?2271次閱讀

    亞馬遜云科技上線Amazon Nova多模態(tài)嵌入模型

    Embeddings多模態(tài)嵌入模型現(xiàn)已在Amazon Bedrock上線,這是一款專為Agentic RAG與語(yǔ)義搜索應(yīng)用打造的頂尖多模態(tài)嵌入模型。該模型是首個(gè)通過(guò)單一
    的頭像 發(fā)表于 10-29 17:15 ?395次閱讀
    亞馬遜云科技<b class='flag-5'>上線</b>Amazon Nova多模態(tài)嵌入<b class='flag-5'>模型</b>

    OpenAI Sora 2模型上線微軟Azure AI Foundry國(guó)際版

    我們非常激動(dòng)地宣布,OpenAI 的新一代多模態(tài)視頻生成模型 Sora 2 現(xiàn)已在 Azure AI Foundry(國(guó)際版)上線,進(jìn)入公共預(yù)覽階段。
    的頭像 發(fā)表于 10-22 09:44 ?999次閱讀
    OpenAI Sora 2<b class='flag-5'>模型</b><b class='flag-5'>上線</b>微軟Azure AI Foundry國(guó)際版

    中科曙光助力首個(gè)地質(zhì)大模型“坤樞”上線

    近日,首個(gè)地質(zhì)領(lǐng)域?qū)S么笳Z(yǔ)言模型“坤樞”在河南鄭州正式上線,該大模型的部署將有助于夯實(shí)地質(zhì)產(chǎn)業(yè)數(shù)字化基礎(chǔ),在保障國(guó)家能源資源信息安全前提下,完成多項(xiàng)地質(zhì)相關(guān)任務(wù)。而在該模型誕生過(guò)程中,
    的頭像 發(fā)表于 10-14 16:12 ?976次閱讀

    小白學(xué)大模型:國(guó)外主流大模型匯總

    數(shù)據(jù)科學(xué)AttentionIsAllYouNeed(2017)https://arxiv.org/abs/1706.03762由GoogleBrain的團(tuán)隊(duì)撰寫(xiě),它徹底改變了自然語(yǔ)言處理(NLP
    的頭像 發(fā)表于 08-27 14:06 ?1199次閱讀
    小白學(xué)大<b class='flag-5'>模型</b>:國(guó)外主流大<b class='flag-5'>模型</b>匯總

    亞馬遜云科技Amazon Bedrock模型再更新,Anthropic最新版Claude4模型現(xiàn)已上線

    北京2025年8月6日 /美通社/ -- 亞馬遜云科技宣布,Anthropic最新一代模型Claude Opus 4.1與Claude Sonnet 4,現(xiàn)已在Amazon Bedrock全面上線
    的頭像 發(fā)表于 08-06 19:42 ?817次閱讀
    亞馬遜云科技Amazon Bedrock<b class='flag-5'>模型</b>再更新,Anthropic最新版Claude4<b class='flag-5'>模型</b>現(xiàn)已<b class='flag-5'>上線</b>

    亞馬遜云科技現(xiàn)已上線OpenAI開(kāi)放權(quán)重模型

    客戶現(xiàn)可通過(guò)Amazon Bedrock和Amazon SageMaker AI使用OpenAI開(kāi)放權(quán)重模型,實(shí)現(xiàn)將先進(jìn)的開(kāi)放權(quán)重模型與全球最廣泛云服務(wù)的深度集成。 亞馬遜云科技首次上線OpenAI
    的頭像 發(fā)表于 08-06 19:29 ?979次閱讀

    3Dfindit 提供的數(shù)字立方體模型為研究項(xiàng)目的可視化提供了支持

    魔方的幫助下實(shí)現(xiàn)多視角可視化 為了克服這一挑戰(zhàn)并實(shí)現(xiàn)多視角可視化,我們使用了3Dfindit立方體動(dòng)畫(huà)模型。博物館和學(xué)生可以利用 3D 模型提出新的歷史教學(xué)問(wèn)題。
    發(fā)表于 08-01 14:36

    積算科技上線赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型算力

    北京2025年7月30日 /美通社/ -- 近日,北京積算科技有限公司(以下簡(jiǎn)稱"積算科技")宣布其算力服務(wù)平臺(tái)上線赤兔推理引擎。積算科技PowerFul-AI應(yīng)用開(kāi)發(fā)平臺(tái)與赤兔合作,打造高性價(jià)比
    的頭像 發(fā)表于 07-30 21:44 ?1081次閱讀

    新品上線|Maix4-HAT 大模型 AI 加速套件 ,一鍵解鎖樹(shù)莓派多模態(tài) AI 力量!

    還在為邊緣端的大模型運(yùn)行發(fā)愁?還在為算力不夠、模型太大束手無(wú)策?Maix4-HAT,一款專為端側(cè)大模型而生的高性能AI加速模塊,現(xiàn)已正式上線淘寶!淘寶:https://item.tao
    的頭像 發(fā)表于 07-18 18:35 ?2155次閱讀
    新品<b class='flag-5'>上線</b>|Maix4-HAT 大<b class='flag-5'>模型</b> AI 加速套件 ,一鍵解鎖樹(shù)莓派多模態(tài) AI 力量!

    來(lái)第1000座高速公路換電站上線運(yùn)營(yíng)

    近日,蔚來(lái)第1,000座高速公路換電站——蔚來(lái)換電站|G5011蕪合高速福山服務(wù)區(qū)合肥方向正式上線運(yùn)營(yíng),蔚來(lái)宣布完成高速換電千站計(jì)劃,建成全國(guó)主要城市間高速公路換電網(wǎng)絡(luò),連通全國(guó)550
    的頭像 發(fā)表于 07-14 14:28 ?1121次閱讀

    華為開(kāi)發(fā)者大會(huì)2025(HDC 2025)亮點(diǎn):華為云發(fā)布盤(pán)古大模型5.5 宣布新一代昇騰AI云服務(wù)上線

    HarmonyOS、昇騰AI云服務(wù)、盤(pán)古大模型等最新科技創(chuàng)新成果。 在主題演講中,華為常務(wù)董事、華為云計(jì)算CEO張平安宣布基于CloudMatrix384 超節(jié)點(diǎn)的新一代昇騰AI云服務(wù)全面上線,為大模型應(yīng)用提供澎湃算力;宣布盤(pán)古
    的頭像 發(fā)表于 06-20 20:19 ?4711次閱讀
    華為開(kāi)發(fā)者大會(huì)2025(HDC 2025)亮點(diǎn):華為云發(fā)布盤(pán)古大<b class='flag-5'>模型</b>5.5 宣布新一代昇騰AI云服務(wù)<b class='flag-5'>上線</b>
    西昌市| 黔江区| 资溪县| 曲水县| 正宁县| 嵊州市| 开平市| 偏关县| 米脂县| 融水| 武宁县| 班玛县| 平乐县| 仙游县| 石柱| 通化市| 施秉县| 清水县| 邓州市| 青龙| 松桃| 呼图壁县| 平谷区| 新竹市| 明光市| 郁南县| 叶城县| 宝丰县| 阿坝县| 屏南县| 临汾市| 金昌市| 黑河市| 盐池县| 凉城县| 肇庆市| 保德县| 雷山县| 海晏县| 大余县| 长海县|