日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如果把中學(xué)生的英語閱讀理解選擇題讓AI來做,會(huì)做出什么水平?

DPVg_AI_era ? 來源:lp ? 2019-04-19 10:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

如果把中學(xué)生的英語閱讀理解選擇題讓AI來做,會(huì)做出什么水平?近日,上交大團(tuán)隊(duì)訓(xùn)練的“雙向協(xié)同匹配網(wǎng)絡(luò)”(DCMN)取得了74%的正確率。盡管和人類學(xué)生相比只能算馬馬虎虎,但對(duì)AI來說,這已經(jīng)達(dá)到了目前的最高水平。

目前,在英語考試的閱讀理解上,AI雖然無法擊敗更有能力的人類學(xué)生,但它仍然是衡量機(jī)器對(duì)語言理解能力的最佳量度之一。

近日,上海交通大學(xué)的趙海團(tuán)隊(duì)對(duì)AI模型進(jìn)行了超過25000次英語閱讀理解測(cè)試訓(xùn)練。訓(xùn)練材料和中國(guó)現(xiàn)行英語水平考試的閱讀理解形式類似,每篇文章大約200到300個(gè)詞,文后是一系列與文章內(nèi)容相關(guān)的多項(xiàng)選擇題。這些測(cè)試來自針對(duì)12至18歲中國(guó)學(xué)生的英語水平考試。

雖然這些問題有些可以在文中找到答案,但其中一半以上的題目仍需要一定程度的推理。例如,有些問題會(huì)要求從四個(gè)選項(xiàng)中選出文章的“最佳標(biāo)題”。在訓(xùn)練結(jié)束后,AI參加了測(cè)試,其中包括1400次以前從未見過的考試。綜合得分為74分(百分制),優(yōu)于之前的所有機(jī)器測(cè)試。

上交大的AI系統(tǒng)可以識(shí)別與問題相關(guān)的文章相關(guān)部分,然后選出在含義上和邏輯上最相似的答案。在測(cè)試中排名第二的是騰訊的AI系統(tǒng),在同一次考試中得分為72分。騰訊的AI學(xué)會(huì)了比較每個(gè)選項(xiàng)中包含的信息,并將不同選項(xiàng)間的信息差異作為提示,在文章中尋找證據(jù)。

目前最厲害的AI,閱讀理解只能得個(gè)C+

盡管在測(cè)試中分?jǐn)?shù)處于領(lǐng)先,趙海團(tuán)隊(duì)仍在努力提高AI系統(tǒng)的能力?!叭绻麖恼嫒藢W(xué)生的視角來看,我們的AI的表現(xiàn)也就是一般水平,最多得個(gè)C+,”他說?!皩?duì)于那些想進(jìn)入中國(guó)優(yōu)秀大學(xué)的學(xué)生來說,他們的目標(biāo)是90分?!?/p>

為了提高分?jǐn)?shù),團(tuán)隊(duì)將嘗試修改AI,以便理解嵌入在句子結(jié)構(gòu)中的信息,并為AI提供更多數(shù)據(jù),擴(kuò)大其詞匯量。

如何理解人類的語言,一直是AI領(lǐng)域的一個(gè)主要問題,因?yàn)檫@種理解通常是不精確的,這個(gè)問題涉及機(jī)器難以掌握的隱含語境信息和社會(huì)線索問題。

卡內(nèi)基梅隆大學(xué)的GuokunLai表示,目前我們?nèi)圆磺宄嗀I在學(xué)習(xí)我們的語言時(shí)會(huì)遵循什么規(guī)則,“不過在閱讀了大量的句子和文章之后,AI似乎能夠理解我們的邏輯?!?/p>

該研究的相關(guān)論文已經(jīng)發(fā)表在Arxiv上,以下是論文的主要內(nèi)容:

讓AI做閱讀理解是一項(xiàng)具有挑戰(zhàn)性的任務(wù),需要復(fù)雜的推理過程。AI需要從一組候選答案中選擇正確的答案。本文提出雙重協(xié)同匹配網(wǎng)絡(luò)(DCMN),該網(wǎng)絡(luò)可以雙向地模擬通道,問題和答案之間的關(guān)系。

與僅就問題感知或選擇性文章表示進(jìn)行計(jì)算的現(xiàn)有方法不同,DCMN能夠計(jì)算文章感知問題表示和文章感知答案表示。為了證明DCMN模型的有效性,我們?cè)诖笮烷喿x理解數(shù)據(jù)集(即RACE)上評(píng)估了模型。結(jié)果表明,該模型達(dá)到了目前AI閱讀理解的最高水平。

機(jī)器閱讀理解和問答已經(jīng)成為評(píng)估自然語言處理和理解領(lǐng)域人工智能系統(tǒng)進(jìn)展的關(guān)鍵應(yīng)用問題。計(jì)算語言學(xué)界對(duì)機(jī)器閱讀理解和問答的一般問題給予了極大的關(guān)注。

本文主要關(guān)注選擇題閱讀理解數(shù)據(jù)集,如RACE,該數(shù)據(jù)集中每個(gè)問題后都帶有一組答案選項(xiàng)。大多數(shù)問題的正確答案可能不會(huì)在原文中完全復(fù)現(xiàn),問題類型和范圍也更加豐富和廣泛,比如涉及某一段落的提要和對(duì)文章作者態(tài)度的分析。

這需要AI能夠更深入地了解文章內(nèi)容,并利用外部世界知識(shí)來回答這些問題。此外,與傳統(tǒng)的閱讀理解問題相比,我們需要充分考慮通過文章-問題-答案三者之間的關(guān)系,而不僅僅是問題-答案的配對(duì)。

新模型DCMN:在文章、問題、答案三者之間建立聯(lián)系

DCMN模型可以將問題-答案與給定文章內(nèi)容進(jìn)行雙向匹配,利用了NLP領(lǐng)域的最新突破——BERT進(jìn)行上下文嵌入。在介紹BERT的原論文中提到,對(duì)應(yīng)于第一輸入令牌(CLS)的最終隱藏向量被用作聚合表示,然后利用分類層計(jì)算標(biāo)準(zhǔn)分類損失。

我們認(rèn)為這種方法太粗糙,無法處理文章-問題-答案的三者關(guān)系組合,因?yàn)檫@種方法只是粗略地將文章-問題的聯(lián)系作為第一序列,將問題作為第二序列,沒有考慮問題和文章內(nèi)容之間的關(guān)系。因此,我們提出了一種新方法來模擬文章、問題和候選答案之間的關(guān)系。

使用BERT作為編碼層,分別得到文章、問題和答案選項(xiàng)的上下文表示。

構(gòu)造匹配層以獲得文章-問題-答案三者之間匹配表示,對(duì)問題在文章中對(duì)應(yīng)的位置信息與特定上下文匹配的候選答案進(jìn)行編碼。

對(duì)從字級(jí)到序列級(jí)的匹配表示應(yīng)用層次聚合方法,然后從序列級(jí)到文檔級(jí)應(yīng)用。

我們的模型在BERT模型的基礎(chǔ)上,于RACE數(shù)據(jù)集上將當(dāng)前最高得分提高了2.6個(gè)百分點(diǎn),并使用大規(guī)模BERT模型進(jìn)一步將得分提高了3個(gè)百分點(diǎn)。

實(shí)驗(yàn)及測(cè)試結(jié)果

在RACE數(shù)據(jù)集上對(duì)模型進(jìn)行了評(píng)估。這個(gè)數(shù)據(jù)集由兩個(gè)子集組成:RACE-M和RACE-H。RACE-M來自初中考試試題,RACE-H來自高中考試試題。RACE是這兩者的結(jié)合。我們將我們的模型與以下基線方法進(jìn)行了比較:MRU(多范圍推理),DFN(動(dòng)態(tài)融合網(wǎng)絡(luò)),HCM(等級(jí)協(xié)同匹配),OFT(OpenAI微調(diào)語言轉(zhuǎn)換模型),RSM(閱讀策略模型)。

我們還將我們的模型與BERT基線進(jìn)行比較,并實(shí)現(xiàn)BERT原論文(2018)中描述的方法,該方法使用對(duì)應(yīng)于第一個(gè)輸入標(biāo)記([CLS])的最終隱藏向量作為聚合表示,然后是分類層,最后計(jì)算標(biāo)準(zhǔn)分類損失。測(cè)試結(jié)果如上表所示。

我們可以看到BERT基線模型的性能非常接近先前的最高水平,而大型BERT模型的表現(xiàn)甚至超過了之前SOTA水平3.7%。但是實(shí)驗(yàn)結(jié)果表明,我們的DCMN模型更強(qiáng)大,將最高得分進(jìn)一步分別提升了2.2%。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41518

    瀏覽量

    302810
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50403

    瀏覽量

    267232
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1240

    瀏覽量

    26270

原文標(biāo)題:最強(qiáng)AI挑戰(zhàn)中國(guó)英語閱讀理解:只得70多分,不如中等生

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI輔助編程設(shè)計(jì)之道:從Spec到Code工程實(shí)踐

    容易出錯(cuò),AI寫更容易偏離。但如果把接口定義清楚了,AI反而能穩(wěn)定輸出。 第三,探索式的設(shè)計(jì)迭代是有效的。不必追求一次設(shè)計(jì)寫完美,可以先
    發(fā)表于 03-16 13:33

    龍芯中科護(hù)航蘇州初中英語聽力口語自動(dòng)化考試

    近日,蘇州市八年級(jí)英語“人機(jī)對(duì)話”的正式考試順利落幕,此次考試采用聽說科技的英語人機(jī)對(duì)話考試系統(tǒng),全程以“實(shí)戰(zhàn)”模式護(hù)航學(xué)生備考自動(dòng)化英語聽說測(cè)試,是蘇州市教育數(shù)字化、規(guī)范化考評(píng)的重要
    的頭像 發(fā)表于 02-11 16:27 ?1065次閱讀

    Transformer 入門:從零理解 AI 大模型的核心原理

    AI 處理文本的最小單位,可以是詞或詞的一部分 嵌入向量 文字變成數(shù)字的\"翻譯\"方式 注意力機(jī)制 詞能\"看到\"其他詞,理解關(guān)系 Q/K/V 查詢/鍵
    發(fā)表于 02-10 16:33

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    和探索;人類級(jí)別的理解能力;常識(shí)推理;現(xiàn)實(shí)世界的知識(shí)整合。 3、測(cè)試時(shí)計(jì)算 測(cè)試時(shí)計(jì)算(TTC)是指在模型推理階段利用額外的計(jì)算資源提升泛化性能。 4、具身智能與滲透式AI 1)具身智能對(duì)AGI的意義
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+具身智能芯片

    進(jìn)行分析和處理,以便更好地理解和利用這些信息。 具身智能除了學(xué) 習(xí)還有記憶功能,這在生物學(xué)中對(duì)應(yīng)遺傳。在芯片實(shí)現(xiàn)中,常常采用存算一體化(包含存內(nèi)計(jì)算)以及感知功能也集成在一起的感存算一體化技術(shù)
    發(fā)表于 09-18 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    AI被賦予了人的智能,科學(xué)家們希望在沒有人類的引導(dǎo)下,AI自主的提出科學(xué)假設(shè),諾貝爾獎(jiǎng)級(jí)別的假設(shè)哦。 AI驅(qū)動(dòng)科學(xué)被認(rèn)為是科學(xué)發(fā)現(xiàn)的第五個(gè)范式了,與實(shí)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算科學(xué)、數(shù)據(jù)驅(qū)動(dòng)科學(xué)一起構(gòu)成
    發(fā)表于 09-17 11:45

    【賽補(bǔ)充說明】2025全國(guó)大學(xué)生FPGA創(chuàng)新設(shè)計(jì)競(jìng)賽紫光同創(chuàng)杯賽

    【賽發(fā)布】2025年全國(guó)大學(xué)生FPGA創(chuàng)新設(shè)計(jì)競(jìng)賽紫光同創(chuàng)杯賽邀您鴻圖展翼共赴芯程!【賽知多少】紫光同創(chuàng)賽答疑專場(chǎng)|2025年全國(guó)大學(xué)生
    的頭像 發(fā)表于 09-12 16:03 ?2578次閱讀
    【賽<b class='flag-5'>題</b>補(bǔ)充說明】2025全國(guó)大<b class='flag-5'>學(xué)生</b>FPGA創(chuàng)新設(shè)計(jì)競(jìng)賽紫光同創(chuàng)杯賽

    全新ES8打造大三排SUV駕乘標(biāo)桿

    俗話說,魚和熊掌不可兼得,但蔚團(tuán)隊(duì)拒絕「要么好開、要么舒適」的選擇題
    的頭像 發(fā)表于 09-10 15:17 ?1348次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+內(nèi)容總覽

    章 具身智能芯片 第9章 從AI芯片到AGI芯片 圖2 各章重點(diǎn)及邏輯框架 該書可供AI和芯片領(lǐng)域的各層次人群閱讀,無論是學(xué)習(xí)者還是研究人員。 對(duì)于本人來說,讀這本書不但是為了豐富這方面的知識(shí),更主要的是為孩子讀研
    發(fā)表于 09-05 15:10

    電子行業(yè):AI 協(xié)同精密工藝控更精準(zhǔn)

    電子行業(yè)的精密工藝控正迎來 AI 協(xié)同設(shè)備管理系統(tǒng)帶來的變革。從工藝設(shè)計(jì)、設(shè)備運(yùn)行監(jiān)控、質(zhì)量檢測(cè)到設(shè)備維護(hù),AI 技術(shù)貫穿始終,精密工藝的
    的頭像 發(fā)表于 08-27 10:10 ?854次閱讀
    電子行業(yè):<b class='flag-5'>AI</b> 協(xié)同<b class='flag-5'>讓</b>精密工藝<b class='flag-5'>把</b>控更精準(zhǔn)

    【賽知多少】 紫光同創(chuàng)賽答疑專場(chǎng)|2025年全國(guó)大學(xué)生嵌入式芯片與系統(tǒng)設(shè)計(jì)競(jìng)賽FPGA賽道

    紫光同創(chuàng)賽道答疑專場(chǎng)來啦!2025年全國(guó)大學(xué)生嵌入式芯片與系統(tǒng)設(shè)計(jì)競(jìng)賽報(bào)名已拉開帷幕,F(xiàn)PGA賽道的挑戰(zhàn)與創(chuàng)新并存。近期,我們收到許多關(guān)于賽的咨詢,小眼睛科技團(tuán)隊(duì)第一時(shí)間整理了大家的疑問,并帶來
    的頭像 發(fā)表于 08-06 11:02 ?3883次閱讀
    【賽<b class='flag-5'>題</b>知多少】 紫光同創(chuàng)賽<b class='flag-5'>題</b>答疑專場(chǎng)|2025年全國(guó)大<b class='flag-5'>學(xué)生</b>嵌入式芯片與系統(tǒng)設(shè)計(jì)競(jìng)賽FPGA賽道

    英語單詞學(xué)習(xí)頁(yè)面+單詞朗讀實(shí)現(xiàn) -- 【2】單詞朗讀實(shí)現(xiàn) ##HarmonyOS SDK AI##

    requestId 原先我按照文檔里是這個(gè)參數(shù)寫死的,但是我發(fā)現(xiàn),如果連續(xù)兩次進(jìn)行播放的話,就會(huì)報(bào)錯(cuò)。 文檔中的提示是“requestId在同一實(shí)例內(nèi)僅能用一次,請(qǐng)勿重復(fù)設(shè)置”,我一開始的理解就是你不能
    發(fā)表于 06-29 23:26

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗(yàn)】+讀《零基礎(chǔ)開發(fā)AI Agent》掌握扣子平臺(tái)開發(fā)智能體方法

    都比較復(fù)雜,涉及到的基礎(chǔ)素材很多,而閱讀書籍的人并沒有,所以最好像其他的編程書籍一樣也建立一個(gè)素材庫(kù),幫助讀者更好的理解知識(shí)并有實(shí)際項(xiàng)目的參照價(jià)值。 不過總體來說,我還是從這本書中收獲頗豐,對(duì)AI
    發(fā)表于 05-14 19:51

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗(yàn)】+Agent的案例解讀

    AI助手等功能,大大提升了古籍整理與研究利用的效率。? 業(yè)務(wù)特色? 在引入扣子前,識(shí)典古籍在古籍?dāng)?shù)字化過程中面臨以下的挑戰(zhàn):? 1)內(nèi)容理解難度高 古籍語言復(fù)雜晦澀,使普通用戶往往望而卻步,平臺(tái)
    發(fā)表于 05-14 11:23

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗(yàn)】+Agent的工作原理及特點(diǎn)

    如何有效地實(shí)現(xiàn)目標(biāo)。它涉及子目標(biāo)分解、連續(xù)思考和自我反思等復(fù)雜的過程。 3)行動(dòng) 行動(dòng)是指在感知和規(guī)劃后所做出的具體操作。 在Agent的應(yīng)用中,主要是通過提示詞完成的,其編寫提示詞的提示詞萬能公式
    發(fā)表于 05-11 10:24
    兴海县| 会东县| 邓州市| 腾冲县| 江永县| 治多县| 普兰县| 荥经县| 新乡市| 西丰县| 阳泉市| 莱阳市| 和静县| 黄浦区| 山阳县| 莱芜市| 庆城县| 冷水江市| 德兴市| 井陉县| 蛟河市| 蓬莱市| 浙江省| 鄂尔多斯市| 邹平县| 偏关县| 北安市| 大埔县| 达尔| 平遥县| 吉林省| 辉南县| 新绛县| 昌黎县| 定州市| 民丰县| 商洛市| 谢通门县| 桐梓县| 满洲里市| 陆川县|