日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌重磅發(fā)布自然問題數(shù)據(jù)集,包含30萬個自然發(fā)生的問題和人工注釋的答案

DPVg_AI_era ? 來源:lq ? 2019-01-25 09:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今天,谷歌重磅發(fā)布自然問題數(shù)據(jù)集(Natural Questions),包含30萬個自然發(fā)生的問題和人工注釋的答案,16000個示例,并發(fā)起基于此數(shù)據(jù)集的問答系統(tǒng)挑戰(zhàn)賽。有望成為自然語言理解領域的SQuAD!

開放領域問題回答(QA)是自然語言理解(NLU)中的一項基準任務,它的目的是模擬人類如何查找信息,通過閱讀和理解整個文檔來找到問題的答案。

比如,給定一個用自然語言表達的問題“為什么天空是藍色的?”("Why is the sky blue?”),QA系統(tǒng)應該能夠閱讀網(wǎng)頁(例如“天空漫射”的維基百科頁面)并返回正確的答案,即使答案有些復雜和冗長。

然而,目前還沒有可以用于訓練和評估QA模型的大型、公開的自然發(fā)生問題(即由尋求信息的人提出的問題)和答案數(shù)據(jù)集。

這是因為構(gòu)建用于QA任務的高質(zhì)量數(shù)據(jù)集需要大量的真實問題來源,并且需要大量人力來為這些問題尋找正確答案。

為了促進QA領域的研究進展,谷歌今天發(fā)布自然問題數(shù)據(jù)集(Natural Questions, NQ),這是一個用于訓練和評估開放領域問答系統(tǒng)的新的、大規(guī)模語料庫,也是第一個復制人類查找問題答案的端到端流程的語料庫。

Natural Questions數(shù)據(jù)集

NQ的規(guī)模非常龐大,包含30萬個自然發(fā)生的問題,以及來自Wikipedia頁面的人工注釋答案,用于訓練QA系統(tǒng)。

此外,NQ語料庫還包含16000個示例,每個示例都由5位不同的注釋人提供答案(針對相同的問題),這對于評估所學習的QA系統(tǒng)的性能非常有用。

Natural Questions數(shù)據(jù)集中的示例

由于回答NQ中的問題比回答瑣碎問題(這些問題對計算機來說已經(jīng)很容易解決)需要有更深入的理解,谷歌還發(fā)起了一項基于此數(shù)據(jù)集的挑戰(zhàn)賽,以幫助提高計算機對自然語言的理解。

NQ挑戰(zhàn)賽排行榜

NQ數(shù)據(jù)集包含307K訓練示例、8K開發(fā)示例和8K測試示例。

目前,NQ挑戰(zhàn)賽排行榜上只有谷歌的BERT模型和DecAtt-DocReader模型的成績。在論文中,谷歌證明在長答案選擇任務上的人類的最優(yōu)成績?yōu)?7% F1,在短答案選擇任務上人類的最優(yōu)成績?yōu)?6%。

來自谷歌搜索的真實問題

NQ是第一個使用自然發(fā)生的查詢創(chuàng)建的數(shù)據(jù)集,并專注于通過閱讀整個頁面來查找答案,而不是從一個短段落中提取答案。

為了創(chuàng)建NQ,我們從用戶提交給Google搜索引擎的真實、匿名、聚合的查詢開始。

然后,我們要求注釋者通過通讀整個維基百科頁面來找到答案,就好像這個問題是他們自己提出的一樣。注釋者需要找到一個長答案和一個短答案,長答案涵蓋推斷問題所需的所有信息,短答案需要用一個或多個實體的名稱簡潔地回答問題。

對NQ語料庫的注釋質(zhì)量進行評估,顯示準確率達到90%。

注釋包含一個長答案和一個短答案

研究人員在論文《自然問題:問答研究的基準》(Natural Questions: a Benchmark for Question Answering Research)中對數(shù)據(jù)收集的過程進行了全面描述,論文已發(fā)表在《計算語言學協(xié)會會刊》(Transactions of the Association for computing Linguistics)。大家也可以在NQ網(wǎng)站上查看更多來自數(shù)據(jù)集的示例。

自然語言理解挑戰(zhàn)

NQ的目的是使QA系統(tǒng)能夠閱讀和理解完整的維基百科文章,其中可能包含問題的答案,也可能不包含問題的答案。

系統(tǒng)首先需要確定這個問題的定義是否足夠充分,是否可以回答——許多問題本身基于錯誤的假設,或者過于模糊,無法簡明扼要地回答。

然后,系統(tǒng)需要確定維基百科頁面中是否包含推斷答案所需的所有信息。我們認為,相比在知道長答案后在尋找短答案,長答案識別任務——找到推斷答案所需的所有信息——需要更深層次的語言理解。

我們希望NQ的發(fā)布以及相關的挑戰(zhàn)賽將有助于推動更有效、更強大的QA系統(tǒng)的開發(fā)。我們鼓勵NLU社區(qū)參與進來,并幫助縮小目前最先進方法的性能與人類上限之間的巨大差距。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6264

    瀏覽量

    112122
  • 數(shù)據(jù)集

    關注

    4

    文章

    1240

    瀏覽量

    26279
  • 自然語言
    +關注

    關注

    1

    文章

    292

    瀏覽量

    14032

原文標題:NLP新基準!谷歌重磅發(fā)布開放問答數(shù)據(jù)集,30萬自然提問+人工注釋答案

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    BOE(京東方)聯(lián)合TüV萊茵發(fā)布自然光顯示技術白皮書》 以“晨午暮夜”系統(tǒng)仿生定義健康顯示新標桿

    題,基于“晨午暮夜”四時自然光所提出的“系統(tǒng)仿生學”設計理念,BOE(京東方)深刻解讀并展示了其獨創(chuàng)的“自然光”顯示技術(BNL)的創(chuàng)新實踐。會上,BOE(京東方)攜手國際權(quán)威檢測認證機構(gòu)TüV萊茵共同發(fā)布
    的頭像 發(fā)表于 03-12 15:09 ?284次閱讀
    BOE(京東方)聯(lián)合TüV萊茵<b class='flag-5'>發(fā)布</b>《<b class='flag-5'>自然</b>光顯示技術白皮書》 以“晨午暮夜”系統(tǒng)仿生定義健康顯示新標桿

    芯賽場,云力量!小眼睛科技遠程AI實驗平臺重磅發(fā)布助力2026創(chuàng)賽!

    新歲策馬向繁花FPGA遠程AI實驗平臺重磅發(fā)布賦能未來創(chuàng)芯者,小眼睛科技FPGA遠程AI實驗平臺助力2026創(chuàng)賽!2026,小眼睛科技重磅推出全新FPGA遠程AI實驗平臺!該平臺將作
    的頭像 發(fā)表于 03-05 13:01 ?2474次閱讀
    芯賽場,云力量!小眼睛科技遠程AI實驗平臺<b class='flag-5'>重磅</b><b class='flag-5'>發(fā)布</b>助力2026<b class='flag-5'>集</b>創(chuàng)賽!

    京東方發(fā)布全球首個自然光顯示評價體系團體標準

    2026年2月6日,由BOE(京東方)牽頭,聯(lián)合產(chǎn)學研用生態(tài)伙伴共同主導制定的《擬自然光顯示性能表征及測試方法》團體標準(T/ZSA 331—2026)正式發(fā)布。
    的頭像 發(fā)表于 02-11 15:01 ?747次閱讀

    整車自然暴曬與全光譜陽光模擬老化相關性研究

    隨著汽車工業(yè)中非金屬材料的廣泛應用,其耐老化性能日益受到重視。自然暴曬試驗雖能真實反映材料在實際使用環(huán)境下的老化行為,但存在試驗周期長、條件不可控、重復性差等不足。為縮短產(chǎn)品開發(fā)周期,人工
    的頭像 發(fā)表于 02-09 18:03 ?436次閱讀
    整車<b class='flag-5'>自然</b>暴曬與全光譜陽光模擬老化相關性研究

    自然語言處理NLP的概念和工作原理

    自然語言處理 (NLP) 是人工智能 (AI) 的一分支,它會教計算機如何理解口頭和書面形式的人類語言。自然語言處理將計算語言學與機器學習和深度學習相結(jié)合來處理語音和文本
    的頭像 發(fā)表于 01-29 14:01 ?655次閱讀
    <b class='flag-5'>自然</b>語言處理NLP的概念和工作原理

    三防漆固化方式對比:自然/熱/UV哪種最好? |鉻銳特實業(yè)

    鉻銳特實業(yè)|三防漆固化方式詳解:自然固化需12-48小時、熱固化30分鐘-2小時、UV固化僅幾秒到30秒。對比優(yōu)缺點、時間、成本及適用場景,助您選擇最適合的生產(chǎn)工藝
    的頭像 發(fā)表于 01-23 16:10 ?749次閱讀
    三防漆固化方式對比:<b class='flag-5'>自然</b>/熱/UV哪種最好? |鉻銳特實業(yè)

    自然智能與人工智能融合如何重塑芯片設計

    人類大腦是所有處理器中最復雜的,能夠構(gòu)思出不可思議的創(chuàng)意,解決復雜、微妙的問題。相比之下,人工智能擅長快速分析海量數(shù)據(jù)并高效執(zhí)行任務。當自然智能和人工智能融合的結(jié)果,就是芯片設計領域正
    的頭像 發(fā)表于 01-15 13:58 ?740次閱讀

    LoRaWAN協(xié)議,如何促進人與自然的和諧發(fā)展?

    LoRaWAN促進人與自然和諧發(fā)展,實現(xiàn)生態(tài)監(jiān)測、動物保護與數(shù)據(jù)支撐。
    的頭像 發(fā)表于 01-13 14:24 ?379次閱讀
    LoRaWAN協(xié)議,如何促進人與<b class='flag-5'>自然</b>的和諧發(fā)展?

    校園科普氣象站:技術賦能下的自然探索課堂

    校園科普氣象站:技術賦能下的自然探索課堂 柏峰【BF-XQX】在素質(zhì)教育深化推進的背景下,校園科普氣象站正成為連接課堂理論與自然實踐的重要橋梁。它以模塊化的技術架構(gòu)、可視化的交互設計和趣味化的教學場景,
    的頭像 發(fā)表于 10-22 10:05 ?506次閱讀
    校園科普氣象站:技術賦能下的<b class='flag-5'>自然</b>探索課堂

    SGS為TCL華星自然光MNT顯示頒發(fā)高自然光相似度 Performance Tested Mark

    廣州2025年10月17日?/美通社/ -- 2025年10月15日,第138屆中國進出口商品交易會(又稱"廣交會")的全屋智能家電專場新產(chǎn)品發(fā)布會現(xiàn)場,國際公認的測試、檢驗和認證機構(gòu)SGS為TCL
    的頭像 發(fā)表于 10-19 20:26 ?563次閱讀
    SGS為TCL華星<b class='flag-5'>自然</b>光MNT顯示頒發(fā)高<b class='flag-5'>自然</b>光相似度 Performance Tested Mark

    激光與自然光的根本區(qū)別是什么?

    的,能夠照準在一焦點。即使在遠處,光線激光的光線也能夠照準在一焦點上。而自然日光的光線是分散的,所以光線是比較弱。 激光主要的特性之一便是可以產(chǎn)生高得出奇的亮度,或者說具有高的發(fā)光強度。地球上任何一種已知材料,無論
    的頭像 發(fā)表于 09-24 08:08 ?532次閱讀

    NVIDIA推出多語種語音AI開放數(shù)據(jù)與模型

    發(fā)布的 Granary 數(shù)據(jù)包含約 100 小時音頻,可用于訓練高精度、高吞吐量的 AI 音頻轉(zhuǎn)錄與翻譯模型。
    的頭像 發(fā)表于 09-23 15:34 ?1230次閱讀

    北斗生態(tài)環(huán)境監(jiān)測站:讀懂自然的 “語言”

    北斗生態(tài)環(huán)境監(jiān)測站:讀懂自然的 “語言”柏峰【BF-BDQX】當生態(tài)監(jiān)測遇上北斗技術,一場關于 “精準守護自然” 的變革正悄然發(fā)生 ——北斗生態(tài)環(huán)境監(jiān)測站以北斗定位導航系統(tǒng)為核心
    的頭像 發(fā)表于 09-04 10:59 ?674次閱讀
    北斗生態(tài)環(huán)境監(jiān)測站:讀懂<b class='flag-5'>自然</b>的 “語言”

    航天宏圖筑牢自然災害安全防線

    自然災害頻發(fā)的今天,每一秒的數(shù)據(jù)滯后都可能意味著生命與財產(chǎn)的巨大損失。如何讓防災減災的決策從“經(jīng)驗驅(qū)動”轉(zhuǎn)向“數(shù)據(jù)智能”?航天宏圖用一套“常普常新”的科技解決方案,給出了答案。
    的頭像 發(fā)表于 07-14 14:31 ?854次閱讀

    鴻利智匯旗下斯邁得推出自然光系列產(chǎn)品

    隨著健康意識的提升與生活方式的轉(zhuǎn)變,人們對健康光源的要求越來越高。鴻利智匯集團旗下子公司斯邁得憑借領先的光譜技術,推出自然光系列產(chǎn)品,以智能科技模擬自然日光律動,為客戶帶來健康、舒適且高度個性化的全天候光環(huán)境體驗。
    的頭像 發(fā)表于 05-22 13:47 ?1188次閱讀
    东台市| 隆尧县| 玉田县| 延寿县| 大安市| 华安县| 浦东新区| 黑山县| 赤城县| 陇川县| 荆州市| 碌曲县| 登封市| 寻甸| 绥阳县| 崇仁县| 彭泽县| 虹口区| 大悟县| 阳信县| 贡嘎县| 苍南县| 萨迦县| 普兰店市| 赞皇县| 长宁区| 扬中市| 嘉定区| 彭泽县| 宜川县| 紫金县| 新郑市| 英德市| 望谟县| 阳春市| 贵溪市| 朝阳区| 神农架林区| 邵阳县| 崇仁县| 北流市|