日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌宣布開放Open Images V4數(shù)據(jù)集

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-05-02 14:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今天,谷歌宣布開放Open Images V4數(shù)據(jù)集,包含190萬張圖片,共計600個類別,共標記了1540萬個邊界框,這是迄今的有對象位置注釋的最大數(shù)據(jù)集?;诖藬?shù)據(jù)集,谷歌將在ECCV 2018舉辦大型圖像挑戰(zhàn)賽。

2016年,谷歌推出一個包含900萬張圖片的聯(lián)合發(fā)布數(shù)據(jù)庫:Open Images,其中標注了成千上萬個對象類別。從它發(fā)布以來,谷歌的工程師一直在努力更新和重新整理數(shù)據(jù)集,以為計算機視覺研究領(lǐng)域提供有用的資源來開發(fā)新的模型。

今天,谷歌宣布開放Open Images V4,其中包含190萬張圖片,共計600個類別,共標記了1540萬個邊界框。這個數(shù)據(jù)集成為現(xiàn)有的帶有對象位置注釋的最大數(shù)據(jù)集。這些邊界框大部分是由專業(yè)的注釋人員手工繪制的,以確保準確性和一致性。這些圖像非常多樣,通常包含有幾個對象的復(fù)雜場景(平均每個圖像包含8個邊界框)。

谷歌發(fā)起大型開放圖像挑戰(zhàn)賽

與此同時,谷歌還推出Open Image Challenge(開放圖像挑戰(zhàn)賽),這是一項新的目標檢測挑戰(zhàn),將在2018年歐洲計算機視覺會議(ECCV 2018)上舉行。Open Image Challenge遵循了PASCAL VOC、ImageNet和COCO的傳統(tǒng),但規(guī)??涨埃?/p>

在170萬張訓(xùn)練圖片中,有1220萬個有框注釋,共500個類別。

比以前的檢測挑戰(zhàn)更廣泛,包括諸如“fedora”和“snowman”之類的新對象。

除了對象檢測這個任務(wù)之外,挑戰(zhàn)還包括一個視覺關(guān)系檢測跟蹤人物,即在特定關(guān)系中檢測對象的配對情況,例如“女人彈吉他”。

訓(xùn)練集現(xiàn)在已經(jīng)可以使用了。一組包含10萬個圖像的測試集將于2018年7月1日由Kaggle發(fā)布。提交結(jié)果的截止日期是2018年9月1日。我們希望這些大型的訓(xùn)練集能夠激發(fā)對更精密的探測模型的研究,這些模型將超過目前最先進的性能,并且500個類別將能夠更精確地評估不同的探測器在哪里表現(xiàn)得最好。此外,有大量的圖像和許多對象的注釋使我們能夠探索視覺關(guān)系檢測,這是一個正在發(fā)展的分支領(lǐng)域的熱門話題。

除此之外,Open Images V4還包含3010萬的人工驗證的圖像級標簽,共計19794個類別,這并不是挑戰(zhàn)的一部分。該數(shù)據(jù)集包括550萬個圖像級標簽,由來自世界各地的成千上萬的用戶在crowdsource.google.com上生成。

Open Images V4數(shù)據(jù)集

Open Images是一個由900萬張圖片組成的數(shù)據(jù)集,這些圖像被標注為圖像級標簽和對象邊界框。V4的訓(xùn)練集包含了600對象類的1460萬個圖像,其中共標記了174萬個標記目標,這使得它成為現(xiàn)有的最大包含對象位置注釋的數(shù)據(jù)集。這些物體的邊界框大部分是由專業(yè)的注釋器手工繪制的,以確保準確性和一致性。這些圖像非常多樣,通常包含有多個對象的復(fù)雜場景(平均每個圖像有8.4個標記)。此外,數(shù)據(jù)集還帶有數(shù)千個類的圖像級標簽。

數(shù)據(jù)組織結(jié)構(gòu)

數(shù)據(jù)集被分割為一個訓(xùn)練集(9,011,219圖像),一個驗證集(41620個圖像)和一個測試集(125,436張圖片)。這些圖像被標注了圖像級標簽和邊界框,如下所述。

表1

表1顯示了數(shù)據(jù)集的所有子集中的圖像級標簽的概述。所有的圖像都有機器生成的圖像級標簽,這些標簽是由類似于Google Cloud Vision API的計算機視覺模型自動生成的。這些自動生成的標簽有一個很大的假正率。

此外,驗證和測試集,以及部分訓(xùn)練集都包含經(jīng)過人工驗證的圖像級標簽。大多數(shù)驗證都是由Google內(nèi)部的注釋者完成的。更小的部分是通過圖片標簽軟件來完成的,如Crowdsource app, g.co/imagelabeler。這個驗證過程實際上消除了假陽性(但不是傳統(tǒng)意義上的假陰性,這種方式會導(dǎo)致一些標簽可能在圖像中丟失)。由此產(chǎn)生的標簽在很大程度上是正確的,我們建議使用這些標簽來訓(xùn)練計算機視覺模型。使用多個計算機視覺模型來生成樣本,這樣做是保證在訓(xùn)練時不僅僅用機器生成的標簽數(shù)據(jù),這就是為什么詞匯表被顯著擴展的原因,如表一所示。

總的來說,有19995個不同的類和圖像級標簽。請注意,這個數(shù)字略高于上表中人工驗證的標簽的數(shù)量。原因是在機器生成的數(shù)據(jù)集中有少量的標簽并沒有出現(xiàn)在人工驗證的集合中??捎?xùn)練的類是那些在V4訓(xùn)練集中至少有100個正例的人工驗證類?;谶@個定義,7186個類被認為是可訓(xùn)練的。

邊界框

表2

表2顯示了數(shù)據(jù)集的所有分割中邊界框注釋的概述,它包含了600個對象類。這些服務(wù)提供的范圍比ILSVRC和COCO探測挑戰(zhàn)的范圍更廣,包括諸如“fedora”和“snowman”之類的新對象。

對于訓(xùn)練集,我們在174 萬的圖像中標注了方框,用于可用的陽性人工標記的圖像級標簽。我們關(guān)注最具體的標簽。例如,如果一個圖像包含汽車、豪華轎車、螺絲刀,我們?yōu)楹廊A轎車和螺絲刀提供帶注釋的標注方框。對于圖像中的每一個標簽,我們詳盡地注釋了圖像中的對象類的每個實例。數(shù)據(jù)集共包含1460萬個的邊界框。平均每個圖像有8.4個標記對象。

對于驗證和測試集,針對所有可用的正圖像級標簽,我們提供了所有對象實例詳盡的邊界框注釋。所有的邊界框都是手工繪制的。我們有意地嘗試在語義層次結(jié)構(gòu)中盡可能詳盡地標注注釋框。平均來說,在驗證和測試集中,每個圖像標記了5個邊界框。

在所有的子集中,包括訓(xùn)練集、驗證集和測試集中,注釋器還為每個邊界框標記了一組屬性,例如指出該對象是否被遮擋。

類定義(Class definitions)

類別由MIDs(機器生成的id)標識,可以在Freebase或Google知識圖的API中找到。每個類的簡短描述都可以在類中CSV中找到。

統(tǒng)計和數(shù)據(jù)分析

600個可標記類的層次結(jié)構(gòu)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6260

    瀏覽量

    112074
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42457
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1240

    瀏覽量

    26273

原文標題:谷歌發(fā)布迄今最大注釋圖像數(shù)據(jù)集,190萬圖像目標檢測挑戰(zhàn)賽啟動

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    軟通華方超節(jié)點服務(wù)器產(chǎn)品全面適配DeepSeek V4模型

    4月24日,隨著DeepSeek V4大模型的正式開源與發(fā)布,國產(chǎn)算力生態(tài)迎來關(guān)鍵拼圖。軟通動力旗下軟通華方迅速響應(yīng),依托“鯤鵬+昇騰”雙引擎架構(gòu),基于核心產(chǎn)品A800T A3/超強A800I A3
    的頭像 發(fā)表于 04-28 16:34 ?358次閱讀

    燧原科技L600 FP8原生適配DeepSeek-V4-Pro/Flash模型

    2026年4月24日,深度求索(DeepSeek)正式發(fā)布并開源新一代旗艦大模型DeepSeek?V4,同步推出1.6T DeepSeek?V4?Pro與284B DeepSeek?V4
    的頭像 發(fā)表于 04-28 15:19 ?562次閱讀

    國產(chǎn)AI算力:從DeepSeek V4與華為昇騰協(xié)同看全棧自主之路

    Cache滑窗和壓縮算法,顯著降低計算與訪存開銷,在Agent能力、世界知識和推理性能上處于國內(nèi)及開源領(lǐng)域領(lǐng)先地位。 ? 與此同時,華為宣布昇騰超節(jié)點全系列產(chǎn)品全面支持DeepSeek V4系列,這場芯
    的頭像 發(fā)表于 04-25 07:02 ?1.2w次閱讀

    長江計算G940K V2超節(jié)點服務(wù)器完成對DeepSeek V4模型極速適配

      4月24日,備受行業(yè)關(guān)注的大模型產(chǎn)品DeepSeek V4正式發(fā)布。烽火通信旗下長江計算憑借深厚的技術(shù)積累與前瞻布局,以G940K V2超節(jié)點服務(wù)器為核心載體,同步完成對DeepSeek
    的頭像 發(fā)表于 04-24 17:40 ?1934次閱讀

    海光信息DCU平臺完成對DeepSeek V4模型極速適配

      4月24日,深度求索正式發(fā)布并開源DeepSeek V4。海光DCU同步完成對DeepSeek V4的Day0適配,以“模型發(fā)布—芯片適配—產(chǎn)業(yè)落地”的高效閉環(huán),為全球開發(fā)者、企業(yè)客戶提供即取即用的部署方案。
    的頭像 發(fā)表于 04-24 17:32 ?1743次閱讀

    OpenAI正式發(fā)布ChatGPT Images 2.0版本

    在人工智能技術(shù)迅猛發(fā)展的浪潮中,OpenAI始終是引領(lǐng)行業(yè)變革的先鋒力量。近日,OpenAI正式發(fā)布ChatGPT Images 2.0版本,這一消息如同一顆重磅炸彈,在科技圈引發(fā)了強烈反響,在
    的頭像 發(fā)表于 04-22 11:32 ?2853次閱讀

    開放原子“園區(qū)行”(上海站)即將啟幕,開源數(shù)據(jù)專場解鎖AI數(shù)據(jù)價值新可能

    日下午,開放原子“園區(qū)行”(上海站)——開源數(shù)據(jù)專場即將于上海市徐匯區(qū)漕河涇會議中心啟幕 ,邀行業(yè)同仁共探數(shù)據(jù)資源開放共享新模式,讓“沉默
    的頭像 發(fā)表于 04-17 11:17 ?166次閱讀
    <b class='flag-5'>開放</b>原子“園區(qū)行”(上海站)即將啟幕,開源<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>集</b>專場解鎖AI<b class='flag-5'>數(shù)據(jù)</b>價值新可能

    華為數(shù)字能源亮相2026 Open AI Infra Summit

    2026年4月10日,由全球計算聯(lián)盟(GCC)指導(dǎo)、GCC-Open AI Infra社區(qū)主辦,以“開放創(chuàng)新?協(xié)同共贏,構(gòu)建智算基礎(chǔ)設(shè)施生態(tài)”為主題的2026 Open AI Infr
    的頭像 發(fā)表于 04-13 10:12 ?515次閱讀

    小紅書視頻比較詳情API在線調(diào)用數(shù)據(jù)幫助你更快解決數(shù)據(jù)抓取

    / 第三方) 官方 v4 筆記詳情接口(推薦) 地址:https://api.xiaohongshu.com/v4/notes/{note_id} 支持:視頻直鏈、封面、時長、完播率、互動數(shù)據(jù)(點贊
    的頭像 發(fā)表于 03-26 15:22 ?366次閱讀

    昆侖萬維天工AI大模型SkyReels V4登上Artificial Analysis榜單全球第一

    3月19日,天工AI大模型SkyReels V4登上Artificial Analysis榜單Text to Video (With Audio) 賽道全球第一,顯著超越Kling 3.0
    的頭像 發(fā)表于 03-26 10:10 ?1082次閱讀

    2026開放原子園區(qū)行上海站開源數(shù)據(jù)專場圓滿落幕

    3月16日,開放原子園區(qū)行(上海站)開源數(shù)據(jù)專場活動在上海市徐匯區(qū)順利舉辦。本次活動以激活數(shù)據(jù)價值、共筑開源生態(tài)為核心,聚焦人工智能開源數(shù)據(jù)
    的頭像 發(fā)表于 03-18 09:15 ?760次閱讀

    谷歌評論卡,碰一碰即可完成谷歌評論 #谷歌評論卡 #NFC標簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發(fā)布于 :2026年01月15日 17:02:00

    RISC-V V擴展的指令代碼

    1.指令V擴展的主要內(nèi)容: 矢量指令:針對數(shù)據(jù)并行性,增加了一系列新的矢量指令,可以同時對多個數(shù)據(jù)進行操作,提高了計算效率。浮點指令:新增了一些浮點指令,支持更高精度的計算,提高了
    發(fā)表于 10-21 13:11

    Efinity debuger常見問題總結(jié)-v4

    ; (3)安裝驅(qū)動; 在完成以上操作之后,可以按照下面的步驟進行操作。 (1)打開open Debuger (2)點擊perspectives下的profile editor菜單 (3)點擊import
    的頭像 發(fā)表于 06-10 10:43 ?1577次閱讀
    Efinity debuger常見問題總結(jié)-<b class='flag-5'>v4</b>

    WPP Media發(fā)布業(yè)內(nèi)首個「大營銷模型」Open Intelligence

    全新數(shù)據(jù)解決方案和開創(chuàng)性「大營銷模型」,通過預(yù)測性智能提升營銷表現(xiàn),驅(qū)動業(yè)務(wù)增長 上海?2025年6月4日?/美通社/ --?今天,WPP Media正式推出 Open Intelligence
    的頭像 發(fā)表于 06-04 16:12 ?827次閱讀
    WPP Media發(fā)布業(yè)內(nèi)首個「大營銷模型」<b class='flag-5'>Open</b> Intelligence
    昆山市| 田林县| 肇东市| 东辽县| 石嘴山市| 左贡县| 当涂县| 玉溪市| 明星| 枣庄市| 恩施市| 乳山市| 封丘县| 中方县| 舒城县| 扎鲁特旗| 张家口市| 绍兴市| 辽中县| 博罗县| 永仁县| 尚志市| 昌都县| 黔江区| 和顺县| 班玛县| 耿马| 光山县| 洪洞县| 镇平县| 韶关市| 兴宁市| 铜山县| 平定县| 乌兰浩特市| 申扎县| 日照市| 乡城县| 海门市| 汪清县| 林甸县|