日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

多倫多大學(xué)&NVIDIA最新成果 圖像標(biāo)注速度提升10倍

ml8z_IV_Technol ? 來(lái)源:fqj ? 2019-05-05 09:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

圖像標(biāo)注速度提升10倍!

這是多倫多大學(xué)與英偉達(dá)聯(lián)合公布的一項(xiàng)最新研究:Curve-GCN的應(yīng)用結(jié)果。

Curve-GCN是一種高效交互式圖像標(biāo)注方法,其性能優(yōu)于Polygon-RNN++。在自動(dòng)模式下運(yùn)行時(shí)間為29.3ms,在交互模式下運(yùn)行時(shí)間為2.6ms,比Polygon-RNN ++分別快10倍和100倍。

數(shù)據(jù)標(biāo)注是人工智能產(chǎn)業(yè)的基礎(chǔ),在機(jī)器的世界里,圖像與語(yǔ)音、視頻等一樣,是數(shù)據(jù)的一個(gè)種類(lèi)。

對(duì)象實(shí)例分割是在圖像中概括給定類(lèi)的所有對(duì)象的問(wèn)題,這一任務(wù)在過(guò)去幾年受到了越來(lái)越多的關(guān)注,傳統(tǒng)標(biāo)記工具通常需要人工先在圖片上點(diǎn)擊光標(biāo)描記物體邊緣來(lái)進(jìn)行標(biāo)記。

然而,手動(dòng)跟蹤對(duì)象邊界是一個(gè)費(fèi)力的過(guò)程,每個(gè)對(duì)象大概需要30-60秒的時(shí)間。

為了緩解這個(gè)問(wèn)題,已經(jīng)提出了許多交互式圖像分割技術(shù),其通過(guò)重要因素加速注釋。但是交互式分割方法大多是逐像素的(比如DEXTR),在顏色均勻的區(qū)域很難控制,所以最壞的情況下仍然需要很多點(diǎn)擊。

Polygon-RNN將humans-in-the-loop(人機(jī)回圈)過(guò)程進(jìn)行構(gòu)架,在此過(guò)程中模型按順序預(yù)測(cè)多邊形的頂點(diǎn)。通過(guò)糾正錯(cuò)誤的頂點(diǎn),注釋器可以在發(fā)生錯(cuò)誤時(shí)進(jìn)行干預(yù)。該模型通過(guò)調(diào)整校正來(lái)繼續(xù)其預(yù)測(cè)。 Polygon-RNN顯示在人類(lèi)協(xié)議水平上產(chǎn)生注釋?zhuān)總€(gè)對(duì)象實(shí)例只需點(diǎn)擊幾下。這里最糟糕的情況是多邊形頂點(diǎn)的數(shù)量,大多數(shù)對(duì)象的范圍最多為30-40個(gè)點(diǎn)。

然而,模型的重復(fù)性將可擴(kuò)展性限制為更復(fù)雜的形狀,導(dǎo)致更難的訓(xùn)練和更長(zhǎng)的推理。此外,期望注釋器按順序糾正錯(cuò)誤,這在實(shí)踐中通常是具有挑戰(zhàn)性的。

最新研究成果中,研究人員將對(duì)象注釋框架化為回歸問(wèn)題,其中所有頂點(diǎn)的位置被同時(shí)預(yù)測(cè)。

在Curve-GCN中,注釋器會(huì)選擇一個(gè)對(duì)象,然后選擇多邊形或樣條輪廓。

Curve-GCN自動(dòng)地勾勒出對(duì)象的輪廓

Curve-GCN允許交互式更正,并且可以自動(dòng)重新預(yù)測(cè)多邊形/樣條

與Polygon-RNN + +相比:

Curve-GCN具有多邊形或樣條曲線參數(shù)

Curve-GCN可同時(shí)預(yù)測(cè)控制點(diǎn)(更快)

初始化預(yù)測(cè)

人工校正

模型校正

模型是在CityScapes數(shù)據(jù)集上訓(xùn)練的

自動(dòng)模式下的比較。從左到右:ground-truth, Polygon-GCN, Spline-GCN, ps - deeplab

跨域自動(dòng)模式。(上)cityscaps訓(xùn)練模型的開(kāi)箱即用輸出,(下)使用來(lái)自新領(lǐng)域的10%的數(shù)據(jù)進(jìn)行微調(diào)。

多倫多大學(xué)&NVIDIA最新成果 圖像標(biāo)注速度提升10倍

多倫多大學(xué)&NVIDIA最新成果 圖像標(biāo)注速度提升10倍

將Polygon和Spline-GCN與Polygon-RNN ++和PSP-DeepLab進(jìn)行比較

模型在最先進(jìn)的基礎(chǔ)上進(jìn)行了改進(jìn),速度顯著加快,允許只具有局部效果的交互式更正,從而為注釋器提供了更多的控制。這將導(dǎo)致更好的整體注釋策略。

論文摘要

通過(guò)邊界跟蹤來(lái)手動(dòng)標(biāo)記對(duì)象是一個(gè)繁重的過(guò)程。在Polygon-RNN ++中,作者提出了Polygon-RNN,它使用CNN-RNN架構(gòu)以循環(huán)方式產(chǎn)生多邊形注釋?zhuān)试S通過(guò)humans-in-the-loop(人機(jī)回圈)的方式進(jìn)行交互式校正。

我們提出了一個(gè)新的框架,通過(guò)使用圖形卷積網(wǎng)絡(luò)(GCN)同時(shí)預(yù)測(cè)所有頂點(diǎn),減輕了Polygon-RNN的時(shí)序性。我們的模型是端到端訓(xùn)練的。它支持多邊形或樣條對(duì)對(duì)象進(jìn)行標(biāo)注,從而提高了基于線和曲線對(duì)象的標(biāo)注效率。結(jié)果表明,在自動(dòng)模式下,Curve-GCN的性能優(yōu)于現(xiàn)有的所有方法,包括功能強(qiáng)大的PSP-DeepLab,并且在交互模式下,Curve-GCN的效率明顯高于Polygon-RNN++。我們的模型在自動(dòng)模式下運(yùn)行29.3ms,在交互模式下運(yùn)行2.6ms,比Polygon-RNN ++分別快10倍和100倍。

多倫多大學(xué)&NVIDIA最新成果 圖像標(biāo)注速度提升10倍

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7349

    瀏覽量

    95058
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50367

    瀏覽量

    267060
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4116

    瀏覽量

    99662

原文標(biāo)題:多倫多大學(xué)&NVIDIA最新成果:圖像標(biāo)注速度提升10倍!

文章出處:【微信號(hào):IV_Technology,微信公眾號(hào):智車(chē)科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    BlackBerry QNX與NVIDIA深化合作

    BlackBerry有限公司(紐約證券交易所代碼:BB;多倫多證券交易所代碼:BB)旗下業(yè)務(wù)部門(mén)QNX 今日宣布,進(jìn)一步擴(kuò)大與NVIDIA的合作,助力開(kāi)發(fā)者基于NVIDIA IGX Thor 平臺(tái)
    的頭像 發(fā)表于 04-23 11:23 ?422次閱讀

    NVIDIA推出Vera CPU以顯著提升系統(tǒng)性能與能效

    NVIDIA 今日發(fā)布 NVIDIA Vera CPU,這是全球首款專(zhuān)為代理式 AI 與強(qiáng)化學(xué)習(xí)時(shí)代打造的處理器,其效率是傳統(tǒng)機(jī)架級(jí) CPU 的 2 ,速度
    的頭像 發(fā)表于 03-18 14:33 ?1896次閱讀

    ADI攜最新成果亮相NVIDIA GTC 2026

    NVIDIA GTC 2026大會(huì)于3月16日重返圣何塞舉辦,ADI攜最新成果參展,呈現(xiàn)物理智能為機(jī)器人領(lǐng)域帶來(lái)的革新。
    的頭像 發(fā)表于 03-18 11:48 ?751次閱讀

    北大團(tuán)隊(duì)最新研究:AI芯片算力提升數(shù)倍,能效提升超90

    首次實(shí)現(xiàn)后摩爾新器件異質(zhì)集成的多物理域融合傅里葉變換系統(tǒng)。 ? 這一全新計(jì)算架構(gòu)將傅里葉變換計(jì)算速度從當(dāng)前每秒約1300億次提升至每秒約5000億次,算力提升近4,能效
    的頭像 發(fā)表于 01-15 09:31 ?2279次閱讀

    算法工程師不愿做標(biāo)注工作,怎么辦?

    對(duì)于算法而言,圖像標(biāo)注是一項(xiàng)關(guān)鍵性工作,越是大量的新數(shù)據(jù)集標(biāo)注,對(duì)于算法的性能提升越有幫助。但是圖像標(biāo)注
    的頭像 發(fā)表于 12-02 17:56 ?717次閱讀
    算法工程師不愿做<b class='flag-5'>標(biāo)注</b>工作,怎么辦?

    NVIDIA Jetson AGX Thor Developer Kit開(kāi)發(fā)環(huán)境配置指南

    NVIDIA Jetson AGX Thor 專(zhuān)為物理 AI 打造,與上一代產(chǎn)品 NVIDIA Jetson AGX Orin 相比,生成式 AI 性能最高提升至 5 。通過(guò)發(fā)布后的
    的頭像 發(fā)表于 11-08 09:55 ?7717次閱讀
    <b class='flag-5'>NVIDIA</b> Jetson AGX Thor Developer Kit開(kāi)發(fā)環(huán)境配置指南

    新技術(shù)可提升紫外線傳感器響應(yīng)速度

    研究示意圖 澳大利亞麥考瑞大學(xué)科學(xué)家開(kāi)發(fā)了一項(xiàng)新技術(shù),將紫外線傳感器的響應(yīng)速度提高了128000。該成果有望催生更高效、更靈活的可穿戴設(shè)備。相關(guān)論文發(fā)表于新一期《Small》雜志。
    的頭像 發(fā)表于 11-07 09:13 ?423次閱讀
    新技術(shù)可<b class='flag-5'>提升</b>紫外線傳感器響應(yīng)<b class='flag-5'>速度</b>

    淺析多模態(tài)標(biāo)注對(duì)大模型應(yīng)用落地的重要性與標(biāo)注實(shí)例

    ”的關(guān)鍵工序——多模態(tài)標(biāo)注重要性日益凸顯。 一、什么是多模態(tài)標(biāo)注? 多模態(tài)標(biāo)注是指對(duì)文本、圖像、語(yǔ)音、視頻、點(diǎn)云等異構(gòu)數(shù)據(jù)進(jìn)行跨模態(tài)語(yǔ)義關(guān)聯(lián)的標(biāo)注
    的頭像 發(fā)表于 09-05 13:49 ?2833次閱讀

    小語(yǔ)種OCR標(biāo)注效率提升10+:PaddleOCR+ERNIE 4.5自動(dòng)標(biāo)注實(shí)戰(zhàn)解析

    摘要 :小語(yǔ)種OCR研發(fā)的核心瓶頸在于高質(zhì)量標(biāo)注數(shù)據(jù)的稀缺與高昂成本。本文介紹一種創(chuàng)新的自動(dòng)化標(biāo)注方案,利用 PaddleOCR 進(jìn)行文本檢測(cè)與裁剪,并調(diào)用 ERNIE 4.5 大模型進(jìn)行雙重預(yù)測(cè)
    的頭像 發(fā)表于 08-29 11:26 ?3890次閱讀
    小語(yǔ)種OCR<b class='flag-5'>標(biāo)注</b>效率<b class='flag-5'>提升</b><b class='flag-5'>10</b>+<b class='flag-5'>倍</b>:PaddleOCR+ERNIE 4.5自動(dòng)<b class='flag-5'>標(biāo)注</b>實(shí)戰(zhàn)解析

    自動(dòng)駕駛數(shù)據(jù)標(biāo)注主要是標(biāo)注什么?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在自動(dòng)駕駛系統(tǒng)的研發(fā)過(guò)程中,數(shù)據(jù)標(biāo)注是實(shí)現(xiàn)高性能感知模型的基礎(chǔ)環(huán)節(jié),其核心目標(biāo)是將車(chē)輛從環(huán)境中采集到的原始感知數(shù)據(jù)(主要包括圖像、點(diǎn)云、視頻序列等)轉(zhuǎn)化為具有語(yǔ)義信息
    的頭像 發(fā)表于 07-30 11:54 ?1686次閱讀
    自動(dòng)駕駛數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>主要是<b class='flag-5'>標(biāo)注</b>什么?

    NVIDIA展示機(jī)器人領(lǐng)域的研究成果

    在今年的機(jī)器人科學(xué)與系統(tǒng)會(huì)議 (RSS) 上,NVIDIA 研究中心展示了一系列推動(dòng)機(jī)器人學(xué)習(xí)的研究成果,展示了在仿真、現(xiàn)實(shí)世界遷移和決策制定領(lǐng)域的突破。
    的頭像 發(fā)表于 07-23 10:43 ?1679次閱讀

    什么是自動(dòng)駕駛數(shù)據(jù)標(biāo)注?如何好做數(shù)據(jù)標(biāo)注

    、精準(zhǔn)且高效的數(shù)據(jù)標(biāo)注流程顯得尤為關(guān)鍵。那什么是數(shù)據(jù)標(biāo)注?如何做數(shù)據(jù)標(biāo)注? 自動(dòng)駕駛數(shù)據(jù)標(biāo)注是指在自動(dòng)駕駛系統(tǒng)所采集的感知數(shù)據(jù)(如攝像頭圖像
    的頭像 發(fā)表于 07-09 09:19 ?1715次閱讀
    什么是自動(dòng)駕駛數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>?如何好做數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>?

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場(chǎng)景中的性能紀(jì)錄

    前將 67 token / 秒 (TPS) 的速度提升至 253 TPS(提速 3.7 ),而目前這一速度已達(dá) 368 TPS(提速 5.5
    的頭像 發(fā)表于 07-02 19:31 ?3631次閱讀
    <b class='flag-5'>NVIDIA</b> Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場(chǎng)景中的性能紀(jì)錄

    NVIDIA在ICRA 2025展示多項(xiàng)最新研究成果

    在亞特蘭大舉行的國(guó)際機(jī)器人與自動(dòng)化大會(huì) (ICRA) 上,NVIDIA 展示了其在生成式 AI、仿真和自主操控領(lǐng)域的多項(xiàng)研究成果
    的頭像 發(fā)表于 06-06 14:56 ?1605次閱讀

    AI時(shí)代 圖像標(biāo)注不要沒(méi)苦硬吃

    識(shí)別算法的性能提升依靠大量的圖像標(biāo)注,傳統(tǒng)模式下,需要人工對(duì)同類(lèi)型數(shù)據(jù)集進(jìn)行一步步手動(dòng)拉框,這個(gè)過(guò)程的痛苦只有做過(guò)的人才知道。越多素材的數(shù)據(jù)集對(duì)于算法的提升越有幫助,常規(guī)情況下,一個(gè)2
    的頭像 發(fā)表于 05-20 17:54 ?654次閱讀
    AI時(shí)代   <b class='flag-5'>圖像</b><b class='flag-5'>標(biāo)注</b>不要沒(méi)苦硬吃
    孝感市| 叙永县| 建始县| 清丰县| 新余市| 库车县| 奉贤区| 宁夏| 绍兴市| 白水县| 儋州市| 阳江市| 平原县| 延长县| 车致| 惠水县| 临江市| 营山县| 墨江| 台山市| 海林市| 会宁县| 绍兴县| 弥渡县| 鄯善县| 花莲市| 乌恰县| 莒南县| 丰顺县| 分宜县| 灌云县| 朝阳县| 理塘县| 广汉市| 黄陵县| 峨边| 安阳县| 邵阳县| 遵义市| 安国市| 河东区|