日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖像標(biāo)注的種類,應(yīng)用場景,以及各種標(biāo)注的優(yōu)缺點

新機(jī)器視覺 ? 來源:AI公園 ? 作者:AI公園 ? 2020-12-28 14:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)讀

本文從五個需要進(jìn)行標(biāo)注的計算機(jī)視覺任務(wù)(物體檢測、線/邊緣檢測、分割、姿態(tài)預(yù)測、圖像分類)給大家介紹圖像標(biāo)注的種類,應(yīng)用場景,以及各種標(biāo)注的優(yōu)缺點。

介紹

“如果沒有數(shù)據(jù)分析,公司就會變得既盲又聾,就像高速公路上的鹿一樣在網(wǎng)絡(luò)上游蕩?!?/p>

— Geoffrey Moore

每個數(shù)據(jù)科學(xué)任務(wù)都需要數(shù)據(jù)。具體地說,是輸入系統(tǒng)的干凈易懂的數(shù)據(jù)。說到圖像,計算機(jī)需要看到人類眼睛看到的東西。

例如,人類有識別和分類物體的能力。同樣,我們可以使用計算機(jī)視覺來解釋它接收到的視覺數(shù)據(jù)。這就是圖像標(biāo)注的作用。

圖像標(biāo)注在計算機(jī)視覺中起著至關(guān)重要的作用。圖像標(biāo)注的目標(biāo)是為和任務(wù)相關(guān)的、特定于任務(wù)的標(biāo)簽。這可能包括基于文本的標(biāo)簽(類),繪制在圖像上的標(biāo)簽(即邊框),甚至是像素級的標(biāo)簽。我們將在下面探討這一系列不同的標(biāo)注技術(shù)。

人工智能需要的人工干預(yù)比我們想象的要多。為了準(zhǔn)備高精度的訓(xùn)練數(shù)據(jù),我們必須對圖像進(jìn)行標(biāo)注以得到正確的結(jié)果。數(shù)據(jù)注釋通常需要較高水平的領(lǐng)域知識,只有來自特定領(lǐng)域的專家才能提供這些知識。

需要標(biāo)注的計算機(jī)視覺任務(wù):

物體檢測

線/邊緣檢測

分割

姿態(tài)預(yù)測/關(guān)鍵點識別

圖像分類

1) 目標(biāo)檢測

進(jìn)行目標(biāo)檢測的技術(shù)主要有兩種,即2D和3D包圍框。

對于多邊形物體,可以使用多邊形方法。讓我們詳細(xì)討論一下。

2D 包圍框

在這種方法中,只需要在被檢測的物體周圍繪制矩形框。它們用于定義對象在圖像中的位置。邊框可以由矩形左上角的x、y軸坐標(biāo)和右下角的x、y軸坐標(biāo)來確定。

優(yōu)點和缺點:

標(biāo)注起來快速和容易。

不能提供重要的信息,如物體的方向,這對許多應(yīng)用來說是至關(guān)重要的。

包括不屬于物體一部分的背景像素。這可能會影響訓(xùn)練。

3D 包圍框或者立方體

類似于2D邊框,除了它們還可以顯示目標(biāo)的深度。這種標(biāo)注是通過將二維圖像平面上的邊界框向后投影到三維長方體來實現(xiàn)的。它允許系統(tǒng)區(qū)分三維空間中的體積和位置等特征。

優(yōu)點和缺點:

解決了物體方向的問題。

當(dāng)物體被遮擋,這種標(biāo)注可以想象包圍框的維度,這可能會影響訓(xùn)練。

這種標(biāo)注也會包括背景像素,可能會影響訓(xùn)練。

多邊形

有時,必須標(biāo)記形狀不規(guī)則的物體。在這種情況下,使用多邊形。注釋時只需標(biāo)記物體的邊緣,我們就能得到要檢測的物體的完美輪廓。

優(yōu)點和缺點:

多邊形標(biāo)記的主要優(yōu)點是它消除了背景像素,并捕獲了物體的精確尺寸。

非常耗時,如果物體的形狀是復(fù)雜的,很難標(biāo)注。

注:多邊形方法也用于物體形狀的分割。我們將在下面討論分割。

數(shù)據(jù)采集是ML冷啟動的問題。但是,即使你有了一個可行的數(shù)據(jù)集,構(gòu)建和測試模型也是需要技巧的。

2) 線/邊緣檢測(線和樣條)

在劃分邊界時,線和樣條是有用的。將區(qū)分一個區(qū)域和另一個區(qū)域的像素進(jìn)行標(biāo)注。

優(yōu)點和缺點:

這種方法的優(yōu)點是,連線上的像素不需要都是連續(xù)的。這樣在檢測有中斷的線或部分遮擋的物體是非常有用的。

手動標(biāo)注圖像中的線是非常累人和費時的,特別是圖像中有很多的線的時候。

當(dāng)物體碰巧是對齊的時候,可能會給出誤導(dǎo)的結(jié)果。

3) 姿態(tài)預(yù)測 / 關(guān)鍵點識別

在許多計算機(jī)視覺應(yīng)用中,神經(jīng)網(wǎng)絡(luò)常常需要識別輸入圖像中重要的感興趣的點。我們把這些點稱為地標(biāo)或關(guān)鍵點。在這種應(yīng)用中,我們希望神經(jīng)網(wǎng)絡(luò)輸出關(guān)鍵點的坐標(biāo)(x, y)。

4) 分割

圖像分割是將一幅圖像分割為多個部分的過程。圖像分割通常用于在像素級定位圖像中的物體和邊界。圖像分割方法有很多種。

語義分割: 語義分割是一項機(jī)器學(xué)習(xí)任務(wù),它需要像素級標(biāo)注,其中圖像中的每個像素都被分配給一個類。每個像素都帶有語義意義。這主要用于環(huán)境背景非常重要的情況。

實例分割: 實例分割是圖像分割的一種子類型,它在像素級別上標(biāo)識圖像中每個物體的每個實例。實例分割和語義分割是圖像分割的兩種粒度級別之一。

全景分割: 全景分割結(jié)合了語義分割和實例分割,所有像素都被分配一個類標(biāo)簽,所有目標(biāo)實例都被唯一地分割。

5) 圖像分類

圖像分類不同于目標(biāo)檢測。目標(biāo)檢測的目的是識別和定位目標(biāo),而圖像分類的目的是識別和識別特定的目標(biāo)類。這個用例的一個常見示例是對貓和狗的圖片進(jìn)行分類。標(biāo)注者必須為一只狗的圖像分配一個類標(biāo)簽“dog”,對貓的圖像分配類標(biāo)簽“cat”。

圖像標(biāo)注的用例

在本節(jié)中,我們將討論如何使用圖像標(biāo)注來幫助機(jī)器模型執(zhí)行特定行業(yè)的任務(wù):

零售:2D邊框可以用于標(biāo)注產(chǎn)品的圖像,然后機(jī)器學(xué)習(xí)算法可以使用這些圖像來預(yù)測成本和其他屬性。圖像分類在這方面也有幫助。

醫(yī)學(xué):多邊形可用于在醫(yī)用x射線中標(biāo)記器官,以便將它們輸入深度學(xué)習(xí)模型,以訓(xùn)練x射線中的畸形或缺陷。這是圖像標(biāo)注最重要的應(yīng)用之一,需要醫(yī)學(xué)專家具有較高的領(lǐng)域知識。

自動駕駛汽車:這是另一個重要的領(lǐng)域,圖像標(biāo)注可以應(yīng)用。利用語義分割對圖像中的每個像素進(jìn)行標(biāo)記,使車輛能夠感知到道路上的障礙物。這一領(lǐng)域的研究仍在進(jìn)行中。

情緒檢測:這是里程碑,可以用來檢測一個人的情緒(高興,悲傷,或自然)。這可以應(yīng)用于評估受試者對特定內(nèi)容的情緒反應(yīng)。

制造行業(yè):線和樣條可用于標(biāo)注工廠的圖像線跟隨機(jī)器人工作。這可以幫助自動化生產(chǎn)過程,人力勞動可以最小化。

圖像標(biāo)注的一些挑戰(zhàn)

時間復(fù)雜度:手工標(biāo)注圖像需要很多時間,機(jī)器學(xué)習(xí)需要大量的數(shù)據(jù)集,需要大量的時間來有效地標(biāo)注這些基于圖像的數(shù)據(jù)集。

計算復(fù)雜度:機(jī)器學(xué)習(xí)需要精確標(biāo)注的數(shù)據(jù)來運行模型。如果標(biāo)注者在給圖像做標(biāo)注的時候,注入任何一種錯誤,都可能會影響到訓(xùn)練,所有的努力都可能付諸東流。

領(lǐng)域知識:如前所述,圖像標(biāo)注通常需要特定領(lǐng)域的高級領(lǐng)域知識。因此,我們需要知道該標(biāo)注什么的注解者,以及該領(lǐng)域的專家。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42448
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50367

    瀏覽量

    267070
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1523

    瀏覽量

    36374

原文標(biāo)題:圖像標(biāo)注的基礎(chǔ)內(nèi)容介紹

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    自動駕駛占用網(wǎng)絡(luò)還需要數(shù)據(jù)標(biāo)注嗎?

    能夠通過空間體素化的方式來感知世界,甚至可以識別那些從未見過的異形障礙物,那它是不是不再需要傳統(tǒng)意義上的數(shù)據(jù)標(biāo)注了?事實上,占據(jù)網(wǎng)絡(luò)不僅沒有取消標(biāo)注,反而將標(biāo)注的維度和難度推向了一個新的高度。 ? 為什么占據(jù)網(wǎng)絡(luò)變得如此重要?
    的頭像 發(fā)表于 04-17 08:53 ?424次閱讀
    自動駕駛占用網(wǎng)絡(luò)還需要數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>嗎?

    大模型時代自動駕駛標(biāo)注有什么特殊要求?

    的端到端架構(gòu)和占用網(wǎng)絡(luò),標(biāo)注工作已經(jīng)從平面的像素點位,跨越到了四維時空的深度重建。 空間的立體化與時間的連貫性挑戰(zhàn) 自動駕駛標(biāo)注的難點在于從二維圖像向三維向量空間的躍遷。早期的算法
    的頭像 發(fā)表于 03-01 09:09 ?3202次閱讀
    大模型時代自動駕駛<b class='flag-5'>標(biāo)注</b>有什么特殊要求?

    全自動化驅(qū)動 ADAS 高精度標(biāo)注:aiData Auto Annotator 深度解析

    引言在ADAS(高級輔助駕駛)開發(fā)領(lǐng)域,高質(zhì)量的標(biāo)注數(shù)據(jù)是算法迭代的核心基礎(chǔ)。然而,傳統(tǒng)依賴人工標(biāo)注的模式通常成本高昂、周期漫長,每年投入可達(dá)數(shù)百萬美元,處理時間往往需要數(shù)月,嚴(yán)重制約了研發(fā)效率與項目推進(jìn)速度。這正是康謀為您帶來的aiDataAu
    的頭像 發(fā)表于 01-09 17:33 ?348次閱讀
    全自動化驅(qū)動 ADAS 高精度<b class='flag-5'>標(biāo)注</b>:aiData Auto Annotator 深度解析

    自動駕駛數(shù)據(jù)標(biāo)注是所有信息都要標(biāo)注嗎?

    [首發(fā)于智駕最前沿微信公眾號]數(shù)據(jù)標(biāo)注對于自動駕駛來說,就像是老師教小朋友知識,數(shù)據(jù)標(biāo)注可以讓車輛學(xué)習(xí)辨別道路交通信息的能力。攝像頭、雷達(dá)、激光雷達(dá)(LiDAR)拍下來的只是一堆原始信號,這些信號
    的頭像 發(fā)表于 12-04 09:05 ?1231次閱讀
    自動駕駛數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>是所有信息都要<b class='flag-5'>標(biāo)注</b>嗎?

    算法工程師不愿做標(biāo)注工作,怎么辦?

    對于算法而言,圖像標(biāo)注是一項關(guān)鍵性工作,越是大量的新數(shù)據(jù)集標(biāo)注,對于算法的性能提升越有幫助。但是圖像標(biāo)注是一項極其費時費力的工作,特別是遇到
    的頭像 發(fā)表于 12-02 17:56 ?718次閱讀
    算法工程師不愿做<b class='flag-5'>標(biāo)注</b>工作,怎么辦?

    淺析多模態(tài)標(biāo)注對大模型應(yīng)用落地的重要性與標(biāo)注實例

    ”的關(guān)鍵工序——多模態(tài)標(biāo)注重要性日益凸顯。 一、什么是多模態(tài)標(biāo)注? 多模態(tài)標(biāo)注是指對文本、圖像、語音、視頻、點云等異構(gòu)數(shù)據(jù)進(jìn)行跨模態(tài)語義關(guān)聯(lián)的標(biāo)注
    的頭像 發(fā)表于 09-05 13:49 ?2833次閱讀

    小語種OCR標(biāo)注效率提升10+倍:PaddleOCR+ERNIE 4.5自動標(biāo)注實戰(zhàn)解析

    摘要 :小語種OCR研發(fā)的核心瓶頸在于高質(zhì)量標(biāo)注數(shù)據(jù)的稀缺與高昂成本。本文介紹一種創(chuàng)新的自動化標(biāo)注方案,利用 PaddleOCR 進(jìn)行文本檢測與裁剪,并調(diào)用 ERNIE 4.5 大模型進(jìn)行雙重預(yù)測
    的頭像 發(fā)表于 08-29 11:26 ?3891次閱讀
    小語種OCR<b class='flag-5'>標(biāo)注</b>效率提升10+倍:PaddleOCR+ERNIE 4.5自動<b class='flag-5'>標(biāo)注</b>實戰(zhàn)解析

    請問AICube所需的目標(biāo)檢測數(shù)據(jù)集標(biāo)注可以使用什么工具?

    請問AICube所需的目標(biāo)檢測數(shù)據(jù)集標(biāo)注可以使用什么工具? 我使用labelimg進(jìn)行標(biāo)注,標(biāo)注后的數(shù)據(jù)集改好文件名后導(dǎo)入不進(jìn)去。一直卡在數(shù)據(jù)解析界面。 下圖所示,數(shù)據(jù)集文件夾目錄,以及
    發(fā)表于 08-11 08:07

    自動駕駛數(shù)據(jù)標(biāo)注主要是標(biāo)注什么?

    [首發(fā)于智駕最前沿微信公眾號]在自動駕駛系統(tǒng)的研發(fā)過程中,數(shù)據(jù)標(biāo)注是實現(xiàn)高性能感知模型的基礎(chǔ)環(huán)節(jié),其核心目標(biāo)是將車輛從環(huán)境中采集到的原始感知數(shù)據(jù)(主要包括圖像、點云、視頻序列等)轉(zhuǎn)化為具有語義信息
    的頭像 發(fā)表于 07-30 11:54 ?1687次閱讀
    自動駕駛數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>主要是<b class='flag-5'>標(biāo)注</b>什么?

    什么是自動駕駛數(shù)據(jù)標(biāo)注?如何好做數(shù)據(jù)標(biāo)注?

    、精準(zhǔn)且高效的數(shù)據(jù)標(biāo)注流程顯得尤為關(guān)鍵。那什么是數(shù)據(jù)標(biāo)注?如何做數(shù)據(jù)標(biāo)注? 自動駕駛數(shù)據(jù)標(biāo)注是指在自動駕駛系統(tǒng)所采集的感知數(shù)據(jù)(如攝像頭圖像
    的頭像 發(fā)表于 07-09 09:19 ?1717次閱讀
    什么是自動駕駛數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>?如何好做數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>?

    端到端數(shù)據(jù)標(biāo)注方案在自動駕駛領(lǐng)域的應(yīng)用優(yōu)勢

    隨著自動駕駛技術(shù)向L3及以上級別快速發(fā)展,高質(zhì)量訓(xùn)練數(shù)據(jù)的需求呈現(xiàn)指數(shù)級增長。傳統(tǒng)的數(shù)據(jù)標(biāo)注方式面臨著效率低下、成本高昂、一致性差等痛點。據(jù)統(tǒng)計,一輛L4級自動駕駛汽車每天產(chǎn)生的數(shù)據(jù)量高達(dá)
    的頭像 發(fā)表于 06-23 17:27 ?1216次閱讀

    淺析4D-bev標(biāo)注技術(shù)在自動駕駛領(lǐng)域的重要性

    ?自動駕駛技術(shù)的發(fā)展日新月異。從最初簡單的輔助駕駛功能,逐步邁向高度自動化甚至完全自動駕駛的階段。其中,海量且精準(zhǔn)的數(shù)據(jù)是訓(xùn)練高性能自動駕駛模型的基石。4D-BEV(四維鳥瞰視角)標(biāo)注技術(shù)作為環(huán)境
    的頭像 發(fā)表于 06-12 16:10 ?2898次閱讀

    數(shù)據(jù)標(biāo)注與大模型的雙向賦能:效率與性能的躍升

    ??在人工智能蓬勃發(fā)展的時代,大模型憑借其強(qiáng)大的學(xué)習(xí)與泛化能力,已成為眾多領(lǐng)域創(chuàng)新變革的核心驅(qū)動力。而數(shù)據(jù)標(biāo)注作為大模型訓(xùn)練的基石,為大模型性能提升注入關(guān)鍵動力,是模型不可或缺的“養(yǎng)料。大模型則憑借
    的頭像 發(fā)表于 06-04 17:15 ?2270次閱讀
    數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>與大模型的雙向賦能:效率與性能的躍升

    AI時代 圖像標(biāo)注不要沒苦硬吃

    識別算法的性能提升依靠大量的圖像標(biāo)注,傳統(tǒng)模式下,需要人工對同類型數(shù)據(jù)集進(jìn)行一步步手動拉框,這個過程的痛苦只有做過的人才知道。越多素材的數(shù)據(jù)集對于算法的提升越有幫助,常規(guī)情況下,一個20秒時長30幀
    的頭像 發(fā)表于 05-20 17:54 ?654次閱讀
    AI時代   <b class='flag-5'>圖像</b><b class='flag-5'>標(biāo)注</b>不要沒苦硬吃

    東軟集團(tuán)入選國家數(shù)據(jù)局?jǐn)?shù)據(jù)標(biāo)注優(yōu)秀案例

    近日,東軟飛標(biāo)醫(yī)學(xué)影像標(biāo)注平臺在國家數(shù)據(jù)局發(fā)布數(shù)據(jù)標(biāo)注優(yōu)秀案例集名單中排名第一(案例名稱“多模態(tài)醫(yī)學(xué)影像智能數(shù)據(jù)標(biāo)注平臺”)。評選專家認(rèn)為東軟案例取得了顯著成效,一方面,搶占了自主可控的數(shù)據(jù)標(biāo)
    的頭像 發(fā)表于 05-09 14:37 ?1466次閱讀
    家居| 介休市| 多伦县| 吉木乃县| 同德县| 涟源市| 达拉特旗| 天镇县| 乐业县| 安远县| 兰州市| 靖远县| 永泰县| 镇宁| 余干县| 册亨县| 宣化县| 长垣县| 仁化县| 华亭县| 永嘉县| 屯留县| 胶南市| 泗洪县| 民权县| 新乐市| 河北省| 寿阳县| 玉树县| 西贡区| 奉新县| 凉城县| 连平县| 三都| 灌南县| 淳安县| 建德市| 南开区| 米易县| 信阳市| 桐城市|