11月份的萬(wàn)物互聯(lián)專欄討論了為可隨時(shí)隨地在線操作這樣一個(gè)時(shí)代重新思考相機(jī)的必要性。我們也有必要重新考慮這些相機(jī)“看”的方式。
如今,計(jì)算機(jī)視覺(jué)可以像大多數(shù)人所能做的那樣準(zhǔn)確地跟蹤汽車、人臉和生產(chǎn)過(guò)程。當(dāng)需要篩選大量數(shù)據(jù)時(shí),計(jì)算機(jī)視覺(jué)模型比人做得更好。
但也存在局限性。要認(rèn)出一個(gè)人或一個(gè)動(dòng)作,計(jì)算機(jī)仍比人需要更多的時(shí)間。它們無(wú)法跟隨多個(gè)攝像機(jī)之間的人或物體。它們很容易被騙。它們無(wú)法為它們所看到的內(nèi)容賦予含義。工程師們必須克服這些限制,才能使相機(jī)在制造業(yè)和智慧城市中更有用。
今天的相機(jī)通??梢詧?zhí)行推斷(使用算法來(lái)將輸入的圖像與一個(gè)預(yù)定義的模型進(jìn)行匹配)。速度為每秒30幀左右,具體取決于這些計(jì)算機(jī)視覺(jué)算法的復(fù)雜性。
所有的推斷算法基本上都要在成本、速度、內(nèi)存和準(zhǔn)確性這幾個(gè)變量之間進(jìn)行權(quán)衡。可以快速推斷出某個(gè)東西是什么的相機(jī)可能就要以犧牲準(zhǔn)確性為代價(jià),或者可能需要更多內(nèi)存而導(dǎo)致更高的設(shè)備成本。
每秒30幀的速度對(duì)于在音樂(lè)會(huì)人群中找到一張面孔來(lái)說(shuō)是可以的。不過(guò),Xnor.ai公司的運(yùn)營(yíng)總監(jiān)Sophie Lebrecht表示,當(dāng)涉及到更復(fù)雜的計(jì)算機(jī)視覺(jué)任務(wù)(如確定制造過(guò)程中的錯(cuò)誤)時(shí),計(jì)算機(jī)需要提高處理能力,否則就可能需要使生產(chǎn)線減速。Xnor.ai是一家研發(fā)軟件來(lái)提高計(jì)算機(jī)視覺(jué)能力的公司,其目標(biāo)是以每秒60幀的速度進(jìn)行圖像跟蹤。
加快計(jì)算機(jī)處理圖像的幀速率只是第一步。接下來(lái)是構(gòu)建可以跟蹤網(wǎng)絡(luò)中的多個(gè)攝像機(jī)之間的對(duì)象的軟件。例如,在一個(gè)監(jiān)控?cái)z像機(jī)上找到一個(gè)人,將能讓網(wǎng)絡(luò)在這個(gè)人走在其他攝像機(jī)前面時(shí)自動(dòng)實(shí)時(shí)地跟蹤他。
為此,我們需要針對(duì)復(fù)雜模型的快速圖像處理能力,以及在相機(jī)網(wǎng)絡(luò)上運(yùn)行并可以挑出圖像的軟件。我們的目標(biāo)是找到一種可以在單個(gè)網(wǎng)絡(luò)上執(zhí)行此操作而無(wú)需將數(shù)據(jù)發(fā)送到云中的方法。這將需要一種算法來(lái)識(shí)別人,并需要另一種算法來(lái)在物理空間中跟蹤那個(gè)人。它可能還需要疊加在相機(jī)上或新的通信協(xié)議上的某種軟件。
相機(jī)還需要避免“對(duì)抗性攻擊”,這是一個(gè)全新的研究領(lǐng)域。就像人可能被視錯(cuò)覺(jué)所迷惑一樣,計(jì)算機(jī)的視覺(jué)也可能被各種會(huì)使正常的圖像失真的技巧所欺騙,導(dǎo)致程序識(shí)別出圖像上并不存在的東西。
也許最困難的任務(wù)是創(chuàng)造出能讓計(jì)算機(jī)將含義賦予它們所看到的內(nèi)容的軟件。識(shí)別出一個(gè)人正在爬行是一回事;相機(jī)推斷出在地板上爬行的那個(gè)人需要幫助或試圖避過(guò)探測(cè)是另外一回事。
到那時(shí),相機(jī)及其軟件將需要決定下一步該做什么。我們還有很長(zhǎng)一段路要走,但是Alphabet公司的研究人員已經(jīng)在試圖教會(huì)計(jì)算機(jī)視覺(jué)算法找出含義方面做了令人印象深刻的工作。在將來(lái)的某一天,計(jì)算機(jī)可能會(huì)比我們對(duì)圖像的內(nèi)容理解得更好,并且會(huì)利用它們所看到的來(lái)做對(duì)我們有益的事情。
-
物聯(lián)網(wǎng)
+關(guān)注
關(guān)注
2950文章
48156瀏覽量
418890 -
計(jì)算機(jī)視覺(jué)
+關(guān)注
關(guān)注
9文章
1716瀏覽量
47736
原文標(biāo)題:物聯(lián)網(wǎng)相機(jī)需要既快又聰明,且能夠理解圖像含義
文章出處:【微信號(hào):IEEE_China,微信公眾號(hào):IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
機(jī)器視覺(jué)必備:圖像采集卡基礎(chǔ)知識(shí)與行業(yè)應(yīng)用
計(jì)算機(jī)專業(yè)408考研科目
PCBA生產(chǎn)過(guò)程的四個(gè)主要環(huán)節(jié)?
【上海晶珩睿莓 1 單板計(jì)算機(jī)】人臉識(shí)別
上海計(jì)算機(jī)視覺(jué)企業(yè)行學(xué)術(shù)沙龍走進(jìn)西井科技
請(qǐng)問(wèn)C語(yǔ)言開發(fā)單片機(jī)為什么大多數(shù)都采用全局變量的形式?
工控機(jī)與普通計(jì)算機(jī)的核心差異解析
谷東智能推出首款戶外探索專用全彩AR眼鏡C3000H
【作品合集】賽昉科技VisionFive 2單板計(jì)算機(jī)開發(fā)板測(cè)評(píng)
易控智駕榮獲計(jì)算機(jī)視覺(jué)頂會(huì)CVPR 2025認(rèn)可
工業(yè)計(jì)算機(jī)的重要性
自動(dòng)化計(jì)算機(jī)的功能與用途
工業(yè)計(jì)算機(jī)與商用計(jì)算機(jī)的區(qū)別有哪些
計(jì)算機(jī)視覺(jué)可以像大多數(shù)人所能做的那樣準(zhǔn)確地跟蹤汽車、人臉和生產(chǎn)過(guò)程
評(píng)論