近期,特斯拉自動駕駛事故被頻頻報道,同時華為“自動駕駛”技術(shù)驚艷亮相,被廣大網(wǎng)友認為其已經(jīng)達到了L4的自動駕駛水平,這使得關(guān)于汽車輔助駕駛系統(tǒng)的討論再度熱鬧了起來。其中最關(guān)鍵的核心就是有關(guān)汽車視覺的感知系統(tǒng)。
事實上,隨著AR+AI時代的到來,AI視覺作為實現(xiàn)工業(yè)自動化和智能化的關(guān)鍵核心技術(shù),正成為人工智能發(fā)展最快的一個分支。當機器可以“看懂這個世界”時,它將如眼睛之于人類的價值一般,不僅會改變我們的出行方式,還將改變我們的娛樂、學(xué)習(xí)等等與生活有關(guān)的一切。
一直以來,亮亮視野都在AR和AI上投入了巨大的精力,在為行業(yè)提供支撐企業(yè)數(shù)字化轉(zhuǎn)型的硬件和平臺的同時,與中科院自動化所建立聯(lián)合實驗室,通過對算法協(xié)同、多模態(tài)任務(wù)、環(huán)境測試等多方面進行綜合研究,努力實現(xiàn)AI多模態(tài)感知融合。近期,其多項研究成果成功入選計算機視覺世界的頂級會議。
“基于結(jié)構(gòu)信息保持的弱監(jiān)督目標定位”
入選CVPR2021
Unveiling the Potential of Structure-Preserving for Weakly Supervised Object Localization. CVPR 2021.
CVPR2021是計算機視覺世界三大頂會之一!本次大會收到來自全球共7015篇有效投稿,最終有1663篇突出重圍被錄取,錄用率僅為23.7%。
本論文研究的是弱監(jiān)督目標定位(WSOL)能力,這是當下仍富有挑戰(zhàn)的計算機視覺任務(wù),雖然現(xiàn)有的工作通過利用空間正則化策略可以明顯提高目標定位精度,但往往忽略了如何從訓(xùn)練好的分類網(wǎng)絡(luò)中提取目標結(jié)構(gòu)信息,使得性能和效率還有大幅提高的空間。
本次研究提出了一種兩階段的方法“結(jié)構(gòu)保持激活(SPA)”,以充分利用WSOL卷積特征中包含的結(jié)構(gòu)信息。在包括CUB-200-2011和ILSVRC在內(nèi)的兩個公開基準上進行的大量實驗表明,與基準方法相比,本文提出的SPA方法取得了顯著的性能提升。
分析并提醒行進中存在的警示和風(fēng)險
而這種提升就可以在汽車駕駛時,對感知系統(tǒng)下的更多物體實現(xiàn)更為精準的檢測與判定,降低事故發(fā)生率。
“SiamCPN:基于孿生中心預(yù)測網(wǎng)絡(luò)的視覺跟蹤”
入選CVM 2021
SiamCPN: Visual tracking with the Siamese center-prediction network. CVM 2021.
CVM是亞洲圖形學(xué)學(xué)會(ASIA Graphics Association)旗下的三大系列會議之一,由清華大學(xué)圖形學(xué)實驗室于2012年在北京創(chuàng)辦,發(fā)展至今,已經(jīng)在國際上形成較大影響力。此次入選CVM2021的論文也同步入選SCI索引源。
本論文主要針對的是目標跟蹤問題,通過一種anchor-free的孿生網(wǎng)絡(luò)SiamCPN,給定初始幀中的參考追蹤對象,可直接預(yù)測后續(xù)幀中對象的中心點和大小。相比其它先進的孿生網(wǎng)絡(luò)算法,該方法GOT-10K、UAV123數(shù)據(jù)集上取得了更好的結(jié)果,推理速度也有1.5-2.0倍的提升。
這一成果可應(yīng)用于互動游戲之中,可以讓虛擬的場景與現(xiàn)實自然融合,讓虛擬創(chuàng)造的NPC更真實的與玩家互動,從而讓玩家獲得更具沉浸感的增強現(xiàn)實游戲體驗。
讓虛擬NPC始終坐在人物肩膀上
其實不止于這些場景,這兩項科研成果還可以應(yīng)用于更多領(lǐng)域。目前,亮亮視野正將這些技術(shù)帶到工業(yè)巡檢領(lǐng)域,從而促進技術(shù)快速成熟,更快更好的服務(wù)國民用戶的普通生活之中。
例如,“基于結(jié)構(gòu)信息保持的弱監(jiān)督目標定位”現(xiàn)正應(yīng)用于電力、制造、能源等領(lǐng)域的生產(chǎn)車間中,通過將技術(shù)賦予AVG機器人之中,機器人可以在復(fù)雜的環(huán)境中實現(xiàn)自主行走、避障等,從而提升機器人搬運、分揀等效率。此外,將該技術(shù)植入進AR智能眼鏡中,可以為現(xiàn)場人員提供實景導(dǎo)航、安全提示等,從而提高生產(chǎn)安全性。
而“基于孿生中心預(yù)測網(wǎng)絡(luò)的視覺跟蹤”技術(shù)則可以將數(shù)字孿生技術(shù)、三維建模技術(shù)更好的應(yīng)用起來,工作人員可更方便的查看設(shè)備圖紙、操作設(shè)備虛擬三維模型,提高生產(chǎn)、運維、遠程培訓(xùn)的效率。
AI是進入未來世界的關(guān)鍵,是成就改變世界夢想的鑰匙。截至目前,亮亮視野已經(jīng)有數(shù)篇AI科研成果登陸世界頂級會議,并將這些技術(shù)產(chǎn)業(yè)化,為不同行業(yè)帶去智能化的解決方案。未來,亮亮?xí)^續(xù)加大AI領(lǐng)域的研究工作,通過人工智能與增強現(xiàn)實技術(shù),以第一視角交互讓人與人、人與機器、人與數(shù)據(jù)的溝通變得更自然高效。
原文標題:AI視覺研究持續(xù)亮劍 亮亮視野成果入選世界頂級會議
文章出處:【微信公眾號:亮亮視野】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
責任編輯:haq
-
Ar
+關(guān)注
關(guān)注
25文章
5297瀏覽量
176817 -
AI
+關(guān)注
關(guān)注
91文章
41650瀏覽量
302890 -
自動駕駛
+關(guān)注
關(guān)注
795文章
15040瀏覽量
181878
原文標題:AI視覺研究持續(xù)亮劍 亮亮視野成果入選世界頂級會議
文章出處:【微信號:glxss-life,微信公眾號:亮亮視野LLVISION】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
傳音相關(guān)研究成果入選計算機視覺頂會CVPR 2026
奕行智能論文入選國際計算機體系結(jié)構(gòu)頂級會議 ISCA 2026
亮亮視野聯(lián)合智譜AI推出AR+AI會議翻譯系統(tǒng)
亮亮視野AR翻譯眼鏡閃耀2025進博會國際論壇
亮亮視野AR翻譯眼鏡亮相HICOOL 2025全球創(chuàng)業(yè)者峰會
亮亮視野榮登2025中國VR50強企業(yè)榜單
亮亮視野AR翻譯眼鏡亮相2025北京文化論壇
亮亮視野AR翻譯眼鏡亮相IFA 2025
易控智駕榮獲計算機視覺頂會CVPR 2025認可
思必馳與上海交大聯(lián)合實驗室研究成果入選兩大頂級會議
格靈深瞳六篇論文入選ICCV 2025
Nullmax端到端自動駕駛最新研究成果入選ICCV 2025
亮亮視野多項研究成果成功入選計算機視覺世界頂級會議
評論