日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI+三維視覺 讓機(jī)器人具備決策和執(zhí)行力

電子工程師 ? 來源:fqj ? 2019-05-23 11:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人類不僅可以通過眼睛“看清”周圍環(huán)境中的東西,還能“識別并理解”這些東西,對這些東西形成“認(rèn)知和決策”?,F(xiàn)在,研究人員正努力讓AI也做到這一點(diǎn)。北京大學(xué)博雅特聘教授、前沿計(jì)算研究中心執(zhí)行主任陳寶權(quán)的這篇精彩演講,對當(dāng)前國內(nèi)三維視覺智能領(lǐng)域研究概況、技術(shù)應(yīng)用方向和未來前景做了精彩分析。

眾所周知,人工智能模擬人類智能的技術(shù),實(shí)現(xiàn)對人類智能的完全再現(xiàn),是人工智能的終極目標(biāo)。而人類智能是從人類的感官和認(rèn)知開始的。所以,人類的感官往往成為研究人工智能的入手點(diǎn),比如視覺。

對于人類而言,不僅可以通過眼睛“看清”周圍環(huán)境中的東西,還能“識別并理解”這些東西,對這些東西形成“認(rèn)知和決策”?,F(xiàn)在,越來越多的AI領(lǐng)域的研究人員正努力讓AI同樣做到這一點(diǎn)。從人類的三維視覺出發(fā),三維視覺智能已成為人工智能研究和應(yīng)用的熱門領(lǐng)域。

在今年3月27日新智元舉辦的“智能云·新世界”AI技術(shù)峰會(huì)上,北京大學(xué)博雅特聘教授、前沿計(jì)算研究中心執(zhí)行主任陳寶權(quán)發(fā)表了題為《三維視覺智能及應(yīng)用》的演講,從研究人員的視角,對當(dāng)前國內(nèi)三維視覺智能領(lǐng)域研究概況、技術(shù)應(yīng)用方向和未來前景做了精彩的分析。

說到視覺智能,大家都不陌生,人工智能的很多技術(shù)是基于人的各種感觀的,其中視覺感觀就是非常重要的一環(huán)。在視覺智能方面的很多技術(shù)已經(jīng)在工業(yè)界得到非常好的應(yīng)用。隨著應(yīng)用的深入,越來越多的視覺智能技術(shù)進(jìn)入“三維視覺智能”階段。也就是說,我們的眼睛不僅要看清某個(gè)東西,認(rèn)識某個(gè)東西,還要走到這個(gè)場景里面去,在三維世界里真實(shí)地感受場景,如同身臨其境。

這就需要具有三維空間感知與認(rèn)知能力的智能,即三維視覺智能。任何一個(gè)新的研究方向的出現(xiàn)都不是憑空而來,而是和許多其他學(xué)科交叉而來的。三維視覺智能的研究就是集合計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺等領(lǐng)域的技術(shù)與傳統(tǒng)的人工智能、學(xué)習(xí)、大數(shù)據(jù)等很好地交叉融合。

三維視覺技術(shù)的發(fā)展得益于視覺傳感器的快速發(fā)展,已經(jīng)在推動(dòng)很多應(yīng)用,比較有代表性的包括無人車、機(jī)器人,以及娛樂、影視等其它領(lǐng)域的應(yīng)用。

首先是三維感知,也就是感知三維空間,獲取和處理三維深度等;然后是位置感知,比如感知相機(jī)的位置等;第三是三維建模,不僅對場景有基本的深度感知,還要獲得關(guān)于場景完整幾何模型的描述。最重要的就是三維理解,對場景和其中的物體從三維空間來進(jìn)行理解。

三維視覺的發(fā)展得益于視覺傳感器的發(fā)展,而傳感器大致可以分為兩類,一類是被動(dòng)傳感器,現(xiàn)在我們用的各種相機(jī)就是被動(dòng)傳感器。另一類就是主動(dòng)傳感器,比如激光掃描,以及各類以主動(dòng)發(fā)射信號為主導(dǎo)進(jìn)行測量的傳感器。大家知道,隨著手機(jī)的快速發(fā)展,未來的手機(jī)會(huì)同時(shí)配備兩類傳感器,也就是深度傳感器和傳統(tǒng)的顏色傳感器。

下面簡要介紹一下我們在這方面的一些探索性工作。2009年,當(dāng)時(shí)大疆無人機(jī)還做定制化產(chǎn)品,我們請大疆做了一臺定制化無人機(jī),目的用它來做傾斜角航拍,利用無人機(jī)從空中得到航拍影像,經(jīng)過三維重建計(jì)算以后得到三維影像數(shù)據(jù)(注意,還不是完整的三維模型),有了三維描述就可以從任意視角自由地漫游場景??梢钥吹?,盡管用的只是二維傳感器,依然可以通過視覺計(jì)算得到三維數(shù)據(jù)的描述。

隱式三維感知:動(dòng)態(tài)相機(jī)實(shí)現(xiàn)視頻無縫接合

在我講如何利用主動(dòng)式傳感器直接獲得三維場景幾何模型之前,我想先介紹一下,其實(shí)對于影像的三維感知不一定要以顯式的方式表示出來,可以通過隱式的方法獲得一定程度的三維感知,也能實(shí)現(xiàn)一些類比于直接采用三維信息才能實(shí)現(xiàn)的功能。

這個(gè)好比人的視覺感知,我們雖然對視覺的認(rèn)知是三維的,但也不是一切基于精確的三維測量。這里舉幾個(gè)例子。比如,上面是電影里的一個(gè)片斷,我們可以把其中的人物和表演放到一個(gè)新的場景里去,因?yàn)橄鄼C(jī)是動(dòng)態(tài)的,這里就需要有一個(gè)隱式的相機(jī)三維位置恢復(fù),才能把一個(gè)動(dòng)態(tài)的前景和一個(gè)動(dòng)態(tài)的視頻背景無縫融合在一起。

上面是一段表演視頻,我們可以提取它的一部分三維骨架信息,驅(qū)動(dòng)一個(gè)不會(huì)跳舞的人來跳舞。左邊的這個(gè)人假設(shè)不會(huì)跳舞,她只是做幾個(gè)動(dòng)作,右邊大圖里面左上角是真正會(huì)跳舞的舞者,我們用她的專業(yè)動(dòng)作來驅(qū)動(dòng)不會(huì)跳舞的人來跳舞。就是通過對“驅(qū)動(dòng)”視頻進(jìn)行三維理解并“遷移”三維動(dòng)作到參考視頻中的人物而并合成新的視頻,于是在右邊大圖里,這位女士也會(huì)跳舞了。

我們不僅可以把一個(gè)人的動(dòng)作遷移到另外一位骨架類似的人身上,也可以把小孩的動(dòng)作遷移到大人身上,甚至可以把動(dòng)物的動(dòng)作遷移到人的身上。這就需要具備一定的三維骨架重定向的能力。

比如,下面的動(dòng)圖中有兩個(gè)人在跳舞,但是每個(gè)人的動(dòng)作方向、臉部朝向、身高都有所不同。像這樣一個(gè)運(yùn)動(dòng)的定向差值,都是通過隱式三維理解和編碼實(shí)現(xiàn)的。

下面講主動(dòng)傳感器的使用,近年來主動(dòng)式傳感的發(fā)展非常非??臁L貏e是無人車技術(shù)的發(fā)展要求,進(jìn)一步推動(dòng)了傳感技術(shù)的飛速發(fā)展。早在無人車火爆之前,我們就于2009年開始采用車載移動(dòng)激光掃描器來進(jìn)行城市級別的大場景三維掃描,構(gòu)建城市場景的三維模型。

我們通過車載三維傳感技術(shù)得到了大量點(diǎn)云數(shù)據(jù),并利用這些數(shù)據(jù)進(jìn)行幾何建模,得到了非常精細(xì)的三維模型。我們對城市場景里各種類別的復(fù)雜物體進(jìn)行建模,例如對樹木等目標(biāo)進(jìn)行三維識別,識別出不同類型的樹,再針對不同樹木的幾何特征,對樹木進(jìn)行高精細(xì)化的三維建模。

中央電視臺曾經(jīng)對我們做過一期專門報(bào)道——《把城市搬到電腦里》。當(dāng)時(shí)我們對深圳一個(gè)片區(qū)進(jìn)行了完整的三維建模。這之后我們接到了很多電話,問我們:用你們的車開過一遍是不是就能獲得我們城市的三維模型?實(shí)際上我們做不到,原因不是因?yàn)閿?shù)據(jù)處理的問題,而在于前端的數(shù)據(jù)獲取。

我們的城市綠化做得太好了,車開過去只能掃描到樹,掃描不到建筑。如果要真正解決這個(gè)問題,就要把解決方案移到前端,想辦法能夠完整地獲取數(shù)據(jù)。

因此,我們開始提出利用機(jī)器人獲取數(shù)據(jù),來進(jìn)一步解決這個(gè)問題。機(jī)器人在現(xiàn)場采集數(shù)據(jù)的同時(shí)進(jìn)行數(shù)據(jù)分析,看看數(shù)據(jù)是不是有缺失,如果有缺失就要走到相應(yīng)地點(diǎn)去獲取所需信息,從而形成一個(gè)數(shù)據(jù)獲取與處理的閉環(huán)。

讓機(jī)器人不僅看得見,還要看得懂

首先從單個(gè)物體的實(shí)驗(yàn)開始,機(jī)器人手持Kinect(一種利用結(jié)構(gòu)光獲取三維模型信息的主動(dòng)式傳感器)掃描一個(gè)物體,例如一個(gè)3D打印的玩具,能獲取目標(biāo)物體全方位的三維數(shù)據(jù)。機(jī)器人自己規(guī)劃掃描路徑,直到最后獲得一個(gè)完整的三維模型。

接著實(shí)驗(yàn)的是場景認(rèn)知問題。不僅要獲得場景的完整三維數(shù)據(jù),而且還要認(rèn)識每個(gè)物體到底是什么,要去理解場景里的每個(gè)物體,獲取物體的語義信息。同樣的道理,認(rèn)知的過程必須形成一個(gè)閉環(huán),機(jī)器人的實(shí)時(shí)決策能不能根據(jù)現(xiàn)有的三維數(shù)據(jù)對這個(gè)物體進(jìn)行識別。如果不可以,就要走到新的角度去獲取數(shù)據(jù)。

進(jìn)一步,我們的算法就可以拓展到一個(gè)更大的室內(nèi)場景中。這種情況下,只有一個(gè)機(jī)器人是不夠的,我們可以利用多個(gè)機(jī)器人。這些機(jī)器人要實(shí)現(xiàn)協(xié)作,需要一個(gè)實(shí)時(shí)的協(xié)同工作算法。在室內(nèi)環(huán)境下,我們已經(jīng)有了非常好的機(jī)器人協(xié)同方案。

機(jī)器人不僅可以在三維空間導(dǎo)航行走,還應(yīng)該成為真實(shí)世界的一員。實(shí)現(xiàn)這一點(diǎn)就要讓機(jī)器人和現(xiàn)實(shí)場景打交道,比如讓機(jī)器人拿起一個(gè)杯子,打開一扇門,甚至和人握手等。這種直接的三維交互非常重要。這需要對機(jī)器人空間定位和路徑規(guī)劃進(jìn)行更多的研究,這方面我們近期做了一些工作。

讓機(jī)器人具備決策和執(zhí)行力,替人類完成更多工作

我們沿著這個(gè)技術(shù)路線探索,思路也變得愈發(fā)清晰。通過三維視覺與人工智能技術(shù)的結(jié)合,我們讓機(jī)器人更加智能化與功能化,讓機(jī)器人做更多人在現(xiàn)實(shí)生活中能夠做的事。機(jī)器人具備現(xiàn)場自主決策和執(zhí)行的能力,比如在工業(yè)流水線上可以幫助組裝配件,物流場景中搬箱子等。這樣的應(yīng)用,涉及到非常精細(xì)化的技術(shù),比如準(zhǔn)確高效的運(yùn)動(dòng)規(guī)劃,還有各種各樣的控制,智能的執(zhí)行等。我們在這方面也有了些探索性的工作。

隨著三維傳感器的普及,三維數(shù)據(jù)越來越多,如何實(shí)現(xiàn)對三維場景的精細(xì)化理解變得非常重要。理解場景很重要也很有效的一個(gè)方法就是深度學(xué)習(xí)。最早所有的深度學(xué)習(xí)都是針對二維影像。卷積神經(jīng)網(wǎng)絡(luò)面向的是二維影像,而對于三維場景,輸入數(shù)據(jù)是三維的點(diǎn)云。

因?yàn)闆]有卷積神經(jīng)網(wǎng)絡(luò)能夠天然地處理非結(jié)構(gòu)化的三維點(diǎn)云,我們針對這個(gè)問題設(shè)計(jì)了PointCNN卷積神經(jīng)網(wǎng)絡(luò),它的性能是相當(dāng)好的,我們也很高興看到有很多公司在使用我們的網(wǎng)絡(luò)。

面向物流領(lǐng)域的應(yīng)用,我們還嘗試了一個(gè)機(jī)器人搬箱子的測試。在去年京東“雙11”期間進(jìn)行了10天的壓力測試,機(jī)器人在現(xiàn)場代替一組人(兩人一組)去識別箱子、搬箱子,并把大大小小不同的箱子搬到傳送帶上。這是我們的技術(shù)第一次從學(xué)校的實(shí)驗(yàn)室走進(jìn)現(xiàn)實(shí)場景中。但是我們也感受到,越走近現(xiàn)實(shí)場景,問題就會(huì)越復(fù)雜。在座有很多企業(yè)界的人,歡迎各位能過來跟我們交流合作。

三維視覺智能的研究與應(yīng)用如此重要,但國內(nèi)還沒有一個(gè)基于三維視覺的社區(qū)。去年底,由本人召集在中國圖像圖形學(xué)會(huì)旗下成立了三維視覺專業(yè)委員會(huì),目的是把學(xué)術(shù)界和企業(yè)界的相關(guān)人士聯(lián)合在一起。歡迎更多相關(guān)企業(yè)加入進(jìn)來,一起推動(dòng)三維視覺技術(shù)的發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    214

    文章

    31611

    瀏覽量

    224307
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50485

    瀏覽量

    267629

原文標(biāo)題:AI+三維視覺,讓機(jī)器人具備決策和執(zhí)行力

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    2026年中國十大機(jī)器視覺公司的決勝邏輯:全棧能力與場景深耕

    機(jī)器視覺與移動(dòng)機(jī)器人業(yè)務(wù)主體,致力于構(gòu)建“AI+視覺+機(jī)器人”的協(xié)同閉環(huán)。公司依托母公司在視頻
    發(fā)表于 05-15 09:16

    傳感器:當(dāng)機(jī)器人擁有“真實(shí)觸覺”,未來會(huì)發(fā)生什么?

    的“觸覺神經(jīng)”。雖然不起眼,但它正在悄悄改變智能制造和機(jī)器人共處的未來。 六傳感器是什么? 簡單說,六
    發(fā)表于 04-29 16:29

    基于米爾RK3576核心板的國產(chǎn)割草機(jī)器人解決方案

    依賴國外云端算的方案,RK3576內(nèi)置了算高達(dá)6 TOPS的第代自研NPU。這一國產(chǎn)NPU使得割草機(jī)器人能夠在不聯(lián)網(wǎng)、不依賴國外云服務(wù)的條件下,實(shí)時(shí)完成: 草坪環(huán)境識別 :區(qū)分草
    發(fā)表于 04-24 17:31

    深度相機(jī):從技術(shù)突破到全場景落地,解鎖三維感知新可能

    在智能制造、智能機(jī)器人、戶外巡檢等領(lǐng)域快速升級的當(dāng)今,三維感知技術(shù)已成為連接物理世界與數(shù)字世界的重要橋梁,而深度相機(jī)作為三維感知的重要載體,正逐步打破傳統(tǒng)視覺感知的局限,從實(shí)驗(yàn)室走向?qū)?/div>
    的頭像 發(fā)表于 04-15 15:04 ?428次閱讀
    深度相機(jī):從技術(shù)突破到全場景落地,解鎖<b class='flag-5'>三維</b>感知新可能

    為何你的機(jī)器人手臂“知覺”存在偏差?探秘傳感器的奧秘

    假如你操作過機(jī)械臂,或者在工廠里調(diào)試過用于精密裝配、拋光的機(jī)器人,一定碰到過這種怪事:明明機(jī)械臂空載停在空中,周圍啥也沒碰,可傳感器上的讀數(shù)卻顯示有好幾牛頓的,甚至還帶著不小的扭
    發(fā)表于 04-13 15:25

    再談低溫?zé)Y(jié)銀的應(yīng)用:從春晚四家機(jī)器人出鏡的幕后推手說起

    ,完成翻跟頭、脖子延伸、互動(dòng)接梗,強(qiáng)調(diào)關(guān)節(jié)靈活+低功率+長期穩(wěn)定。 銀河通用:《我最難忘的今宵》:Galbot G1具身智能,自主決策、精細(xì)操作,依賴AI芯片+傳感器+高效互連。 2機(jī)器人動(dòng)得穩(wěn)、準(zhǔn)、快
    發(fā)表于 02-17 14:07

    AI機(jī)器人控制進(jìn)階教程(入門版)》閱讀指引

    的預(yù)編程,只能在結(jié)構(gòu)化環(huán)境中工作。AI的引入(如計(jì)算機(jī)視覺、自然語言處理),賦予機(jī)器人感知、理解和決策的能力,使其能適應(yīng)開放、動(dòng)態(tài)的真實(shí)世界。2.解決復(fù)雜任務(wù)的核心本
    的頭像 發(fā)表于 01-07 10:56 ?2524次閱讀
    《<b class='flag-5'>AI</b><b class='flag-5'>機(jī)器人</b>控制進(jìn)階教程(入門版)》閱讀指引

    高精度機(jī)器人控制的核心——基于 MYD-LT536 開發(fā)板的精密運(yùn)動(dòng)控制方案

    處理器,支持 1.8 GHz 主頻,并集成2Tops NPU、G2D、VPU 4K高清視頻編解碼器,為復(fù)雜控制算法與視覺融合計(jì)算提供充足算。米爾MYD-LT536開發(fā)板 在“高精度機(jī)器人控制”場景中
    發(fā)表于 11-14 15:48

    一文讀懂 | 三維視覺領(lǐng)域國家級制造業(yè)單項(xiàng)冠軍——先臨三維的品牌布局

    先臨三維科技股份有限公司成立于2004年,是三維視覺領(lǐng)域國家級制造業(yè)單項(xiàng)冠軍、國家專精特新“小巨人”企業(yè)。公司專注于高精度三維視覺軟、硬件的
    的頭像 發(fā)表于 11-11 14:55 ?988次閱讀
    一文讀懂 | <b class='flag-5'>三維</b><b class='flag-5'>視覺</b>領(lǐng)域國家級制造業(yè)單項(xiàng)冠軍——先臨<b class='flag-5'>三維</b>的品牌布局

    RK3576機(jī)器人核心:屏異顯+八路攝像頭,重塑機(jī)器人交互與感知

    ?RK3576的強(qiáng)大并非偶然,其架構(gòu)設(shè)計(jì)完美契合了現(xiàn)代機(jī)器人的核心需求:· 強(qiáng)大的異構(gòu)計(jì)算與AI能力:內(nèi)置的NPU為機(jī)器人視覺AI算法(如
    發(fā)表于 10-29 16:41

    巡檢機(jī)器人落地攻略:RK3576驅(qū)動(dòng)12路低延遲視覺

    解 RTSP/SRT/WebRTC 端到端 120~150ms 6TOPS NPU 邊緣AI 弱網(wǎng)穩(wěn)定回傳 02|為什么選擇 RK3576 做巡檢機(jī)器人的“視覺底座”?多路并發(fā)與同步3×4-lane
    發(fā)表于 10-24 16:53

    機(jī)器視覺三維成像技術(shù)簡介(一)

    本文討論了機(jī)器視覺三維成像技術(shù),涵蓋了各種成像技術(shù)的原理、特點(diǎn)、優(yōu)缺點(diǎn)及應(yīng)用場景等內(nèi)容。關(guān)鍵要點(diǎn)包括: 1. 三維成像技術(shù)分類 2. 飛行時(shí)間法(ToF) 3. 結(jié)構(gòu)光 4.
    的頭像 發(fā)表于 10-20 14:04 ?817次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺</b><b class='flag-5'>三維</b>成像技術(shù)簡介(一)

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+具身智能芯片

    。 決策層: 決策層是具身智能的第個(gè)主要層次,負(fù)責(zé)根據(jù)已有信息做出決策或行動(dòng)。 包括各種規(guī)則引擎、決策配套系統(tǒng)等。它的作用是根據(jù)已有信息做
    發(fā)表于 09-18 11:45

    工業(yè)機(jī)器人的特點(diǎn)

    者的基礎(chǔ),也是者的實(shí)現(xiàn)終端,智能制造裝備產(chǎn)業(yè)包括高檔數(shù)控機(jī)床、工業(yè)機(jī)器人、自動(dòng)化成套生產(chǎn)線、精密儀器儀表、智能傳感器、汽車自動(dòng)化焊接線、柔性自動(dòng)化生產(chǎn)線、智能農(nóng)機(jī)、3D 打印機(jī)等領(lǐng)域。而智能制造裝備中工業(yè)
    發(fā)表于 07-26 11:22

    媒體報(bào)道 | 錨定“端側(cè)AI+機(jī)器人”,移遠(yuǎn)又有大動(dòng)作!

    隨著端側(cè)AI的指數(shù)級突破與大模型輕量化部署技術(shù)的快速成熟,“端側(cè)AI+機(jī)器人”成為全球科技巨頭角逐的戰(zhàn)略要地,這一黃金賽道正加速從概念演變?yōu)楝F(xiàn)實(shí)。作為全球領(lǐng)先的物聯(lián)網(wǎng)整體解決方案供
    的頭像 發(fā)表于 07-11 19:05 ?1180次閱讀
    媒體報(bào)道 | 錨定“端側(cè)<b class='flag-5'>AI+</b><b class='flag-5'>機(jī)器人</b>”,移遠(yuǎn)又有大動(dòng)作!
    司法| 营山县| 武乡县| 化德县| 钦州市| 资阳市| 上犹县| 曲周县| 喀喇| 宣恩县| 惠水县| 社旗县| 介休市| 集安市| 探索| 大埔县| 东海县| 峨边| 清苑县| 恭城| 永仁县| 蓬莱市| 曲松县| 米脂县| 游戏| 西乌珠穆沁旗| 航空| 西乡县| 海晏县| 濮阳县| 乾安县| 玛曲县| 阳西县| 东宁县| 呼伦贝尔市| 龙海市| 石台县| 天等县| 余江县| 阜阳市| 盈江县|