主要內(nèi)容:
文章主要強調(diào)隱私保護下的視覺定位,這是近年來被很多研究者重視的一個研究方向,即在不傷害用戶隱私的情況下進行算法的研究。
文章以此提出了一種使用事件攝像機的魯棒、隱私保護的視覺定位算法,事件相機由于其高動態(tài)范圍和小的運動模糊比傳統(tǒng)相機有一定的優(yōu)勢,但是缺點在于事件相機存在很大的域間隙,難以直接應(yīng)用傳統(tǒng)的基于圖像的定位算法,針對存在的問題,文章提出了一種策略,即在定位之前,把事件相機捕獲的數(shù)據(jù)轉(zhuǎn)換為傳統(tǒng)圖像形式,從隱私角度來看與普通攝像機相比,事件攝像機只捕捉到一小部分視覺信息,因此可以自然隱藏敏感的視覺細節(jié),為了進一步加強隱私保護,還在兩個級別上引入了隱私保護,即傳感器和網(wǎng)絡(luò)級別,傳感器級保護旨在通過輕量級過濾來隱藏面部細節(jié),而網(wǎng)絡(luò)級保護則使用神經(jīng)網(wǎng)絡(luò)來隱藏私人場景應(yīng)用中的整個用戶視圖,這兩種級別的保護都涉及輕量計算,只會導(dǎo)致少量性能損失。
什么是事件相機?
我們大多數(shù)人對傳統(tǒng)相機以及其拍攝的RGB圖像很熟悉,但是對于事件相機應(yīng)該是很少使用了解的。
早期的圖像處理(其實現(xiàn)在更多也是)都是基于傳統(tǒng)相機來做的,然而傳統(tǒng)相機在應(yīng)用中有兩個很明顯的問題,如下圖,一個是運動模糊(當場景中的運動速度超過相機的采樣速率之后就會產(chǎn)生運動模糊),雖然可以通過算法彌補運動模糊,但是計算開銷很大,不滿足實時需求;另一個問題是由于光線的問題造成曝光不足或者過曝的動態(tài)范圍問題,強烈的陽光可能會使傳統(tǒng)相機無法看清視野物體。

Event camera則從傳感器層面解決傳統(tǒng)相機的缺點,同傳統(tǒng)相機不同,事件相機只觀測場景中的“運動”,確切地說是觀察場景中的“亮度的變化”,它只會在有亮度變化時輸出對應(yīng)pixel的亮度變化(1或0),具有響應(yīng)快、動態(tài)范圍寬、無運動模糊等優(yōu)勢。
對于傳統(tǒng)的相機,從某種程度上是捕獲一個靜態(tài)/靜止的空間,而Event Camera的目的是捕捉運動的物體。對于單個像素點,Event Camera只有接收的光強產(chǎn)生變化時,該像素點才會輸出。比如亮度增加并超過的一個閾值,那么對應(yīng)像素點將輸出一個亮度增加的事件。Event Camera沒有幀的概念,當場景變化時,就產(chǎn)生一系列的像素級(pixel-level)的輸出。事件相機的每個像素點是獨立異步工作的,所以動態(tài)范圍很大。總結(jié)就是,傳統(tǒng)相機以固定的幀率對場景進行全幀拍攝,所有像素同步工作。事件相機是每個像素獨立異步工作,采樣率高且僅對亮度變化(event)進行輸出,一個事件(event,亮度變化)包括發(fā)生的時刻、發(fā)生的像素坐標和事件發(fā)生的極性。所謂事件發(fā)生的極性表示的是亮度相比于前一次采樣是增加還是減少。
Contributions:
(1)使用事件攝像機在具有挑戰(zhàn)性的條件下進行魯棒定位
(2)傳感器級隱私保護以緩解觀察到的人的擔憂
(3)網(wǎng)絡(luò)級隱私保護以減輕用戶的擔憂
為什么要在隱私保護下進行算法研究?
如圖1所示,定位應(yīng)用的使用者可能會擔心和提供商共享同樣的視圖,畢竟這在具有有限計算量的邊緣設(shè)備,比如手機、AR眼鏡等中是不可避免的,而且被觀察的人也會出現(xiàn)擔憂,被別人不知不覺就拍攝了照片。所以隱私保護下的視覺算法研究近年來被越來越多的研究者所關(guān)注研究。

Pipeline:
給定事件相機記錄的事件流,算法輸出在3D地圖中找到的查詢事件相機的6自由度姿態(tài),如圖1所示。


定位過程中的隱私保護:
提出了兩個級別的隱私保護以防止信息共享過程中可能發(fā)生的違規(guī)行為。
(1)傳感器級隱私保護,其專注于隱藏面部細節(jié)。
(2)網(wǎng)絡(luò)級隱私保護,目標是在私人場景中進行定位,其用戶可能希望完全隱藏他們正在查看的內(nèi)容
傳感器級隱私保護:
傳感器級隱私保護在一致或彎曲的區(qū)域暫時移除,并將結(jié)果與原始體素混合,這種低級操作保留了靜態(tài)結(jié)構(gòu),同時模糊了動態(tài)或面部信息,通過沿時間軸的中值濾波來過濾時間上不一致的區(qū)域,如圖2a所示。



對于累積量不足的體素網(wǎng)格區(qū)域,由于信噪比較低,濾波過程可能會產(chǎn)生偽影。因此使用圖2b所示的二進制閾值將過濾后的體素與原始事件體素混合。
網(wǎng)絡(luò)級別隱私保護:
網(wǎng)絡(luò)級隱私保護將用戶的視圖完全隱藏在私有空間中,不讓服務(wù)提供商看到,同時節(jié)省了用戶端的計算。在服務(wù)提供商和用戶之間分割事件到圖像的轉(zhuǎn)換過程,其中推斷是使用私人重新訓(xùn)練的重建網(wǎng)絡(luò)
完成的


但是考慮到服務(wù)提供商可能會攻擊,如圖3b所示,有三種可能的攻擊:交換層推斷、通用網(wǎng)絡(luò)重新訓(xùn)練和目標網(wǎng)絡(luò)重新訓(xùn)練。首先,在交換層推斷中,采用
的中間推斷結(jié)果,并使用原始網(wǎng)絡(luò)參數(shù)Θ運行其余的重建。另外兩種攻擊涉及使用服務(wù)提供商可能可用的大量事件數(shù)據(jù)重新訓(xùn)練一組新的網(wǎng)絡(luò)。通用網(wǎng)絡(luò)再訓(xùn)練使用與私人訓(xùn)練相同的訓(xùn)練目標訓(xùn)練隨機初始化的神經(jīng)網(wǎng)絡(luò)。目標網(wǎng)絡(luò)重新訓(xùn)練類似地使用相同的目標訓(xùn)練神經(jīng)網(wǎng)絡(luò),但使用
的共享參數(shù)值初始化網(wǎng)絡(luò)的中間部分。使用重新訓(xùn)練的網(wǎng)絡(luò),服務(wù)提供商可以嘗試交換層推斷,如圖3b所示。

實驗:
數(shù)據(jù)集,使用三個數(shù)據(jù)集進行評估,DA VIS240C、EvRooms和EvHumans。
DA VIS240C包括使用DA VIS攝像機拍攝的場景,該攝像機同時輸出事件和幀。
EvRooms是文章提出的一個新數(shù)據(jù)集,用于評估基于事件的定位算法在具有挑戰(zhàn)性的外部條件下的魯棒性。數(shù)據(jù)集在20個場景中被捕獲,并分成包含快速相機運動(EvRoomsF)和低光照(EvRoomsL)的記錄。
EvHumans是另一個提出的新數(shù)據(jù)集,用于評估移動人群中的隱私保護定位。數(shù)據(jù)集由22名志愿者在12個場景中移動而成。這兩個數(shù)據(jù)集都是使用DA VIS346相機拍攝的。
比較的算法:
和直接的定位方法PoseNet,SP-LSTM以及以各種事件表示為輸入的基于結(jié)構(gòu)的方法

在隱私保護方面的效果:


總結(jié):
提出了一種魯棒的基于事件的定位算法,可以同時保護用戶隱私。利用事件到圖像的轉(zhuǎn)換來適應(yīng)事件攝像機上基于結(jié)構(gòu)的定位。為了在轉(zhuǎn)換過程中保護隱私,提出了傳感器和網(wǎng)絡(luò)級別的保護。傳感器級保護的目標是隱藏面部標志,而網(wǎng)絡(luò)級保護的目的是在私人場景中為用戶隱藏整個視圖。
審核編輯 :李倩
-
傳感器
+關(guān)注
關(guān)注
2578文章
55567瀏覽量
794184 -
算法
+關(guān)注
關(guān)注
23文章
4810瀏覽量
98603 -
像素
+關(guān)注
關(guān)注
1文章
208瀏覽量
19285 -
相機
+關(guān)注
關(guān)注
5文章
1607瀏覽量
56045
原文標題:Arxiv 2022|使用事件相機來進行隱私保護的視覺定位新方式
文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
深度自然匿名化:隱私保護與視覺完整性并存的未來!
四元數(shù)視覺:CCD機器視覺系統(tǒng)運行原理及工作方式
【HarmonyOS HiSpark AI Camera】視覺定位
CCD機器視覺系統(tǒng)運行原理及工作方式
深圳CCD視覺檢測定位系統(tǒng)有什么特點?
四元數(shù)數(shù)控:深圳機器視覺引導(dǎo)定位是什么?
CCD視覺定位系統(tǒng)在紫外激光打標機上的應(yīng)用
機器視覺入門課程(光源選型、鏡頭選型、相機選型、打光方式分析)
基于RFID隱私保護分析
大數(shù)據(jù)及其隱私保護
自動駕駛的視覺定位與導(dǎo)航應(yīng)用詳細解析
解析工業(yè)相機如何進行視覺檢測
基于優(yōu)化局部抑制的軌跡隱私保護算法
電力公用事業(yè)公司可以通過智能電表電子產(chǎn)品的新進展來保護收入
機器視覺系統(tǒng)之工業(yè)相機解讀
使用事件相機來進行隱私保護的視覺定位新方式
評論