VR眼鏡層出不窮,VR 應(yīng)用如雨后春筍,它們消費(fèi)的內(nèi)容主要有圖片,視頻和游戲3種。當(dāng)前優(yōu)酷,搜狐,樂視,愛奇藝,Youtube等比較大的視頻網(wǎng)站,都推出了VR視頻專區(qū),各種比較小的專注VR視頻的網(wǎng)站多不勝數(shù),其中比較有名的有Utovr,591vr等。用戶在使用QQ手機(jī)瀏覽器(Android)過程中視頻的播放量很大,其中不可避免的會(huì)有VR視頻。
VR視頻一般是mp4格式,與普通視頻無異。mp4視頻里面并沒有標(biāo)記這是一個(gè)普通視頻,還是一個(gè)VR視頻。一般網(wǎng)站或者應(yīng)用里面區(qū)分VR視頻的做法是,在后臺(tái)的數(shù)據(jù)庫里面有個(gè)字段標(biāo)記。但是QQ瀏覽器里面的播放器只能拿到一個(gè)視頻的URL,無法知道這是一個(gè)普通視頻還是VR視頻,所以播放的時(shí)候只能按照普通視頻去渲染。
?

VR視頻眼鏡播放模式(可以轉(zhuǎn)動(dòng)手機(jī)查看周圍)
?

VR視頻普通播放模式
如何判斷視頻是不是VR視頻
前面已經(jīng)說了,QQ瀏覽器的視頻播放器只能拿到一個(gè)視頻的播放地址,所以判斷是否VR視頻,只能從視頻本身出發(fā)。觀察以下VR視頻和普通視頻的截圖兩端紅框區(qū)域,發(fā)現(xiàn)VR視頻的兩端邊緣相似度較高,而普通視頻的邊緣相似度很差。VR視頻識(shí)別的算法就是基于這個(gè)現(xiàn)象,獲取一個(gè)視頻多個(gè)幀的圖片,然后給出視頻是VR視頻的概率。
算法存在的問題
通過上面的介紹,知道這個(gè)算法是根據(jù)圖片邊緣相似性得到結(jié)果,出于效率的考慮檢查的圖片數(shù)量和檢查的粒度不能設(shè)置太高,那么它得到的結(jié)果會(huì)有兩個(gè)不可避免的問題:將VR視頻識(shí)別為普通視頻;將普通視頻識(shí)別為VR視頻。如以下示例:
對(duì)于這樣一個(gè)計(jì)算概率性的算法,需要找到盡量多的失敗用例,然后根據(jù)失敗的特點(diǎn)來改進(jìn)算法。為了發(fā)現(xiàn)失敗用例,需要一個(gè)很大的測(cè)試集,這個(gè)測(cè)試集合里面包含了一個(gè)VR視頻集合,以及一個(gè)普通視頻的集合。這個(gè)集合的作用是盡量使VR視頻正確識(shí)別,又要保證普通視頻不會(huì)被識(shí)別為VR視頻。這個(gè)集合最好還要易于增加測(cè)試源,用來驗(yàn)證算法的有效性。
測(cè)試集的建立
最開始測(cè)試集合是到網(wǎng)絡(luò)上下載VR視頻,保存到本地,然后用來測(cè)試驗(yàn)證。這種方式的優(yōu)點(diǎn)是測(cè)試的速度很快,因?yàn)槎际潜镜匾曨l。但是缺點(diǎn)也很明顯,VR視頻的size太大(5 分鐘的視頻經(jīng)常會(huì)上 G)本地保存比較麻煩;每次去網(wǎng)上找下載太耗時(shí),不容易增加,而且容易重復(fù)。
現(xiàn)在的測(cè)試集合保存的是視頻網(wǎng)頁的網(wǎng)址,網(wǎng)址有爬蟲爬取。當(dāng)前做了12個(gè)網(wǎng)站的爬蟲,基本包含了國內(nèi)主流的視頻網(wǎng)站和VR 視頻網(wǎng)站。
?

支持的主流網(wǎng)站(source表)
在爬蟲里記錄了網(wǎng)站經(jīng)常更新的頁面(一般是網(wǎng)站的分類網(wǎng)址:如優(yōu)酷的電視劇,電影分類的 URL),爬蟲運(yùn)行時(shí)將爬去到的頁面地址保存到Video表。保存前會(huì)自動(dòng)分析頁面的特征,判斷該頁面的視頻是不是 VR 視頻,并將結(jié)果一起保存到video表,從而建立VR視頻集合以及普通視頻集合。
測(cè)試過程中如果發(fā)現(xiàn)有的視頻源已經(jīng)失效,需要在video表中標(biāo)記無效,不用刪除視頻源,避免下次再次加入。如果是自動(dòng)化能識(shí)別的失效可以自動(dòng)化標(biāo)記(如:視頻已經(jīng)下線跳轉(zhuǎn)到404頁面),否則需要人工根據(jù)測(cè)試結(jié)果標(biāo)記。
?

測(cè)試集合內(nèi)的視頻(video 表)
當(dāng)前測(cè)試集合的VR視頻數(shù)量有2500個(gè),普通視頻數(shù)量有7000 個(gè),由于現(xiàn)在的測(cè)試工具尚不支持https的測(cè)試源,所以有些視頻還沒有測(cè)試過。
測(cè)試準(zhǔn)備
有了爬蟲就可以建立測(cè)試集,有了測(cè)試集還需要測(cè)試工具。測(cè)試工具是開發(fā)提供的一個(gè)exe程序,程序的調(diào)用方式:VideoDetector.exe -c 30 -u http://www.xxx.mp4 ,調(diào)用后的返回結(jié)果是視頻為VR視頻的概率,如果出錯(cuò)返回 -1。
測(cè)試集和測(cè)試結(jié)果都保存在數(shù)據(jù)庫中,數(shù)據(jù)庫中有 4 張表。上面已經(jīng)介紹了source和video表,分別支持的網(wǎng)站和爬蟲爬取的視頻網(wǎng)頁。還有一個(gè)task表,用來記錄每次測(cè)試的結(jié)果,另外還有一個(gè)result表,用來記錄每個(gè)視頻的測(cè)試結(jié)果。
?

以上是最近的一次測(cè)試結(jié)果,更新算法后,驗(yàn)證 VR 視頻的成功率提升了 20%,驗(yàn)證非 VR視頻的成功率下降了 3%。 使用該方案后,能快速了解算法對(duì)視頻識(shí)別率的影響,并能方便獲取失敗用例,用來改進(jìn)算法。
電子發(fā)燒友App






評(píng)論