日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種全新的數(shù)據(jù)蒸餾方法來(lái)加速NeRF

電子工程師 ? 來(lái)源:機(jī)器之心 ? 作者:Huan Wang ? 2022-08-08 10:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

神經(jīng)輻射場(chǎng) (Neural Radiance Field, or NeRF) [Mildenhall et al., ECCV, 2020] 開啟了用神經(jīng)網(wǎng)絡(luò)表征三維場(chǎng)景的新范式。NeRF 這兩年在學(xué)術(shù)界和工業(yè)界都很火熱, 但 NeRF 一個(gè)比較大的缺點(diǎn)是, 渲染速度慢。雖然 NeRF 用的神經(jīng)網(wǎng)絡(luò) (11 層的 MLP) 本身很小, 但是渲染一個(gè)像素需要采集一條光線上的很多點(diǎn)(上百個(gè)), 這導(dǎo)致渲染一張圖的計(jì)算量非常大, 如下圖所示: 用 PyTorch 在單張 NVIDIA V100 顯卡測(cè)試, 渲染 400x400 的圖片就需要 6.7s 的時(shí)間, 這顯然不利于 NeRF 在業(yè)界落地 (例如各種 AR/VR 設(shè)備, meta universe 等)。

90536e9a-16c2-11ed-ba43-dac502259ad0.png

學(xué)術(shù)界已有不少研究工作來(lái)加速 NeRF。比較流行的一種方式是, 給定訓(xùn)練好的 NeRF, 采用更高效的數(shù)據(jù)結(jié)構(gòu)進(jìn)行存儲(chǔ), 如 Sparse Voxel Octree [Yu et al., ICCV, 2021]. 盡管加速很可觀 (如 [Yu et al., ICCV, 2021] 實(shí)現(xiàn)了 3000x 的渲染加速), 但這種數(shù)據(jù)結(jié)構(gòu)也破壞了 NeRF 作為場(chǎng)景表征存儲(chǔ)小的優(yōu)點(diǎn)。譬如, 原始 NeRF 網(wǎng)絡(luò)僅僅 2.4MB 大小就可以存儲(chǔ)一個(gè)場(chǎng)景, 而采用 Sparse Voxel Octree 則需要 1.93GB [Yu et al., ICCV, 2021], 這顯然難以在端上應(yīng)用。 因此, 如何加速 NeRF 渲染并維持其存儲(chǔ)小的優(yōu)點(diǎn) (簡(jiǎn)言之: 小且快), 仍然是當(dāng)前的研究熱點(diǎn), 也是本文的動(dòng)因。

908ec648-16c2-11ed-ba43-dac502259ad0.png

Arxiv: https://arxiv.org/abs/2203.17261

Code: https://github.com/snap-research/R2L

Webpage: https://snap-research.github.io/R2L/

核心方法 我們所提出的核心方法從整體范式上來(lái)說(shuō)非常簡(jiǎn)單: 通過(guò)數(shù)據(jù)蒸餾將神經(jīng)輻射場(chǎng) (NeRF) 轉(zhuǎn)化為神經(jīng)光場(chǎng)(Neural Light Field, or NeLF) -- 從 NeRF 到 NeLF, 所以我們把方法命名為 R2L。 NeLF 與 NeRF 一樣, 都可以作為一個(gè)場(chǎng)景的表征. 不同的是:

NeRF 的輸入是場(chǎng)景中的一個(gè)點(diǎn) (該點(diǎn)的坐標(biāo) + 該點(diǎn)所在視線的方向), 輸出是該點(diǎn)的 RGB 和不透明度。NeRF 網(wǎng)絡(luò)的輸出是中間結(jié)果, 并不是圖片上的 RGB 值. 要想得到一個(gè)像素的 RGB 值, 需要對(duì)該像素對(duì)應(yīng)光線上的很多點(diǎn)進(jìn)行積分 (即 Alpha Compositing)。

而 NeLF 的輸入是一條光線, 輸出直接是該光線對(duì)應(yīng)圖片上像素值, 不需要 Alpha Compositing 這一步。

對(duì)于 Novel View Synthesis 這個(gè)任務(wù)來(lái)說(shuō), NeLF 的優(yōu)勢(shì)很明顯: 速度快! 要得到一個(gè)像素的 RGB 只需要跑一次網(wǎng)絡(luò), 而 NeRF 則需要跑上百次。

909aa80a-16c2-11ed-ba43-dac502259ad0.png

但它的缺點(diǎn)也很明顯, 主要有兩個(gè)缺點(diǎn): (1)NeLF 網(wǎng)絡(luò)要擬合的目標(biāo)函數(shù)比 NeRF 更難。這一點(diǎn)可以這么理解: 在一張圖片上相鄰兩個(gè)像素的 RGB 可能突變 (因?yàn)檎趽?, 而相鄰兩個(gè)像素的光線方向其實(shí)差別很小, 這就意味著, 這個(gè)函數(shù)的輸入稍微變化一點(diǎn), 輸出可能劇變, 這種函數(shù)的不連續(xù)性強(qiáng), 復(fù)雜度高. 相比之下, NeRF 表達(dá)的函數(shù)是空間中的點(diǎn), 空間中的點(diǎn)由于物理世界的連續(xù)性, 相鄰位置上 RGB 劇變的可能性小, 所以函數(shù)相對(duì)簡(jiǎn)單。 (2)同樣一堆圖片, 用來(lái)訓(xùn)練 NeLF 的話, 樣本量會(huì)大幅降低. 一張圖片, 長(zhǎng)寬為 H, W, 用來(lái)訓(xùn)練 NeLF 的話樣本量就是 H*W, 而訓(xùn)練 NeRF 樣本量是 H*W*K (K 是 NeRF 中的一條光線上的采樣點(diǎn)個(gè)數(shù), 在 NeRF 原文中 K=256). 所以, 從 NeRF 到 NeLF 訓(xùn)練樣本量會(huì)變?yōu)樵瓉?lái)的 1/K, 這是很大的縮減。 神經(jīng)網(wǎng)絡(luò)有效, 通常需要有大量的訓(xùn)練數(shù)據(jù)。從 NeRF 變?yōu)?NeLF, 一方面要擬合的目標(biāo)函數(shù)變復(fù)雜了, 同時(shí)樣本量卻減小了, 無(wú)疑雪上加霜. 如何解決這些問題呢? 為了解決上述問題(1), 我們需要用一個(gè)更深的網(wǎng)絡(luò)來(lái)表征更復(fù)雜的函數(shù), 所以在我們的文章中提出了一個(gè) 88 層的深度殘差 MLP (deep residual MLP), 網(wǎng)絡(luò)結(jié)構(gòu)如下:

90c1ad74-16c2-11ed-ba43-dac502259ad0.png

這樣的深層網(wǎng)絡(luò)在之前 NeRF 相關(guān)的工作沒有出現(xiàn)過(guò) (之前的 NeRF 相關(guān)工作大多繼承了原始 NeRF 文章中的網(wǎng)絡(luò)結(jié)構(gòu), 小修小補(bǔ))。為了能讓它訓(xùn)練起來(lái), 我們引入了殘差結(jié)構(gòu)的設(shè)計(jì)。這一點(diǎn)跟 ResNet 的思想一樣, 本身并沒有更多的創(chuàng)新, 但把這一點(diǎn)引入到 NeRF/NeLF 中, 據(jù)我們所知, 本文是第一篇工作。殘差結(jié)構(gòu)的引入很有必要, 因?yàn)樯疃染W(wǎng)絡(luò)沒有殘差結(jié)構(gòu)基本訓(xùn)練不起來(lái), 這一點(diǎn)在文中的消融實(shí)驗(yàn)中也得到了證實(shí)。 另一個(gè)值得注意的創(chuàng)新點(diǎn)是關(guān)于如何表征一條光線。理論上說(shuō), 一條光線用一個(gè)方向向量就可以確定, 但如果真的只用方向向量去表征, 就會(huì)出現(xiàn)上面說(shuō)的 “輸入很接近, 輸出卻可能劇變” 的情況, 這就無(wú)疑會(huì)給 NeLF 網(wǎng)絡(luò)的學(xué)習(xí)帶來(lái)困難。為了使得 NeLF 網(wǎng)絡(luò)要學(xué)習(xí)的函數(shù)更容易一些, 我們需要增強(qiáng)輸入的差別. 具體來(lái)說(shuō), 我們采用一條光線上采樣的多個(gè)點(diǎn)的坐標(biāo) (如下圖所示), 將其串聯(lián)(concat) 起來(lái)成一個(gè)向量, 以此作為該光線的表征, 作為我們 NeLF 網(wǎng)絡(luò)的輸入。

90da5ebe-16c2-11ed-ba43-dac502259ad0.png

這種表征非常簡(jiǎn)單直接, 同時(shí)也很有效。在文中, 我們也展示了它比之前的 NeLF 工作中用到的其他表征 (例如 Plucker 坐標(biāo) [Sitzmann et al, NeurIPS, 2021]) 要更為有效。 為了解決上述問題(2), 我們使用了一個(gè)預(yù)訓(xùn)練好的 NeRF 模型來(lái)產(chǎn)生大量偽數(shù)據(jù) (pseudo data)。具體來(lái)說(shuō), 當(dāng) NeRF 對(duì)一個(gè)場(chǎng)景學(xué)習(xí)完之后, 給定任意一個(gè)角度 (ray direction), NeRF 都能返回這個(gè)角度下的圖片, 我們就把這些圖片收集起來(lái), 形成了很多 (origin, direction, RGB) triplets。這些 triplets 就是訓(xùn)練我們模型的數(shù)據(jù), loss 函數(shù)是 mean squared error (MSE), 如下所示:

90e8e182-16c2-11ed-ba43-dac502259ad0.png

在我們的實(shí)驗(yàn)中, 我們收集了 10k 張圖片, 是原始數(shù)據(jù)集 (大概 100 張圖片) 的 100 倍, 這些數(shù)據(jù)確保了有充足的樣本去訓(xùn)練 NeLF。文中的消融實(shí)驗(yàn)也表明, 大量偽數(shù)據(jù)對(duì)性能至關(guān)重要 (6.9dB PSNR 提升)! 值得一提的是, 如果僅僅是用偽數(shù)據(jù)訓(xùn)練, 我們的模型最優(yōu)也只能復(fù)制 teacher NeRF, 無(wú)法超越它。為了能超越, 我們?cè)谠紙D片上再微調(diào) (Finetune) 一下模型。這個(gè)操作被證明有非常顯著的效果, 使得我們的模型可以顯著超越 teacher NeRF。 實(shí)驗(yàn)效果 總的來(lái)說(shuō), 我們的模型在 NeRF Synthetic 數(shù)據(jù)集 (圖片尺寸 400x400) 上實(shí)現(xiàn)了將近 30x 的加速, 并把 PSNR 大幅提升了 1.4dB, 比同類其他方法更加高效。

91175b0c-16c2-11ed-ba43-dac502259ad0.png

視覺效果圖對(duì)比如下, 可以看到, 相比于 NeRF, 我們的模型 (Ours-2, 即在原始數(shù)據(jù)上微調(diào)后的模型)有肉眼可見的提升, 且計(jì)算量?jī)H僅是 NeRF 的 1/26。

912cf0d4-16c2-11ed-ba43-dac502259ad0.png

更多結(jié)果請(qǐng)參考我們的文章。代碼已經(jīng)開源: https://github.com/snap-research/R2L, 歡迎嘗試! 總結(jié)與未來(lái)工作 本文提出了一種全新的數(shù)據(jù)蒸餾方法來(lái)加速 NeRF: 我們使用訓(xùn)練好的 NeRF 模型產(chǎn)生偽數(shù)據(jù), 來(lái)訓(xùn)練提出的深度殘差 NeLF 網(wǎng)絡(luò)。該 NeLF 網(wǎng)絡(luò)可以達(dá)到超過(guò) NeRF 的渲染質(zhì)量, 且實(shí)現(xiàn)將近 30x 加速, 并維持了存儲(chǔ)小的優(yōu)點(diǎn)。 未來(lái)工作方向: (1) 從 NeRF 中可以得到深度信息, 目前我們還沒提供從 NeLF 網(wǎng)絡(luò)中得到深度信息的方法, 這是不錯(cuò)的探索方向。(2) 如何用更少, 更高質(zhì)量的偽數(shù)據(jù) (譬如進(jìn)行數(shù)據(jù)篩選) 來(lái)加速 NeLF 的訓(xùn)練也非常值得探索。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:ECCV 2022|Snap&東北大學(xué)提出R2L:用數(shù)據(jù)蒸餾加速NeRF

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    中國(guó)科學(xué)院深圳先進(jìn)院:研制一種MXene 電化學(xué)傳感器秒級(jí)精準(zhǔn)檢測(cè)冰毒

    生物傳感器 非法藥物濫用對(duì)公共衛(wèi)生和安全構(gòu)成了全球性挑戰(zhàn),迫切需要可靠的檢測(cè)方法來(lái)遏制販運(yùn)和減輕社會(huì)危害。甲基苯丙胺 (METH) 是一種高度成癮且廣泛傳播的興奮劑,需要緊急監(jiān)測(cè)解決方案
    的頭像 發(fā)表于 01-16 18:11 ?638次閱讀
    中國(guó)科學(xué)院深圳先進(jìn)院:研制<b class='flag-5'>一種</b>MXene 電化學(xué)傳感器秒級(jí)精準(zhǔn)檢測(cè)冰毒

    用于窄帶匹配高速射頻ADC的全新方法

    本期,為大家?guī)?lái)的是《用于窄帶匹配高速射頻 ADC 的全新方法》,介紹了一種用于窄帶匹配高速射頻 ADC 的全新方法,以解決高中間頻率系統(tǒng)中 ADC 前端窄帶匹配的設(shè)計(jì)難題,可在 ADC 額定帶寬內(nèi)應(yīng)用,能提升 ADC 性能、減
    的頭像 發(fā)表于 01-04 15:56 ?7795次閱讀
    用于窄帶匹配高速射頻ADC的<b class='flag-5'>全新方法</b>

    時(shí)鐘移項(xiàng)電路加速模塊的設(shè)計(jì)

    門電路延遲是一種簡(jiǎn)單通用的方法,但是利用邏輯門作延時(shí)的缺點(diǎn)是單個(gè)邏輯門的時(shí)延微乎其微,若需要定的延時(shí)往往需要大量的邏輯門串聯(lián)的形式,信號(hào)的驅(qū)動(dòng)能力減弱,也浪費(fèi)了系統(tǒng)資源。設(shè)計(jì)中采用了鎖相環(huán)的形式,利用
    發(fā)表于 10-29 07:38

    指令集測(cè)試的一種糾錯(cuò)方法

    本文描述在進(jìn)行指令集測(cè)試的一種糾錯(cuò)方法 1.打開測(cè)試指令集對(duì)應(yīng)的dump文件 dump文件是指由匯編文件進(jìn)行反匯編之后,可以供人閱讀指令的反匯編文件。其包含了每條指令的具體操作的信息。指令集測(cè)試
    發(fā)表于 10-24 14:04

    利用e203中NICE協(xié)處理器加速濾波運(yùn)算

    和加法器的方法來(lái)加速濾波運(yùn)算。 使用NICE協(xié)處理器加速的程序?yàn)?b class='flag-5'>一個(gè)長(zhǎng)循環(huán),計(jì)算較長(zhǎng)(100到1000量級(jí))的兩個(gè)浮點(diǎn)數(shù)組乘累加的結(jié)果,分別命名為ifm (Input Feature
    發(fā)表于 10-21 13:40

    基于e203中NICE協(xié)處理器加速濾波運(yùn)算

    和加法器的方法來(lái)加速濾波運(yùn)算。 使用NICE協(xié)處理器加速的程序?yàn)?b class='flag-5'>一個(gè)長(zhǎng)循環(huán),計(jì)算較長(zhǎng)(100到1000量級(jí))的兩個(gè)浮點(diǎn)數(shù)組乘累加的結(jié)果,分別命名為ifm (Input Feature
    發(fā)表于 10-21 09:54

    一種新的無(wú)刷直流電機(jī)反電動(dòng)勢(shì)檢測(cè)方法

    無(wú)位置傳感器無(wú)刷直流電機(jī)的控制算法是近年來(lái)研究的熱點(diǎn)之,有霍爾位置信號(hào)直流電機(jī)根據(jù)霍爾狀態(tài)來(lái)確定通斷功率器件。利用無(wú)刷直流電機(jī)的數(shù)學(xué)模型,根據(jù)反電動(dòng)勢(shì)檢測(cè)原理,提出了一種新的線反電動(dòng)勢(shì)檢測(cè)
    發(fā)表于 08-07 14:29

    一種新的無(wú)刷直流電機(jī)反電動(dòng)勢(shì)檢測(cè)方法

    無(wú)位置傳感器無(wú)刷直流電機(jī)的控制算法是近年來(lái)研究的熱點(diǎn)之,有霍爾位置信號(hào)直流電機(jī)根據(jù)霍爾狀態(tài)來(lái)確定通斷功率器件。利用無(wú)刷直流電機(jī)的數(shù)學(xué)模型,根據(jù)反電動(dòng)勢(shì)檢測(cè)原理,提出了一種新的線反電動(dòng)勢(shì)檢測(cè)
    發(fā)表于 08-04 14:59

    一種無(wú)序超均勻固體器件的網(wǎng)格優(yōu)化方法

    近日,天津大學(xué)精密儀器與光電子工程學(xué)院的光子芯片實(shí)驗(yàn)室研發(fā)了一種無(wú)序超均勻固體器件的網(wǎng)格優(yōu)化方法,成果獲中國(guó)發(fā)明專利(ZL202410659505.2)授權(quán)。
    的頭像 發(fā)表于 07-28 16:10 ?1127次閱讀
    <b class='flag-5'>一種</b>無(wú)序超均勻固體器件的網(wǎng)格優(yōu)化<b class='flag-5'>方法</b>

    電池?zé)峁芾恚菏褂脭?shù)字孿生和多尺度方法來(lái)設(shè)計(jì)和優(yōu)化能源效率

    理系統(tǒng)(BTMS),但同時(shí)也會(huì)增加額外的能源需求。本文介紹了一種多方面方法,不僅可用于開發(fā)和優(yōu)化BTMS,同時(shí)還能平衡電池壽命、快速充電能力、車輛續(xù)航里程和安全性。S
    的頭像 發(fā)表于 07-23 10:50 ?945次閱讀
    電池?zé)峁芾恚菏褂脭?shù)字孿生和多尺度<b class='flag-5'>方法來(lái)</b>設(shè)計(jì)和優(yōu)化能源效率

    漢思新材料取得一種PCB板封裝膠及其制備方法的專利

    漢思新材料取得一種PCB板封裝膠及其制備方法的專利漢思新材料(深圳市漢思新材料科技有限公司)于2023年取得了項(xiàng)關(guān)于PCB板封裝膠及其制備方法的發(fā)明專利(專利號(hào):CN20231015
    的頭像 發(fā)表于 06-27 14:30 ?988次閱讀
    漢思新材料取得<b class='flag-5'>一種</b>PCB板封裝膠及其制備<b class='flag-5'>方法</b>的專利

    ModbusRTU轉(zhuǎn)EtherCAT網(wǎng)關(guān):蒸餾裝置通信提速方案

    在現(xiàn)代工業(yè)自動(dòng)化中,通信協(xié)議扮演著不可或缺的角色,它們負(fù)責(zé)將控制指令和數(shù)據(jù)信息在不同設(shè)備間準(zhǔn)確傳遞。Modbus RTU和EtherCAT是兩廣泛應(yīng)用的工業(yè)通信協(xié)議,各自擁有獨(dú)特的特點(diǎn)與優(yōu)勢(shì)。在常
    的頭像 發(fā)表于 06-26 18:29 ?467次閱讀

    想在rtsmart中使用uart2,是不是只能通過(guò)修改設(shè)備樹方法來(lái)實(shí)現(xiàn)uart2的復(fù)用呀?

    我想在rtsmart中使用uart2,是不是只能通過(guò)修改設(shè)備樹方法來(lái)實(shí)現(xiàn)uart2的復(fù)用呀? 修改設(shè)備樹后如何只編譯設(shè)備樹文件? 編譯生成的文件可以直接替換到廬山派里嗎,具體替換路徑在哪里呀?
    發(fā)表于 06-24 07:04

    一種適用于動(dòng)態(tài)環(huán)境的3DGS-SLAM系統(tǒng)

    當(dāng)前基于神經(jīng)輻射場(chǎng)(NeRF)或3D高斯?jié)姙R(3DGS)的SLAM方法在重建靜態(tài)3D場(chǎng)景方面表現(xiàn)出色,但在動(dòng)態(tài)環(huán)境中的跟蹤和重建方面卻面臨著挑戰(zhàn)。
    的頭像 發(fā)表于 06-13 10:10 ?1635次閱讀
    <b class='flag-5'>一種</b>適用于動(dòng)態(tài)環(huán)境的3DGS-SLAM系統(tǒng)

    NVIDIA GTC巴黎亮點(diǎn):全新Cosmos Predict-2世界基礎(chǔ)模型與CARLA集成加速智能汽車訓(xùn)練

    。這種向使用大模型的過(guò)渡大大增加了對(duì)用于訓(xùn)練、測(cè)試和驗(yàn)證的高質(zhì)量、基于物理學(xué)傳感器數(shù)據(jù)的需求。 為加速代輔助駕駛架構(gòu)的開發(fā),NVIDIA 發(fā)布了?NVIDIA Cosmos Predict-2,這是
    的頭像 發(fā)表于 06-12 10:00 ?1241次閱讀
    竹山县| 磐安县| 松江区| 洞头县| 青铜峡市| 斗六市| 横山县| 甘肃省| 同江市| 海安县| 安康市| 巴林右旗| 昆明市| 保定市| 长春市| 驻马店市| 仁布县| 阿巴嘎旗| 绍兴县| 弥勒县| 越西县| 如东县| 蛟河市| 太仆寺旗| 咸宁市| 定远县| 德阳市| 上蔡县| 宁阳县| 永仁县| 呼伦贝尔市| 林州市| 山阴县| 托克逊县| 贡山| 东阿县| 丽江市| 曲阳县| 奈曼旗| 宜春市| 赤城县|