日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

上線一周就2.1k star!單張圖像直接轉(zhuǎn)為3D模型!

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-11-06 16:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

0. 筆者個人體會

提問:給你一張2D圖像,要求獲得完整的三維模型,你會怎么做?

我第一反應(yīng)是拿SolidWorks自己畫一個~

最近就看到了這樣的一項(xiàng)開源工作Wonder3D,可以直接從2D圖像生成3D模型,感覺很神奇。讀了讀文章,發(fā)現(xiàn)這項(xiàng)工作是基于擴(kuò)散模型實(shí)現(xiàn)的,這里也不得不感嘆擴(kuò)散模型確實(shí)在AI繪畫和圖像生成領(lǐng)域有無限前景。今天筆者也將帶領(lǐng)讀者閱讀一下這項(xiàng)工作,當(dāng)然筆者水平有限,如果有理解不當(dāng)?shù)牡胤綒g迎大家一起探討,共同學(xué)習(xí)。

1. 效果展示

Wonder3D僅需2~3分鐘即可從單視圖圖像重建高細(xì)節(jié)紋理網(wǎng)格。Wonder3D首先通過跨域擴(kuò)散模型生成一致的多視法線圖與相應(yīng)的彩色圖像,然后利用一種法線融合方法來實(shí)現(xiàn)快速和高質(zhì)量的重建。這里也推薦「3D視覺工坊」新課程《徹底搞透視覺三維重建:原理剖析、代碼講解、及優(yōu)化改進(jìn)》。

9a83467a-7c55-11ee-939d-92fbcf53809c.png

對不同風(fēng)格的圖像也都適用。

9ab04418-7c55-11ee-939d-92fbcf53809c.png

甚至對各種小動物也適用:

9ad1c6c4-7c55-11ee-939d-92fbcf53809c.png

代碼已經(jīng)開源了,而且他們的官方主頁還放上了Live Demo的鏈接,感興趣的讀者可以上傳自己的圖像來嘗試,下面展示一下筆者自己的測試結(jié)果。

原始圖像:

9aff0fda-7c55-11ee-939d-92fbcf53809c.png

生成的多視角圖像:

9b1ee09e-7c55-11ee-939d-92fbcf53809c.png

2. 摘要

在這篇文章中,我們介紹了Wonder3D,一種從單視圖圖像中高效生成高保真紋理網(wǎng)格的新方法。基于分?jǐn)?shù)蒸餾采樣(SDS)的最近方法已經(jīng)顯示出從2D擴(kuò)散先驗(yàn)恢復(fù)3D幾何形狀的潛力,但是它們通常遭受每個形狀優(yōu)化的耗時和不一致的幾何形狀。相比之下,某些作品通過快速網(wǎng)絡(luò)推理直接產(chǎn)生3D信息,但其結(jié)果通常質(zhì)量較低且缺乏幾何細(xì)節(jié)。為了從整體上提高圖像到3D任務(wù)的質(zhì)量、一致性和效率,我們提出了一種跨域擴(kuò)散模型來生成多視圖法線貼圖和相應(yīng)的彩色圖像。為了確保一致性,我們采用了一種多視圖跨域關(guān)注機(jī)制,該機(jī)制有助于跨視圖和模態(tài)的信息交換。最后,我們介紹了一種幾何感知法向融合算法,從多視圖2D表示中提取高質(zhì)量的表面。我們的大量評估表明,與先前的工作相比,我們的方法實(shí)現(xiàn)了高質(zhì)量的重建結(jié)果、魯棒的泛化以及相當(dāng)好的效率。

3. 算法解析

先讓我們重新審視一下這個問題:

給定單張圖像,繪制其三維模型。

傳統(tǒng)方法會怎么做呢?

使用SLAM或SfM?單張圖像做初始化都不夠。

使用MVS方法?沒有多視角圖像就沒有視差圖。

用NeRF?最吃數(shù)據(jù)了,視角大一點(diǎn)都不行。

直接訓(xùn)模型學(xué)習(xí)?思路上可以,實(shí)操起來效果非常差。

這個任務(wù)本身就非常反人類,因?yàn)橹挥幸粋€視角,沒有先驗(yàn)信息誰也不知道完整的三維模型長什么樣。

那怎么做呢?

這篇文章的思路很巧妙,沒有像NeRF那樣直接從2D圖像生成3D模型,而是先用擴(kuò)散模型生成多個視角的2D圖像和法線圖,再融合生成3D模型。

這么做有啥好處呢?

最大的好處就是可以直接利用Stable Diffusion這種經(jīng)過數(shù)十億張圖像訓(xùn)練過的2D擴(kuò)散模型,實(shí)際上相當(dāng)于引入了非常強(qiáng)的先驗(yàn)信息。而且法線圖可以表征物體的起伏和表面幾何信息,進(jìn)而計(jì)算3D模型的高保真幾何元素。

這樣,整個任務(wù)就變?yōu)榱私⒁粋€馬爾科夫鏈,然后從中采樣顏色和法線信息的過程。

9b3eb0ea-7c55-11ee-939d-92fbcf53809c.png

其中p代表高斯噪聲,n代表法線圖,x代表RGB圖,K代表圖像數(shù)量。

不太對,擴(kuò)散模型只能處理一個域,怎么出來RGB和法線兩個域了?

的確是這樣,最直觀的改動思路就是給擴(kuò)散模型添加一個頭,重新訓(xùn)練模型,直接輸出RGB和法線信息,這也是前兩年多任務(wù)網(wǎng)絡(luò)的常用做法。但是實(shí)際操作過程中會發(fā)現(xiàn)收斂很慢,而且泛化性差。

另一個思路是直接訓(xùn)練兩個擴(kuò)散模型,但這樣不光增加了計(jì)算量,還會導(dǎo)致性能下降。

Wonder3D的做法是設(shè)計(jì)了一個域轉(zhuǎn)換器(Domain Switcher),實(shí)際上是一個標(biāo)注域信息的一維向量。域轉(zhuǎn)換器先做位置編碼,聚合時間embedding信息,再把它也輸送給擴(kuò)散模型,就可以讓擴(kuò)散模型同時處理兩個域的信息。

這一點(diǎn)可以先放一個定性對比圖來觀察:

9b6268be-7c55-11ee-939d-92fbcf53809c.png

還有問題,RGB和法線是獨(dú)立生成的,多視角的RGB圖也未必就幾何一致。

在這里,Wonder3D引入了一個注意力機(jī)制,分別處理多個時間RGB幾何不一致的問題,以及RGB和法線圖的關(guān)聯(lián)問題。

9b89c260-7c55-11ee-939d-92fbcf53809c.png

到這里,Wonder3D具體的Pipeline就出來了:

輸入一幅圖像,Wonder3D取原始圖像、CLIP產(chǎn)生的文本embedding、多視角相機(jī)參數(shù),以及一個域轉(zhuǎn)換器作為條件,生成一致的多視點(diǎn)法線圖和彩色圖。隨后,Wonder3D借助法線融合算法,將2D表征重建為高質(zhì)量的3D幾何圖形,產(chǎn)生高保真的紋理網(wǎng)格。

9bacc684-7c55-11ee-939d-92fbcf53809c.png

最后再看看這個幾何融合是怎么做的:

Wonder3D是優(yōu)化神經(jīng)隱式SDF場,來從匹配的RGB和法線圖中提取完整的三維信息。

剛才不是說NeRF需要稠密的圖像序列嗎?

如果直接做NeRF-SDF重建的話,誤差非常大,并且會一直累計(jì)下去。Wonder3D的做法是引入了一系列損失函數(shù)來約束優(yōu)化:

9bd8ef98-7c55-11ee-939d-92fbcf53809c.png

4. 實(shí)驗(yàn)

訓(xùn)練數(shù)據(jù)集是LVIS子集,batch size是512,在8塊A800上訓(xùn)練了3天(果然普通人還是玩不起)。從2D圖像生成3D模型的方法還是用的Instant NGP(論NeRF在各個領(lǐng)域的入侵haaaaa)。評估使用Google Scanned Object數(shù)據(jù)集。評估指標(biāo)方面,3D重建用Chamfer Distances (CD)和Volume IoU,生成圖像質(zhì)量用PSNR、SSIM、LPIPS這幾個常見指標(biāo)。對比的方案也都是目前的SOTA,包括Zero123、RealFusion、Magic123、One-2-3-45、Point-E、Shap-E、SyncDreamer這些。

新視點(diǎn)合成對比,Zero 123缺乏多視圖一致性,SyncDreamer對輸入圖像的仰角比較敏感,但是Wonder3D生成具有語義一致性和幾何一致性的圖像。這里也推薦「3D視覺工坊」新課程《徹底搞透視覺三維重建:原理剖析、代碼講解、及優(yōu)化改進(jìn)》。

9bef031e-7c55-11ee-939d-92fbcf53809c.png

新視點(diǎn)合成的定量對比。

9c122376-7c55-11ee-939d-92fbcf53809c.png

3D重建質(zhì)量的對比,Shape-E的重建結(jié)果不完整且扭曲。SyncDreamer的重建結(jié)生成圖像大致對齊,但紋理質(zhì)量不好。相比之下Wonder3D實(shí)現(xiàn)幾何和紋理上最高的重建質(zhì)量。

9c29a032-7c55-11ee-939d-92fbcf53809c.png

3D重建的定量對比。

9c650bf4-7c55-11ee-939d-92fbcf53809c.png

最后3D生成模型中各項(xiàng)損失函數(shù)的消融實(shí)驗(yàn),驗(yàn)證損失函數(shù)的必要性:

9c88a91a-7c55-11ee-939d-92fbcf53809c.png

還是一個消融實(shí)驗(yàn),驗(yàn)證多視圖幾何一致性和RGB-法線對其的注意力機(jī)制的作用:

9caa1fbe-7c55-11ee-939d-92fbcf53809c.png

5. 總結(jié)

本文為各位讀者介紹了Wonder3D,可以從單張圖像直接生成完整的三維模型,整個模型的設(shè)計(jì)思路很巧妙,而且也開源。渲染速度也達(dá)到了2~3分鐘,這項(xiàng)工作的應(yīng)用也很廣泛,建圖、VR、AR、動畫、影視等等都可以用。感覺Wonder3D還是很神奇的,有點(diǎn)長見識了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    3024

    瀏覽量

    115653
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42451
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3835

    瀏覽量

    52293

原文標(biāo)題:上線一周就2.1k star!單張圖像直接轉(zhuǎn)為3D模型!

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    315曝光GEO黑產(chǎn):3000元起“投毒” AI大模型,一周見效

    異化為 “數(shù)據(jù)投毒” 工具,通過系統(tǒng)性投放虛假信息,操控 AI 大模型的推薦結(jié)果,讓虛構(gòu)產(chǎn)品成為 AI 口中的 “標(biāo)準(zhǔn)答案”。 ? 并且,這樣的行為被明碼標(biāo)價(jià):“3000 元起,一周見效,主流 AI 大模型里,你的產(chǎn)品能穩(wěn)坐前三
    的頭像 發(fā)表于 03-17 13:38 ?7668次閱讀

    價(jià)值20萬的機(jī)器人做大獎!創(chuàng)想三維攜手智元,加速3D打印破圈

    。此次大賽的最高獎項(xiàng)直接拉高了賽道的獎勵天花板—— 臺價(jià)值超過20萬元的智元靈犀X2(人人造版本)機(jī)器人及臺創(chuàng)想三維K2 Pro Combo旗艦
    的頭像 發(fā)表于 04-20 09:03 ?150次閱讀
    價(jià)值20萬的機(jī)器人做大獎!創(chuàng)想三維攜手智元,加速<b class='flag-5'>3D</b>打印破圈

    百度文心衍生模型PaddleOCR登頂GitHub Star OCR全球第

    3月30日,百度文心衍生模型PaddleOCR在GitHub上的Star數(shù)突破73.3K,超越谷歌Tesseract OCR,成為全球Star
    的頭像 發(fā)表于 03-31 11:40 ?507次閱讀

    如何快速查找工業(yè)部件的 3D CAD 模型

    工程師都從這里開始,這是有道理的。如果您知道零件編號并信任該品牌,就直接從源頭開始。許多制造商都會提供經(jīng)過認(rèn)證的 3D CAD 模型,這些模型與生產(chǎn)幾何形狀完全匹配。CAD 下載通常位
    發(fā)表于 03-04 16:22

    技術(shù)資訊 I 圖文詳解 Allegro X PCB Designer 中的 3D 模型映射

    本文要點(diǎn)面對市面上的切要將PCB板放進(jìn)個盒子里的產(chǎn)品的設(shè)計(jì)都離不開3D模型映射這個功能,3D協(xié)同設(shè)計(jì)保證了產(chǎn)品的超薄化、高集成度的生命線
    的頭像 發(fā)表于 10-17 16:16 ?2075次閱讀
    技術(shù)資訊 I 圖文詳解 Allegro X PCB Designer 中的 <b class='flag-5'>3D</b> <b class='flag-5'>模型</b>映射

    玩轉(zhuǎn) KiCad 3D模型的使用

    “ ?本文將帶您學(xué)習(xí)如何將 3D 模型與封裝關(guān)聯(lián)、文件嵌入,講解 3D 查看器中的光線追蹤,以及如何使用 CLI 生成 PCBA 的 3D 模型
    的頭像 發(fā)表于 09-16 19:21 ?1.2w次閱讀
    玩轉(zhuǎn) KiCad <b class='flag-5'>3D</b><b class='flag-5'>模型</b>的使用

    3Dfindit上發(fā)布世嘉智尼的上萬個3D CAD模型,優(yōu)化用戶設(shè)計(jì)流程

    :“上線初期,我們期待通過下載量和優(yōu)質(zhì)銷售線索獲得直接反饋。與此同時,我們的營銷團(tuán)隊(duì)正著手借助 CADENAS 的網(wǎng)頁組件,將這些 3D 模型嵌入到公司官網(wǎng)中。” 借助CADENAS和
    發(fā)表于 08-27 15:44

    Gagne公司免費(fèi)3D CAD工程波紋管模型下載

    波紋管的3D CAD模型,以便在項(xiàng)目中使用。該工具由CADENAS打造,采用eCATALOG 3Dfindit技術(shù),用戶可即時訪問100多種格式的原始CAD文件。 在線配置器可指導(dǎo)用戶選擇正確的波紋管類型
    發(fā)表于 08-13 14:44

    TechWiz LCD 3D應(yīng)用:FFS仿真

    建模任務(wù) 堆棧結(jié)構(gòu) 建模過程 2.1使用TechWiz Layout繪制各層掩模版平面圖 2.2創(chuàng)建堆棧結(jié)構(gòu),并生成3D結(jié)構(gòu) 2.3 使用TechWiz LCD 3D進(jìn)行各項(xiàng)參數(shù)計(jì)算 3
    的頭像 發(fā)表于 07-14 14:08 ?964次閱讀
    TechWiz LCD <b class='flag-5'>3D</b>應(yīng)用:FFS仿真

    文件嵌入詳解():在PCB封裝庫中嵌入3D模型

    “ ?從 KiCad 9 開始,就可以在封裝中嵌入 STEP 3D 模型,而不只是簡單的關(guān)聯(lián)。這樣在復(fù)制封裝、3D庫或路徑發(fā)生變化時就不用再次重新關(guān)聯(lián)了。? ” ? 文件嵌入 從 KiCad 9
    的頭像 發(fā)表于 07-08 11:16 ?3122次閱讀
    文件嵌入詳解(<b class='flag-5'>一</b>):在PCB封裝庫中嵌入<b class='flag-5'>3D</b><b class='flag-5'>模型</b>

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    ,本案例使用TechWiz LCD 3D進(jìn)行局部摩擦的設(shè)置。 1. 建模任務(wù) 1.1進(jìn)行局部摩擦配置 2. 建模過程 以下是建模過程中部分重要步驟的說明 2.1在TechWiz Layout中創(chuàng)建結(jié)構(gòu)
    發(fā)表于 06-16 08:46

    UFI濾清器液壓系統(tǒng)公司(UFI Filter Hydraulics)3D零部件產(chǎn)品數(shù)據(jù)庫

    工作量,從而為工程師和設(shè)計(jì)師的工作提供支持。該數(shù)據(jù)平臺可通過公司網(wǎng)站和CADENAS的3Dfindit訪問,使尋找理想的濾清器解決方案變得更簡單、更直接。其優(yōu)勢包括: 可在全球范圍內(nèi)訪問3D
    發(fā)表于 05-28 14:10

    3D AD庫文件

    3D庫文件
    發(fā)表于 05-28 13:57 ?6次下載

    答疑 | 3D打印的模型能當(dāng)日常餐具使用嗎?這安全嗎?

    有些愛好3D打印的朋友好奇地咨詢過個問題:3D打印的餐具能拿來裝水吃飯嗎?會不會有毒啊?這安全嗎? JLC3D小編直接敲黑板:別急著用!材
    發(fā)表于 05-20 11:43

    TechWiz LCD 3D應(yīng)用:撓曲電效用仿真

    完成后在TechWiz LCD 3D中加載并進(jìn)行相關(guān)參數(shù)設(shè)置 2.2在TechWiz LCD 3D軟件中開啟應(yīng)用撓曲電效應(yīng)的功能 2.3其它設(shè)置 液晶設(shè)置 電壓條件設(shè)置 光學(xué)分析部分,添加偏振片 結(jié)果查看 3.1 V-T曲線 3.2 結(jié)果對比
    發(fā)表于 05-14 08:55
    承德市| 贺兰县| 邵阳县| 咸丰县| 远安县| 抚宁县| 拉萨市| 杭州市| 乌拉特前旗| 繁峙县| 波密县| 麻城市| 虹口区| 花莲市| 桃源县| 渭南市| 寿阳县| 休宁县| 拉萨市| 海原县| 琼中| 集贤县| 襄城县| 琼结县| 东源县| 荣昌县| 唐海县| 奉化市| 平原县| 来宾市| 石屏县| 尼玛县| 松潘县| 娄底市| 武隆县| 梅河口市| 辉南县| 施秉县| 顺昌县| 黔西县| 宜章县|