日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

我快閉嘴 ? 來源:愛集微 ? 作者:嘉德IPR ? 2020-12-24 12:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌發(fā)明的由2D圖像生成3D圖像的技術(shù),利用3D估計(jì)神經(jīng)網(wǎng)絡(luò)圖像信息的補(bǔ)全以及預(yù)測,融合了拍攝角度、光照等信息,讓生成的3D圖像看起來更加逼真,這種技術(shù)對于三維建模以及工業(yè)應(yīng)用都具有極大的指導(dǎo)意義。

谷歌研究人員制作的一個AI工具,可以把涂鴉變成奇怪的怪物。這款工具名為Chimera Painter,使用機(jī)器學(xué)習(xí)來根據(jù)用戶的粗略草圖生成圖像。

Chimera Painter背后的團(tuán)隊(duì)在一篇博客文章中解釋了他們的方法和動機(jī),稱他們的想法是創(chuàng)造一種 “畫筆,它的行為不像工具,而更像助手”。Chimera Painter只是一個原型,但如果這樣的軟件變得普遍,它可以減少創(chuàng)造高質(zhì)量藝術(shù)所需的時(shí)間。

這種圖像生成技術(shù),其實(shí)在三維渲染方面有著非常廣泛的應(yīng)用,其中最具有代表性的工作之一,就是由2D圖像生成3D圖像。我們知道,3D圖像相比于2D圖像多了深度信息這一個維度,但也就是這一個差別,導(dǎo)致了3D圖像相比于2D圖像所多出的信息不是一星半點(diǎn)。因此,倘若想要從2D圖像生成3D圖像,其難度之大可想而知。

為此,谷歌在18年10月18日申請了一項(xiàng)名為“通過渲染許多3D視圖來學(xué)習(xí)重構(gòu)3D形狀”的發(fā)明專利(申請?zhí)枺?01880030823.5),申請人為谷歌有限責(zé)任公司。

根據(jù)該專利目前公開的資料,讓我們一起來看看這項(xiàng)從2D圖像到3D圖像的生成方法吧。

谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

該技術(shù)中,主要使用了3D估計(jì)器神經(jīng)網(wǎng)絡(luò),如上圖,為使用3D估計(jì)器神經(jīng)網(wǎng)絡(luò)來估計(jì)圖像中描繪的面部的3D形狀和紋理,并基于估計(jì)的3D形狀和紋理生成替身的系統(tǒng)示意圖。用戶通過上傳面部圖像105,系統(tǒng)100可以對照片進(jìn)行處理后生成替身115,這里所說的替身也就是用戶的3D畫像。

在具體的過程中,照片首先由面部識別引擎110進(jìn)行處理,從而生成用戶的面部圖像特征112,該特征在3D估計(jì)神經(jīng)網(wǎng)絡(luò)中被處理,基于圖像特征估計(jì)照片中描繪的用戶面部的3D形狀和紋理,從而生成形狀紋理數(shù)據(jù)122。

最后,數(shù)據(jù)122被發(fā)送到3D渲染引擎130中,基于用戶獨(dú)特的面部形狀、紋理特征來生成用戶的3D畫像,并且為了做到更加真實(shí),渲染引擎可以給出特定的視圖,視圖中融合了相機(jī)角度、光照以及視場的估計(jì)信息,可以讓生成的圖像質(zhì)量更加逼真。

谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

如上圖,為用于用戶3D渲染圖像生成的3D估計(jì)器神經(jīng)網(wǎng)絡(luò)220的系統(tǒng)框圖,整個系統(tǒng)的結(jié)構(gòu)還是相當(dāng)復(fù)雜的,從圖中我們可以看到這種神經(jīng)網(wǎng)絡(luò)是如何工作的。根據(jù)目前的技術(shù)來看,訓(xùn)練3D估計(jì)器神經(jīng)網(wǎng)絡(luò)通常有兩個困難:第一,由3D對象的圖像和那些3D對象的3D形狀和紋理組成的訓(xùn)練對通常是有限的并且難以獲得;第二,訓(xùn)練3D估計(jì)器神經(jīng)網(wǎng)絡(luò)可能經(jīng)常導(dǎo)致3D估計(jì)器神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)欺騙。

因此,該專利發(fā)明的整個網(wǎng)絡(luò)分為了監(jiān)督訓(xùn)練回路以及無監(jiān)督訓(xùn)練回路,通過二者相結(jié)合的方式,在完全訓(xùn)練階段期間,僅利用無監(jiān)督訓(xùn)練回路,從而允許估計(jì)神經(jīng)網(wǎng)絡(luò)輸出更快地收斂。

因?yàn)闊o監(jiān)督訓(xùn)練回路可以在預(yù)訓(xùn)練階段和完全訓(xùn)練階段兩者期間使用,所以從無監(jiān)督訓(xùn)練回路開始,在預(yù)訓(xùn)練之后,完全訓(xùn)練可以對大量迭代和大量樣本單獨(dú)利用無監(jiān)督訓(xùn)練回路,來改進(jìn)3D估計(jì)神經(jīng)網(wǎng)絡(luò)估計(jì)圖像中的對象的3D形狀和紋理的能力。

谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

最后,是這種無監(jiān)督訓(xùn)練回路訓(xùn)練的流程圖,系統(tǒng)首先需要獲取對象圖像的第一圖像特征,該特征就是上述所說用戶面部信息的原始數(shù)據(jù),其次,將這種第一圖像特征提供給3D估計(jì)器神經(jīng)網(wǎng)絡(luò)并獲取3D形狀和紋理。

根據(jù)這些形狀和紋理進(jìn)行3D渲染,并從多個3D視圖中導(dǎo)出第二圖像特征,基于圖像特征的損失函數(shù)計(jì)算損失,以知道神經(jīng)網(wǎng)絡(luò)進(jìn)行反向傳播以得到更加良好的效果以及減少圖像生成的損失。

以上就是谷歌發(fā)明的利用2D圖像生成3D圖像的專利技術(shù),從2D到3D圖像的轉(zhuǎn)換過程中,由于2D圖像缺少了很多信息,因此該技術(shù)利用3D估計(jì)神經(jīng)網(wǎng)絡(luò)進(jìn)行信息的補(bǔ)全以及預(yù)測,并融合了拍攝角度、光照等信息,讓生成的3D圖像看起來更加逼真,這種技術(shù)對于三維建模以及工業(yè)應(yīng)用都具有極大的指導(dǎo)意義。

關(guān)于嘉德

深圳市嘉德知識產(chǎn)權(quán)服務(wù)有限公司由曾在華為等世界500強(qiáng)企業(yè)工作多年的知識產(chǎn)權(quán)專家、律師、專利代理人組成,熟悉中歐美知識產(chǎn)權(quán)法律理論和實(shí)務(wù),在全球知識產(chǎn)權(quán)申請、布局、訴訟、許可談判、交易、運(yùn)營、標(biāo)準(zhǔn)專利協(xié)同創(chuàng)造、專利池建設(shè)、展會知識產(chǎn)權(quán)、跨境電商知識產(chǎn)權(quán)、知識產(chǎn)權(quán)海關(guān)保護(hù)等方面擁有豐富的經(jīng)驗(yàn)。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    3024

    瀏覽量

    115619
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6259

    瀏覽量

    111996
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4844

    瀏覽量

    108203
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    倍加?;陔p目視覺技術(shù)的SmartRunner 3D傳感器介紹

    當(dāng)我們邁入自動化的“三維時(shí)代”,SmartRunner Explorer 3D不僅能生成清晰的2D圖像,還可輸出高精度的3D點(diǎn)云數(shù)據(jù)。
    的頭像 發(fā)表于 04-08 10:39 ?361次閱讀
    倍加?;陔p目視覺<b class='flag-5'>技術(shù)</b>的SmartRunner <b class='flag-5'>3D</b>傳感器介紹

    XS5018C:高性能2D/3D降噪ISP-TX 2K芯片電路圖資料

    HDcctv/CVBS, 支持多種制式 960H/720P/960P/1080P, ISP 最高支持 1080P@30FPS, 高性能 2D 降噪、 3D 降噪, 支持無極降幀。
    發(fā)表于 01-28 16:50 ?0次下載

    2D、2.5D3D封裝技術(shù)的區(qū)別與應(yīng)用解析

    半導(dǎo)體封裝技術(shù)的發(fā)展始終遵循著摩爾定律的延伸與超越。當(dāng)制程工藝逼近物理極限,先進(jìn)封裝技術(shù)成為延續(xù)芯片性能提升的關(guān)鍵路徑。本文將從技術(shù)原理、典型結(jié)構(gòu)和應(yīng)用場景三個維度,系統(tǒng)剖析2D、2.
    的頭像 發(fā)表于 01-15 07:40 ?1274次閱讀
    <b class='flag-5'>2D</b>、2.5<b class='flag-5'>D</b>與<b class='flag-5'>3D</b>封裝<b class='flag-5'>技術(shù)</b>的區(qū)別與應(yīng)用<b class='flag-5'>解析</b>

    2025 3D機(jī)器視覺的發(fā)展趨勢

    迭代與應(yīng)用拓展成為市場的主要推動力:·技術(shù)升級:視覺系統(tǒng)從單一任務(wù)的2D相機(jī)向多功能3D相機(jī)進(jìn)化。過去用2D相機(jī)完成單一任務(wù),如今用戶更愿意為能自動化多流程的
    的頭像 發(fā)表于 12-10 17:25 ?1429次閱讀
    2025 <b class='flag-5'>3D</b>機(jī)器視覺的發(fā)展趨勢

    Vitrox的v510i系列的3D AOI光學(xué)檢測設(shè)備

    V510i部署在SMT生產(chǎn)線的 貼片機(jī)之后、回流焊爐之前或之后 ,主要用于檢測貼裝好的電子元件是否存在缺陷。其核心任務(wù)是: 3D2D復(fù)合檢測 :同時(shí)利用3D輪廓信息和2D彩色
    的頭像 發(fā)表于 12-04 09:27 ?983次閱讀

    淺談2D封裝,2.5D封裝,3D封裝各有什么區(qū)別?

    集成電路封裝技術(shù)2D3D的演進(jìn),是一場從平面鋪開到垂直堆疊、從延遲到高效、從低密度到超高集成的革命。以下是這三者的詳細(xì)分析:
    的頭像 發(fā)表于 12-03 09:13 ?1402次閱讀

    玩轉(zhuǎn) KiCad 3D模型的使用

    時(shí)間都在與 2D 的焊盤、走線和絲印打交道。但一個完整的產(chǎn)品,終究是要走向物理世界的。元器件的高度、接插件的朝向、與外殼的配合,這些都是 2D 視圖難以表達(dá)的。 幸運(yùn)的是,KiCad 提供了強(qiáng)大的 3D 可視化功能。它不僅能讓你
    的頭像 發(fā)表于 09-16 19:21 ?1.2w次閱讀
    玩轉(zhuǎn) KiCad <b class='flag-5'>3D</b>模型的使用

    TMAG5170D-Q1 3D線性霍爾效應(yīng)傳感器技術(shù)解析與應(yīng)用指南

    ,每個芯片均可獨(dú)立配置,包含帶溫漂補(bǔ)償?shù)臏囟葯z測功能。該器件支持多種測量類型,包括1D線性、2D角度、3D操縱桿和磁性閾值交叉應(yīng)用。
    的頭像 發(fā)表于 09-06 13:45 ?1526次閱讀
    TMAG5170<b class='flag-5'>D</b>-Q1 <b class='flag-5'>3D</b>線性霍爾效應(yīng)傳感器<b class='flag-5'>技術(shù)</b><b class='flag-5'>解析</b>與應(yīng)用指南

    iTOF技術(shù),多樣化的3D視覺應(yīng)用

    視覺傳感器對于機(jī)器信息獲取至關(guān)重要,正在從二維(2D)發(fā)展到三維(3D),在某些方面模仿并超越人類的視覺能力,從而推動創(chuàng)新應(yīng)用。3D 視覺解決方案大致分為立體視覺、結(jié)構(gòu)光和飛行時(shí)間 (TOF)
    發(fā)表于 09-05 07:24

    意法半導(dǎo)體圖像傳感器的崛起之路

    從Yole提供的數(shù)據(jù)我們可以看到,攝像頭傳感圖像傳感器在未來大有可為。手機(jī)、工業(yè)以及汽車等應(yīng)用是目前2D成像所關(guān)注的主要市場,成像技術(shù)也正在圍繞這些市場實(shí)現(xiàn)有機(jī)增長。與此同時(shí),3D深度
    的頭像 發(fā)表于 08-01 09:44 ?1731次閱讀

    TechWiz LCD 3D應(yīng)用:FFS仿真

    建模任務(wù) 堆棧結(jié)構(gòu) 建模過程 2.1使用TechWiz Layout繪制各層掩模版平面圖 2.2創(chuàng)建堆棧結(jié)構(gòu),并生成3D結(jié)構(gòu) 2.3 使用TechWiz LCD 3D進(jìn)行各項(xiàng)參數(shù)計(jì)算 3
    的頭像 發(fā)表于 07-14 14:08 ?939次閱讀
    TechWiz LCD <b class='flag-5'>3D</b>應(yīng)用:FFS仿真

    X-ray設(shè)備2D/3D檢測金屬材料及零部件裂紋異物的缺陷

    在高端制造領(lǐng)域,金屬材料及零部件的內(nèi)部質(zhì)量直接關(guān)系到產(chǎn)品性能與安全性。X-ray設(shè)備憑借其獨(dú)特的穿透成像能力,成為檢測裂紋、異物等缺陷的關(guān)鍵工具,而2D/3D檢測技術(shù)的結(jié)合,更將檢測精度與效率提升
    的頭像 發(fā)表于 06-27 17:23 ?1423次閱讀
    X-ray設(shè)備<b class='flag-5'>2D</b>/<b class='flag-5'>3D</b>檢測金屬材料及零部件裂紋異物的缺陷

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    我們所說的局部摩擦是指給液晶盒中不同區(qū)域(可自定義區(qū)域)進(jìn)行不同的液晶配向,所以也可以稱之為局部掩膜、局部配向等。TechWiz LCD 2D和TechWiz LCD 3D都可以對液晶盒設(shè)置局部摩擦
    發(fā)表于 06-16 08:46

    利用NVIDIA 3D引導(dǎo)生成式AI Blueprint控制圖像生成

    AI 賦能的圖像生成技術(shù)突飛猛進(jìn),從早期模型會生成手指過多的人類圖像,到現(xiàn)在能創(chuàng)造出令人驚嘆的逼真視覺效果。即使取得了如此飛躍,仍然存在一個
    的頭像 發(fā)表于 06-05 09:24 ?1032次閱讀

    告別漫長等待! 3D測量竟然可以如此的絲滑

    據(jù)進(jìn)行實(shí)時(shí)處理,快速得到全視角的彩色高精度2D圖像3D點(diǎn)云。產(chǎn)品優(yōu)勢01高精度的在線3D檢測采用業(yè)界頂級的CMOS感光元件和超低畸變遠(yuǎn)心光學(xué)系統(tǒng),一次拍攝就可以得
    的頭像 發(fā)表于 05-12 18:01 ?780次閱讀
    告別漫長等待! <b class='flag-5'>3D</b>測量竟然可以如此的絲滑
    长武县| 西城区| 措美县| 民勤县| 麻栗坡县| 精河县| 大城县| 治县。| 盐源县| 锡林郭勒盟| 启东市| 营口市| 上虞市| 邹平县| 华坪县| 西林县| 山阴县| 西乌| 犍为县| 四会市| 钟山县| 惠东县| 海阳市| 澎湖县| 兴城市| 格尔木市| 明溪县| 湖南省| 宁陕县| 崇州市| 天津市| 永宁县| 舞钢市| 航空| 吴川市| 新余市| 满洲里市| 天等县| 涿鹿县| 淮安市| 河曲县|