日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

移動端的實時視頻修復技術

人工智能與大數(shù)據(jù)技術 ? 來源:人工智能與大數(shù)據(jù)技術 ? 作者:人工智能與大數(shù)據(jù) ? 2020-11-23 10:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大變活人,需要幾個步驟?

萬萬沒想到,這么經(jīng)典的大型魔術,現(xiàn)在都能零基礎入門了。

在快手和江蘇衛(wèi)視聯(lián)手打造的「一千零一夜」晚會上,迪麗熱巴就當場表演了一個。

不需要道具,不需要托兒,也不挑時間地點,她就這么在直播鏡頭里blingbling地閃現(xiàn)了。

并且位場的波動,完全沒有破壞背景的完整。(手動狗頭)

最關鍵的是,給你一部安裝了快手的手機,你同樣可以實現(xiàn)。

沒錯,這個能實時實現(xiàn)電影大片里隱身特效的黑科技,就是快手最近上線的AI新玩法——「隱身魔法」。這是結(jié)合單圖圖像修復和幀間圖像對齊技術的視頻修復算法,在短視頻行業(yè)中的首次應用。

不僅能「憑空出現(xiàn)」,對著鏡頭比個「6」,你還能當場變身透明人,跟空氣融為一體。

效果如此絲滑,難怪上線幾天時間,快手用戶就玩得飛起,迅速貢獻了77.5w個相關作品。

一時成為年度短視頻最熱特效玩法。

移動端的實時視頻修復技術

讓視頻里的人實時隱身,怎么個原理?

此前,量子位其實介紹過類似的「隱身」算法,比如弗吉尼亞大學和Facebook聯(lián)手打造的基于光流邊緣引導的視頻修復算法。

雖然有學術領域的前例,但想要把這樣的技術應用到移動端,仍然存在不小的挑戰(zhàn)。

最主要的問題在于計算量,視頻修復涉及到多幀計算,其深度學習模型普遍計算量較大,很難在移動端運行。

那么快手是怎么做到的?量子位照例來一一捋清楚。

其實道理很簡單,想要把畫面中的人抹掉,除了自動把人像摳出來之外,AI還得學會腦補人像遮擋住的真實背景。

這就涉及到兩方面的問題:

初始幀人像區(qū)域的背景修復

后續(xù)相機、人物運動過程中人像區(qū)域的背景填充

為了解決這兩個問題,快手的工程師們將算法整體分成了兩個階段:

首幀使用移動端腦補模型實現(xiàn)對人像區(qū)域的背景填充,后續(xù)幀使用幀間實時跟蹤匹配投影,實現(xiàn)可見背景區(qū)域向人物遮擋區(qū)域的填充。

基于DeepFill的圖像修復算法

首先來看首幀修復。具體到模型架構(gòu)上,快手工程師主要基于開源的DeepFill模型,根據(jù)實際需求進行了定制化開發(fā)和優(yōu)化。

DeepFill是一種基于GAN提出的圖像修復方法,修復能力是醬嬸的:

在此基礎上,快手在整個模型設計中采用coarse to refine雙階段結(jié)構(gòu)。

第一階段,在小尺寸上進行初步修復,利用較少計算量的coarse網(wǎng)絡得到缺失區(qū)域的大概輪廓。

第二階段,將該初步結(jié)果融合到原圖在大尺寸上利用refine網(wǎng)絡生成缺失區(qū)域的細節(jié)。

而為了讓模型能在移動端上更好地部署運行,工程師們還采用剪枝和蒸餾方法進一步壓縮了模型結(jié)構(gòu)。

在算法研發(fā)過程中,工程師還發(fā)現(xiàn),缺失區(qū)域越大,圖像修復結(jié)果越不可控,使用L1損失和GAN損失無法有效的約束修復區(qū)域的結(jié)構(gòu)和語義的合理性。

針對此問題,一方面采用邊界生成聯(lián)合訓練的方法,對邊界這一結(jié)構(gòu)信息進行直接約束,明顯提高了大缺失區(qū)域情況下修復結(jié)果的合理性。另一方面采用多尺度預測的方式對模型中間層的特征進行了約束,有效提升了修復結(jié)果的清晰度。

在損失函數(shù)方面,在訓練中工程師采用了SSIM、Lpips感知損失、PatchGan損失和蒸餾損失,在小模型上也實現(xiàn)良好的圖像修復結(jié)果。

在訓練數(shù)據(jù)方面,快手工程師構(gòu)建了一個包含100W背景圖和10W人像mask的通用圖像修復數(shù)據(jù)集,包含居家、辦公、建筑、風景、虛擬CG等常見環(huán)境。

并且,根據(jù)背景數(shù)據(jù)的紋理復雜度進行了分類,模型訓練過程中隨著網(wǎng)絡逐步收斂,逐漸加大復雜紋理數(shù)據(jù)的比例,使得模型更好地完成從簡單到復雜等多種背景的修復。

一套組合拳下來,測試的結(jié)果如下。從左到右,分別是輸入圖像、邊界預測、腦補結(jié)果和實際背景。

實時跟蹤投影匹配

而在后續(xù)幀的背景修復上,為了更好地利用已有的背景信息,需要將已經(jīng)存在的背景投影到當前幀實現(xiàn)對人像遮擋區(qū)域的修復,即幀間圖像映射。

目前對幀間圖像映射關系的描述主要有三種方式:簡單的全局單應變換,基于柵格的局部單應變換,以及復雜的逐像素的稠密光流。

其中,全局單應變換雖然計算量較小,但無法描述復雜的三維結(jié)構(gòu)映射。

逐像素的稠密光流算法可以得到精確的圖像間可見像素的映射關系,但對于人像區(qū)域內(nèi)未知區(qū)域的修復無法實現(xiàn),另外限于手機平臺計算量的限制,該算法無法滿足實時獲取映射關系的需求。

因此,快手采用基于柵格的局部單應變換的圖像對齊算法,來平衡計算量和精確度之間的關系。通過同時優(yōu)化幀間特征點的光度誤差和柵格的形變誤差,在低計算量的情況下也能得到精準的幀間映射關系,有效地將歷史幀的可見區(qū)域信息實時傳播到當前畫面。

并且,通過調(diào)節(jié)柵格數(shù)量,可以很方便的調(diào)節(jié)算法的計算量和映射的精度,實現(xiàn)多機型的算法適配。

中低端機型都能用,真正麻瓜的「魔法」

其實,對快手的工程師而言,僅僅實現(xiàn)效果是遠遠不夠的。

更重要的一點,是要在移動端硬件種類繁多的情況下,覆蓋高、中、低端各種手機型號,讓每一個檔次的機型的能力都發(fā)揮到最大。

一方面,是因為每一次的產(chǎn)品落地,都關系到4億用戶的實際體驗,牽一發(fā)而動全身。

另一方面,快手的用戶特性決定,用戶手中的手機型號分布會很廣,不同機型算力和內(nèi)存資源差異很大。

而要做到這一點,快手依靠的是自研的YCNN深度學習推理引擎。

CPU來說,無論是蘋果、高通、華為還是聯(lián)發(fā)科的芯片,無論是高端的驍龍865還是低端的驍龍450、430,YCNN引擎都能支持模型在上面運行。同樣,GPU方面,YCNN引擎同時支持Mali、Adreno、Apple和英偉達等多種GPU。NPU方面,蘋果Bionic,華為HiAI,高通SNPE和MTK的APU均在支持范圍之內(nèi)。

同時,YCNN引擎具有完備的模型結(jié)構(gòu)與數(shù)值精度,支持常見的CNN, RNN結(jié)構(gòu),支持float32, float16,uint8等不同精度計算。

為了在更大程度上利用手機算力,YCNN引擎還提供了多種模型,既有針對高算力NPU設計的大模型,有針對高端CPU、GPU設計的級的不同的小模型,也有針對中低端CPU處理器設計的特定小模型。同時,通過模型下發(fā)的方式,將設備上的最好算力與相應的模型進行匹配,以期達到效果與性能的最佳平衡,給用戶帶來最好的體驗。

在推理引擎的優(yōu)化方面,針對不同的設備端,快手的工程師們分別設計了Metal算子、OpenCL算子以及Neon算子等等,有針對性地進行了算子的優(yōu)化,以最大化利用設備性能,提升模型的運算速度。

此外,YCNN引擎具有完善的AI模型工具鏈,支持PyTorch, TF/TFlite模型直接轉(zhuǎn)換為YCNN模型,并支持訓練時模型量化與基于硬件的模型結(jié)構(gòu)搜索。綜合性能比業(yè)界引擎有10%左右的優(yōu)勢。

快手之道

最后,回到AI特效、回到晚會,回到快手本身。

快手的技術和AI特效魔法,之前介紹的也不少。這家依靠短視頻迅速崛起的技術公司,一方面把最新最前沿的技術帶給了更多人,另一方面也通過技術,讓用戶體驗到從「記錄每一種生活」到「擁抱每一種生活」。

但更值得稱道的是,快手之道,更在于面對最前沿技術時的心態(tài)——希望無差別地讓每一個用戶使用,感受技術的樂趣,無論是何種機型,無論信號覆蓋如何。

現(xiàn)在,這種快手之道,在往線下延續(xù),讓線上的用戶有機會登上線下的舞臺,和明星一起亮相,展示自己。從線上到線下,跨越平臺和社區(qū)。

這次快手「九年磨一劍」打造的「一千零一夜」超豪華陣容晚會,就是最直觀的例證。

一方面,快手與江蘇衛(wèi)視攜手,臺網(wǎng)聯(lián)動,在節(jié)目內(nèi)核和呈現(xiàn)形式上實現(xiàn)了大小屏的深度融合。不只是實時隱身特效,還有黃渤跟周杰倫的低延時連麥、虛擬技術加持下的F4隔空同臺等黑科技,都給觀眾帶來了新的觀賞體驗。

另一方面,從明星陣容上就可以看出快手的號召力在增強,星素同臺的晚會形式,形成了快手獨有的文化IP。

數(shù)據(jù)同樣也佐證了這一點。據(jù)悉,這場晚會快手官方直播間觀看總?cè)藬?shù)達9008萬,直播間互動總量達1.34億次,最高同時在線人數(shù)達315萬,預約直播總?cè)藬?shù)達到3100萬。

如此巨大的流量和關注度,無疑也是一場技術價值觀的科普。

在舞臺之上,有明星大咖和快手達人的跨界合作;舞臺之下,快手也踏踏實實遵循提升用戶體驗、創(chuàng)造用戶價值的技術信仰,使得陽春白雪和下里巴人的種種「人間煙火」,都能通過AI技術這樣的前沿科技為生活增添色彩。

這是理性科技之外的那一面:用奇幻科技,打破人間藩籬。

之前有句「老話」,說科技是麻瓜的魔法。

但比起這種魔法,打造魔法本身的工程師、讓魔法真正無差別應用的工程師,不易于被推至鎂光燈下,但依然值得掌聲和褒獎。

你還能舉出其他的「魔法」案例嗎?

最后的最后,開發(fā)該特效的技術團隊是快手Y-tech團隊,這里也特別傳送一下:

這支團隊致力于計算機視覺、計算機圖形學、機器學習、AR/VR 等領域的技術創(chuàng)新和業(yè)務落地,不斷探索新技術與新用戶體驗的最佳結(jié)合點。目前 Y-tech 在北京、深圳、杭州、Seattle、Palo Alto 有研發(fā)團隊,大部分成員來自于國際知名公司和大學。

責任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 視頻
    +關注

    關注

    6

    文章

    2014

    瀏覽量

    75199
  • Facebook
    +關注

    關注

    3

    文章

    1432

    瀏覽量

    59385
  • 深度學習
    +關注

    關注

    73

    文章

    5610

    瀏覽量

    124656

原文標題:分分鐘擁有哈利波特的隱身衣,還是在手機端的那種

文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數(shù)據(jù)技術】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    FEC前向糾錯技術:讓無線傳輸“自我修復”的通信衛(wèi)士

    通信或實時傳輸場景,無需請求重傳即可保障數(shù)據(jù)的完整性與可靠性,是提升無線通信、廣播及存儲系統(tǒng)穩(wěn)定性的關鍵技術之一。 二、三大核心特點 1. 自主糾錯,無需重傳 接收可基于冗余信息直接修復
    發(fā)表于 04-09 10:10

    FEC前向糾錯技術:讓無線傳輸“自我修復”的通信衛(wèi)士

    通信或實時傳輸場景,無需請求重傳即可保障數(shù)據(jù)的完整性與可靠性,是提升無線通信、廣播及存儲系統(tǒng)穩(wěn)定性的關鍵技術之一。二、三大核心特點1. 自主糾錯,無需重傳接收可基于冗余信息直接修復
    發(fā)表于 03-27 15:51

    內(nèi)孔堆焊激光熔覆修復加工:重塑工業(yè)修復的科技標桿?

     在工業(yè)設備高負荷、極端工況的長期運轉(zhuǎn)中,內(nèi)孔作為齒輪軸、閥座、缸套等關鍵零部件的核心承載結(jié)構(gòu),常面臨磨損、腐蝕、沖蝕及疲勞裂紋等多重損傷。傳統(tǒng)修復技術(如電弧堆焊、電鍍、噴涂)要么存在熱影響區(qū)
    發(fā)表于 03-24 14:36

    TECNO與Arm攜手推動移動實時生成式AI

    Arm 始終堅信,人工智能 (AI) 及其所帶來的價值,理應惠及更廣泛的人群。這一理念正引領 AI 邁入全新發(fā)展階段 —— 更具個性化、即時可用,并越來越多地在側(cè)運行。
    的頭像 發(fā)表于 03-11 10:31 ?484次閱讀

    鎢管激光熔覆修復技術的核心原理及優(yōu)勢

    大、結(jié)合強度低、材料浪費嚴重等問題。而激光熔覆技術作為一種先進的表面工程方法,為鎢管修復提供了全新的解決方案。   一、鎢管激光熔覆修復技術的核心原理   鎢管激光熔覆
    發(fā)表于 01-14 14:24

    FEC前向糾錯技術:讓無線傳輸“自我修復”的通信衛(wèi)士

    通信或實時傳輸場景,無需請求重傳即可保障數(shù)據(jù)的完整性與可靠性,是提升無線通信、廣播及存儲系統(tǒng)穩(wěn)定性的關鍵技術之一。二、三大核心特點1. 自主糾錯,無需重傳接收可基于冗余信息直接修復
    發(fā)表于 01-09 14:12

    Flutter 移動開發(fā):集成淘寶 API 實現(xiàn)商品數(shù)據(jù)實時展示 APP

    在電商蓬勃發(fā)展的當下,移動購物成為主流趨勢。對于開發(fā)者而言,利用 Flutter 構(gòu)建一個能夠實時展示淘寶商品數(shù)據(jù)的 APP,既能滿足用戶便捷獲取商品信息的需求,也能為電商業(yè)務拓展新的渠道
    的頭像 發(fā)表于 11-13 09:36 ?528次閱讀

    常用Web 實時通信技術:原理+選型,一篇通關

    在 Web 開發(fā)中,實時通信技術的核心目標是實現(xiàn)客戶(Browser)與服務器之間低延遲、雙向 / 單向的動態(tài)數(shù)據(jù)交互,而非傳統(tǒng) HTTP 的 “請求 - 響應” 模式。以下是 Web
    的頭像 發(fā)表于 10-27 17:19 ?1156次閱讀
    常用Web <b class='flag-5'>實時</b>通信<b class='flag-5'>技術</b>:原理+選型,一篇通關

    全新Arm C1 CPU集群推動移動側(cè)AI轉(zhuǎn)型

    隨著用戶期待在不連接云端服務的情況下,能在移動設備上享有更好的即時響應、更智能的個性化服務,更加實時處理的體驗,使其正迅速成為人工智能 (AI) 的強大載體。與此同時,隨著移動 AI
    的頭像 發(fā)表于 09-15 14:27 ?2322次閱讀
    全新Arm C1 CPU集群推動<b class='flag-5'>移動</b><b class='flag-5'>端</b>側(cè)AI轉(zhuǎn)型

    負載減少50%!Arm用AI重新定義移動圖形渲染

    電子發(fā)燒友網(wǎng)報道(文 / 吳子鵬)在移動互聯(lián)網(wǎng)與游戲產(chǎn)業(yè)深度融合的當下,用戶對移動游戲體驗的期待持續(xù)攀升 —— 更清晰的畫質(zhì)、更流暢的幀率、更長的續(xù)航能力。然而,要在移動
    發(fā)表于 08-20 08:00 ?4181次閱讀
    負載減少50%!Arm用AI重新定義<b class='flag-5'>移動</b><b class='flag-5'>端</b>圖形渲染

    微信小程序API集成京東庫存,移動銷量暴漲!

    。本文將探討如何通過微信小程序API集成京東庫存系統(tǒng),實現(xiàn)實時數(shù)據(jù)同步,并最終推動移動銷量實現(xiàn)顯著增長。我們將一步步分析集成過程、核心優(yōu)勢,以及實際案例中的效果。 什么是微信小程序API與京東庫存集成? 微信小程序
    的頭像 發(fā)表于 07-31 14:07 ?1000次閱讀

    降低電視液晶屏修復線的信號延遲及液晶線路修光修復

    摘要 針對電視液晶屏修復過程中信號延遲導致的修復效率下降及液晶線路損傷問題,本文提出一種基于硬件結(jié)構(gòu)優(yōu)化與激光修復技術的綜合解決方案。通過重構(gòu)修復
    的頭像 發(fā)表于 05-30 09:53 ?876次閱讀
    降低電視液晶屏<b class='flag-5'>修復</b>線的信號延遲及液晶線路修光<b class='flag-5'>修復</b>

    Arm 公司面向移動市場的 ?Arm Lumex? 深度解讀

    子系統(tǒng)(CSS)? ? 在移動的落地形態(tài),Lumex 旨在通過高度集成化的軟硬件方案,解決移動設備在 AI 性能、能效比與開發(fā)效率上的挑戰(zhàn)。以下從技術架構(gòu)、性能突破、應用場景、生態(tài)系
    的頭像 發(fā)表于 05-29 09:54 ?4612次閱讀

    堆焊過程熔池相機實時缺陷檢測技術

    在現(xiàn)代工業(yè)制造中,堆焊技術廣泛應用于機械、能源、化工、航空航天等領域,用于修復磨損部件或增強工件表面性能。然而,傳統(tǒng)堆焊過程的質(zhì)量控制主要依賴人工經(jīng)驗或焊后檢測,難以實現(xiàn)實時監(jiān)控,導致缺陷發(fā)現(xiàn)滯后
    的頭像 發(fā)表于 05-15 17:34 ?948次閱讀
    堆焊過程熔池相機<b class='flag-5'>實時</b>缺陷檢測<b class='flag-5'>技術</b>

    降低液晶面板修復線的信號延遲及液晶線路修光修復

    引言 在液晶面板生產(chǎn)與修復過程中,修復線的信號延遲會嚴重影響修復效率與質(zhì)量,同時液晶線路的損傷也需要有效的修復手段。研究降低信號延遲的方法以及液晶線路修光
    的頭像 發(fā)表于 05-12 15:17 ?916次閱讀
    降低液晶面板<b class='flag-5'>修復</b>線的信號延遲及液晶線路修光<b class='flag-5'>修復</b>
    常熟市| 平遥县| 南平市| 广丰县| 饶阳县| 井陉县| 古丈县| 永吉县| 甘孜| 民权县| 荣昌县| 栾城县| 会泽县| 拉孜县| 疏附县| 汽车| 江川县| 湘阴县| 建昌县| 和顺县| 聂拉木县| 张家川| 巫山县| 栾城县| 仁怀市| 章丘市| 防城港市| 洞口县| 依兰县| 阜平县| 岚皋县| 融水| 富锦市| 娱乐| 仪陇县| 雷山县| 盐亭县| 济阳县| 鄢陵县| 甘孜| 巩留县|