日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

鏡像翻轉的圖像,能不變?

算法與數(shù)據(jù)結構 ? 來源:算法與數(shù)據(jù)結構 ? 2020-08-03 16:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在訓練神經網(wǎng)絡的時候,經常會出現(xiàn)「缺數(shù)據(jù)」的情況。

這時候,就需要「數(shù)據(jù)增強」來獲取更多數(shù)據(jù)。而近幾年,鏡像反轉成了最為常用的方法之一。

轉一次,獲得2倍數(shù)據(jù),真香!

然而,事情卻沒有想像中的那么簡單——當翻轉了數(shù)據(jù)集里所有的圖片時,神經網(wǎng)絡所擬合的函數(shù),還能代表原先的圖像分布么?

針對這一問題,來自康奈爾大學的研究員,首次挑戰(zhàn)了常規(guī)神經網(wǎng)絡訓練中,圖片「翻轉不變性」(flip-invariant) 的這一假設。

研究的題目叫做視覺手性(Visual Chirality),并在CVPR 2020中獲得了最佳論文提名。

注:手性的定義為「一個物體無法與其鏡像相重合」。「視覺手性」一詞啟發(fā)自手性,意指「計算機視覺領域中圖像分布與其鏡像分布的區(qū)別」。

而該研究的一作,是此屆CVPR大會上年紀最小的獲獎者,年僅21歲的華人科研新秀——林之秋。

這項研究在多種領域(人臉,互聯(lián)網(wǎng)圖片,數(shù)字處理圖像)上利用卷積神經網(wǎng)絡,發(fā)現(xiàn)了許多常人難以捕捉的「視覺手性」線索。

通過自監(jiān)督訓練,在多項數(shù)據(jù)集上達到了60%,甚至到90%的精度。

鏡像翻轉的圖像,能不變?

為了理解這一鏡像翻轉話題,我們先來看下這樣的一個例子:

在上面這張圖中,你能判斷出哪些圖像被翻轉了嗎?答案如下:

圖一:鏡像翻轉(線索:文字)。我們可以很容易看出來文字被翻轉過了。

圖二:沒有翻轉(線索:紐扣)。男士襯衫的紐扣一般位于身體右側。

圖三:鏡像翻轉(線索:吉他)。吉他手的主手應當在吉他右側。

鏡像翻轉對于人類而言并沒有多少區(qū)別(如圖二和圖三),因而難以判斷。

然而,神經網(wǎng)絡卻可以通過自監(jiān)督訓練的方法在這個任務上達到非常高的精度,并能指出圖片中哪些區(qū)域可以被用于識別鏡像翻轉。

手性代表著單個圖片的翻轉不對稱性,而視覺手性(Visual Chirality)則是針對圖像分布所定義的翻轉不對稱性。

當一個圖像分布具備視覺手性時,使用鏡像翻轉作為數(shù)據(jù)增強方法,將不可避免的改變一個數(shù)據(jù)集所代表的分布。

換句話說,只有當一個圖像分布不具備視覺手性的時候,才能在不改變原先圖像分布的前提下,使用鏡像翻轉來增強數(shù)據(jù)集。

然而,視覺手性是大部分視覺領域都擁有的屬性。正如此篇文章作者,谷歌AI科學家Noah Snavely教授所說:

在計算機視覺的研究中,我們常把這個世界視為”翻轉不變“的,鏡像翻轉因而是一個常規(guī)的數(shù)據(jù)增強方法。

然而,當你翻轉圖片后,文字將被顛倒,左手變?yōu)橛沂?,而螺旋意大利面也將朝相反方向旋轉。

那么,這項研究又是如何挑戰(zhàn)了,人們先前在計算機視覺中,對于「翻轉不變性」假設的呢?

實驗過程

這項研究利用了自監(jiān)督學習方法來訓練卷積神經網(wǎng)絡。

對于任何一個數(shù)據(jù)集,只需要將其原有的圖片標記為「無翻轉」,并將鏡像翻轉過的圖片標記為「有翻轉」,即可訓練神經網(wǎng)絡識別鏡像翻轉這個二分類任務(binary classification)。

同時,可以根據(jù)神經網(wǎng)絡在驗證集的表現(xiàn),來評估這一圖像分布是否具備視覺手性:

如果驗證集上的精度要顯著大于50%,便有充足的證據(jù)來證明視覺手性的存在。

這項研究利用了ResNet-50作為基本的網(wǎng)絡結構,并使用SGD方法來訓練網(wǎng)絡。

為了了解神經網(wǎng)絡學到了哪些視覺手性線索,研究人員利用了類激活映射(CAM:Class Activation Map)方法,在原有圖片上對于視覺手性敏感的區(qū)域進行了高亮。

同時因為能造成視覺手性的現(xiàn)象有很多,研究人員還推出了一個簡單的基于類激活映射的聚類方法——手性特征聚類(Chiral Feature Clustering)。

在互聯(lián)網(wǎng)圖片集上,神經網(wǎng)絡在鏡像翻轉識別上取得了高達60%-80%的精度。

研究人員在Instagram圖片集上進行了手性特征聚類,并挑選了一系列與人們生活相關的典型視覺手性現(xiàn)象進行討論。

手機:對著鏡子自拍是人們最愛做的事。此類照片具有視覺手性,因為手機的攝像頭一般固定在手機背面的一側(因品牌而異),同時由于多數(shù)人是右撇子,一般都以右手持手機進行自拍。

吉他:幾乎大多數(shù)的吉他手都以右手撥弦,左手持把。

手表:手表一般都被帶在人們的右手側。

為了深入了解人臉的視覺手性現(xiàn)象,研究人員在人臉數(shù)據(jù)集上進行了孤立訓練。

在Flickr-Faces-HQ (FFHQ)人臉數(shù)據(jù)集上進行了訓練,并在測試集上取得了高達81%的精度,還利用手性特征聚類對人臉中的視覺手性現(xiàn)象進行了初步的探討:

劉海分界處:人們一般用右手來分理劉海,這會導致劉海的朝向向一側偏移,并出現(xiàn)視覺手性現(xiàn)象。

眼睛:人們在看向物體時傾向于用一只主視眼進行瞄準,這樣會導致人們的目光在進行拍攝時出現(xiàn)偏移。多數(shù)人的主視眼為右眼,而這一現(xiàn)象可能是導致視覺手性現(xiàn)象的成因。

胡子:與頭發(fā)一樣,可能與人們習慣于用右手理胡子有關。

文中對以上的視覺手性現(xiàn)象的討論均為初步的分析,而人臉中任有大量的視覺手性線索值得被發(fā)掘。

除此之外,研究人員還對數(shù)字圖像處理過程(例如去馬賽克和圖片壓縮)中產生的視覺手性現(xiàn)象進行了分析。

舉個例子,當研究人員首次利用神經網(wǎng)絡,在Instagram數(shù)據(jù)集上進行自監(jiān)督訓練時,發(fā)現(xiàn)沒有使用隨機剪裁(random cropping)的神經網(wǎng)絡。

但在部分圖片上,類激活映射所得到的熱圖更著重關注圖片的邊緣部分,如下圖所示:

而在使用隨機剪裁之后,研究人員得到的新的熱圖,則更關注來自于圖片中物體本身的線索。

研究人員提出:當數(shù)字圖像處理過程和鏡像翻轉不具備「交換律」時,視覺手性將會憑空產生在一個圖像分布上。

作者通過概率論與群論(group theory),對此假設進行了嚴謹?shù)臄?shù)學論證,并通過神經網(wǎng)絡實驗驗證了這一現(xiàn)象在互聯(lián)網(wǎng)圖片中廣泛存在。

而此類的線索往往不能被肉眼可見,卻在圖片中存在固定的模式,因而為圖像識偽的應用創(chuàng)造了可能性。

98年華人科學新秀

這項研究的第一作者,是98年生的華人科學新秀——林之秋。

林之秋17歲便考入美國“常春藤”盟?!的螤柎髮W,而這也是他「開掛人生」的開始。

林之秋僅用兩年時間就全部修完計算機和數(shù)學兩個專業(yè)的本科課程,并從大二開始選修博士課程,同時跟隨計算機系的教授從事科研工作。

他在多項專業(yè)課上,例如多元微積分、線性代數(shù)、高等抽象代數(shù)、人工智能、計算機操作系統(tǒng)等都取得過第一名。

由于成績極為優(yōu)異,自大二起林之秋就接受計算機系里邀請,以助教身份給高年級同學講課,為康奈爾科技學院編寫碩士生的預修課程,甚至在高階機器學習課上給博士生的試卷打分。

而這篇「CVPR 2020最佳論文提名」的研究,是林之秋從大二就開始著手準備的項目,這也顯示了他「超級大學霸」的真實實力。

如今,本科畢業(yè)的林之秋,總成績在學院數(shù)千名學生中名列前三,并受院長邀請在畢業(yè)典禮上代表學院舉旗。之后,他即將前往卡內基梅隆機器人學院,攻讀計算機視覺博士學位。

在此,也預祝林之秋同學,能夠在科研的道路上,繼續(xù)乘風破浪!

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經網(wǎng)絡

    關注

    42

    文章

    4844

    瀏覽量

    108212
  • 函數(shù)
    +關注

    關注

    3

    文章

    4422

    瀏覽量

    67878
  • 計算機視覺
    +關注

    關注

    9

    文章

    1716

    瀏覽量

    47735

原文標題:21歲華人本科生,憑什么拿下CVPR 2020最佳論文提名?

文章出處:【微信號:TheAlgorithm,微信公眾號:算法與數(shù)據(jù)結構】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    格科威GALAXY CORE AI8663 CSP CMOS Image Sensor 參數(shù)

    與接口線性模式滿幀幀率60fpsHDR 模式滿幀幀率30fps數(shù)據(jù)接口MIPI輸出格式RAW10、RAW8功能支持支持功能幀同步、開窗、鏡像翻轉、2×2 合并、OTP溫度參數(shù)工作溫度-30~85℃圖像
    發(fā)表于 04-30 11:53

    請問從哪里獲得 Debian 鏡像

    我昨天交付了 VisionFive 2,所以今天我想開始設置它。 在論壇中,我讀到這里有 Debian 鏡像: https://debian.starfivetech.com 此頁面列出了百度云盤
    發(fā)表于 03-23 08:16

    使用Dockerfile構建鏡像的詳細步驟

    Dockerfile寫得好不好,直接影響三件事:鏡像大小、構建速度、運行安全性。我見過太多團隊的Dockerfile是"能跑就行"的水平——基礎鏡像用ubuntu:latest
    的頭像 發(fā)表于 02-26 09:43 ?436次閱讀

    深入解析U-Boot image.c:RK平臺鏡像處理核心邏輯

    在瑞芯微(RK)平臺的嵌入式開發(fā)中,U-Boot作為核心的啟動加載程序,負責完成鏡像解析、校驗、加載等關鍵流程。而image.c正是U-Boot中處理鏡像(uImage)的核心文件,尤其針對RK平臺
    的頭像 發(fā)表于 02-24 16:46 ?1855次閱讀
    深入解析U-Boot image.c:RK平臺<b class='flag-5'>鏡像</b>處理核心邏輯

    無法從eMMC啟動最新Debian鏡像怎么解決?

    如題,我可以從MicroSD啟動最新(202405)的Debian鏡像,但是如果改為使用eMMC啟動eMMC鏡像
    發(fā)表于 02-04 07:02

    如何在Zynq UltraScale+ MPSoC平臺上通過JTAG啟動嵌入式Linux鏡像

    在之前文章中,我們介紹了如何使用 XSCT 工具通過 JTAG 在 Zynq SoC 上啟動嵌入式 Linux 鏡像(從 JTAG 啟動 Zynq-7000 嵌入式 Linux:使用 XSCT 全
    的頭像 發(fā)表于 01-13 11:45 ?5096次閱讀

    EspeedGrab圖像采集軟件介紹(Cameralink轉USB采集)

    時序 設置好tap數(shù),可自動識別分辨率等信息 15 中心十字絲 可設置中心十字絲,輔助光學調試 16 等分網(wǎng)格線 可設置等分虛線網(wǎng)格,輔助畫面內容分析 17 鏡像、翻轉 圖像可設置上下鏡像
    發(fā)表于 12-23 17:26

    IQ混頻器為何能抑制鏡像頻率

    → 負頻率分量(相位翻轉 180°) 3. 數(shù)字域的簡單“相消”實現(xiàn) ? 取共軛即可讓鏡像分量相消: ??Z_corrected = Z – conj(Z_mirror)??(實際常用 Hilbert
    發(fā)表于 09-08 09:43

    Docker鏡像構建與管理指南

    凌晨2點,生產環(huán)境突然告警,新部署的容器啟動失敗。排查后發(fā)現(xiàn):開發(fā)環(huán)境用的鏡像800MB,生產環(huán)境的卻有3.2GB,里面塞滿了編譯工具、測試數(shù)據(jù),甚至還有開發(fā)同學的 SSH 私鑰...
    的頭像 發(fā)表于 09-02 16:37 ?1460次閱讀

    如何調試USB Type-C不正確的翻轉設置

    USB-C是一個雙向(正反插)連接器,插頭可以任意方向連接,無論是正插還是反插,對用戶沒有明顯的功能影響。這帶來的一個結果就是,PCB走線和重定時器引腳到高速差分對的映射取決于連接器的方向。在正插時對應TX1的走線,在連接器翻轉時對應TX2。
    的頭像 發(fā)表于 07-15 14:01 ?2431次閱讀
    如何調試USB Type-C不正確的<b class='flag-5'>翻轉</b>設置

    【Milk-V Duo S 開發(fā)板免費體驗】1-開箱和燒寫鏡像

    包裝之后,可以看到小巧的開發(fā)板上緊湊地排列了各種外設。 鏡像燒寫 DuoS在Github上提供了各種鏡像文件。 不知道為什么原因,我試了多種鏡像,最后發(fā)現(xiàn)只有2.0的RISC-V鏡像
    發(fā)表于 07-02 20:42

    【Milk-V Duo S 開發(fā)板免費體驗】鏡像燒錄與開箱上電

    /H.265 視頻壓縮解碼和 ISP 能力。 支持 HDR 寬動態(tài)、3D 降噪、去霧、鏡頭畸變校正等多種圖像增強和校正算法,為客戶提供專業(yè)級的視頻圖像質量。 該芯片還集成了內部 TPU,在 INT8 運算
    發(fā)表于 06-30 19:19

    K230 V3.0使用Mipi顯示屏無法顯示圖像怎么解決?

    圖像 使用hdmi的例程,hdmi顯示屏顯示的圖像 全是紫色畫面 供電正常兩根usb線,網(wǎng)上也去找了一些其它人的代碼 也都試過了 也是不行, 這是鏡像的問題 還是說硬件問題?
    發(fā)表于 06-04 07:17

    cypress3014 obs輸出的畫面跟實際圖像顛倒了,怎么解決?

    你好,請問obs輸出的畫面跟實際圖像顛倒了,把obs里面的垂直翻轉勾選上圖像正常,在程序里應該怎么修改,在哪里
    發(fā)表于 05-09 06:03

    Allegro Skill布局功能之整體模塊鏡像介紹

    使用“整體鏡像”功能可以實現(xiàn)快速、批量、多元素的鏡像操作,此功能可以將整個模塊電路快速鏡像,包括電路中的走線、銅皮、字符等,有便捷方便的操作方式,例如下文演示。 1、在菜單欄中點擊“FanySkill-布局-整體
    的頭像 發(fā)表于 05-08 16:42 ?2652次閱讀
    Allegro Skill布局功能之整體模塊<b class='flag-5'>鏡像</b>介紹
    吐鲁番市| 天峨县| 株洲县| 永顺县| 乐陵市| 喀什市| 宜兰县| 南岸区| 石狮市| 沙湾县| 攀枝花市| 定安县| 大石桥市| 河北区| 浮梁县| 万全县| 鸡泽县| 德安县| 当雄县| 宽甸| 望江县| 会理县| 曲靖市| 余干县| 三门县| 玉环县| 辽中县| 青铜峡市| 招远市| 南投市| 万载县| 枝江市| 德格县| 延吉市| 喜德县| 高平市| 肥东县| 台北市| 武鸣县| 曲阜市| 岗巴县|