日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

基于基本圖像處理技術(shù)的數(shù)據(jù)增強方法

深度學習自然語言處理 ? 來源:賽爾實驗室 ? 作者:賽爾實驗室 ? 2022-08-13 10:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

什么是數(shù)據(jù)增強

數(shù)據(jù)增強(Data Augmentation)是一種通過讓有限的數(shù)據(jù)產(chǎn)生更多的等價數(shù)據(jù)來人工擴展訓練數(shù)據(jù)集的技術(shù)。它是克服訓練數(shù)據(jù)不足的有效手段,目前在深度學習的各個領域中應用廣泛。但是由于生成的數(shù)據(jù)與真實數(shù)據(jù)之間的差異,也不可避免地帶來了噪聲問題。

為什么需要數(shù)據(jù)增強

深度神經(jīng)網(wǎng)絡在許多任務中表現(xiàn)良好,但這些網(wǎng)絡通常需要大量數(shù)據(jù)才能避免過度擬合。遺憾的是,許多場景無法獲得大量數(shù)據(jù),例如醫(yī)學圖像分析。數(shù)據(jù)增強技術(shù)的存在是為了解決這個問題,這是針對有限數(shù)據(jù)問題的解決方案。數(shù)據(jù)增強一套技術(shù),可提高訓練數(shù)據(jù)集的大小和質(zhì)量,以便您可以使用它們來構(gòu)建更好的深度學習模型。在計算視覺領域,生成增強圖像相對容易。即使引入噪聲或裁剪圖像的一部分,模型仍可以對圖像進行分類,數(shù)據(jù)增強有一系列簡單有效的方法可供選擇,有一些機器學習庫來進行計算視覺領域的數(shù)據(jù)增強,比如:imgaug(https://github.com/aleju/imgaug)它封裝了很多數(shù)據(jù)增強算法,給開發(fā)者提供了方便。但是在自然語言處理領域中,由于自然語言本身是離散的抽象符號,微小的變化就可能會導致含義的巨大偏差,所以數(shù)據(jù)增強算法并不常用。很多自然語言處理任務在真正落地的時候,往往會遇到數(shù)據(jù)量不足的問題,自然語言的數(shù)據(jù)增強算法值得我們深入研究。接下來我們先介紹計算視覺領域的數(shù)據(jù)增強方法,再介紹自然語言處理領域的數(shù)據(jù)增強算法,希望能對大家有所啟發(fā)。

計算視覺數(shù)據(jù)增強

計算視覺領域的數(shù)據(jù)增強算法大致可以分為兩類:第一類是基于基本圖像處理技術(shù)的數(shù)據(jù)增強,第二個類別是基于深度學習的數(shù)據(jù)增強算法。


下面先介紹基于基本圖像處理技術(shù)的數(shù)據(jù)增強方法:

幾何變換(Geometric Transformations):由于訓練集與測試集合中可能存在潛在的位置偏差,使得模型在測試集中很難達到訓練集中的效果,幾何變換可以有效地克服訓練數(shù)據(jù)中存在的位置偏差,而且易于實現(xiàn),許多圖像處理庫都包含這個功能。

顏色變換(Color Space):圖片在輸入計算機之前,通常會被編碼為張量(高度×寬度×顏色通道),所以可以在色彩通道空間進行數(shù)據(jù)增強,比如將某種顏色通道關閉,或者改變亮度值。

旋轉(zhuǎn) | 反射變換(Rotation/Reflection):選擇一個角度,左右旋轉(zhuǎn)圖像,可以改變圖像內(nèi)容朝向。關于旋轉(zhuǎn)角度需要慎重考慮,角度太大或者太小都不合適,適宜的角度是1度 到 20度。

噪聲注入(Noise Injection):從高斯分布中采樣出的隨機值矩陣加入到圖像的RGB像素中,通過向圖像添加噪點可以幫助CNN學習更強大的功能。

內(nèi)核過濾器(Kernel Filters):內(nèi)核濾鏡是在圖像處理中一種非常流行的技術(shù),比如銳化和模糊。將特定功能的內(nèi)核濾鏡與圖像進行卷積操作,就可以得到增強后的數(shù)據(jù)。直觀上,數(shù)據(jù)增強生成的圖像可能會使得模型面對這種類型的圖像具有更高的魯棒性。

混合圖像(Mix):通過平均圖像像素值將圖像混合在一起是一種非常違反直覺的數(shù)據(jù)增強方法。對于人來說,混合圖像生成的數(shù)據(jù)似乎沒有意義。雖然這種方法缺乏可解釋性,但是作為一種簡單有效的數(shù)據(jù)增強算法,有一系列的工作進行相關的研究。Inoue在圖像每個像素點混合像素值來混合圖像,Summers和Dinneen又嘗試以非線性的方法來混合圖像,Takahashi和Matsubara通過隨機圖像裁剪和拼接來混合圖像,以及后來的mixup方法均取得了不錯的成果。

隨機擦除(Random Erasing):隨機擦除是Zhong等人開發(fā)的數(shù)據(jù)增強技術(shù)。他們受到Dropout機制的啟發(fā),隨機選取圖片中的一部分,將這部分圖片刪除,這項技術(shù)可以提高模型在圖片被部分遮擋的情況下性能,除此之外還可以確保網(wǎng)絡關注整個圖像,而不只是其中的一部分。

縮放變換(Zoom):圖像按照一定的比例進行放大和縮小并不改變圖像中的內(nèi)容,可以增加模型的泛化性能。

移動(Translation):向左,向右,向上或向下移動圖像可以避免數(shù)據(jù)中的位置偏差,比如在人臉識別數(shù)據(jù)集合中,如果所有圖像都居中,使用這種數(shù)據(jù)增強方法可以避免可能出現(xiàn)的位置偏差導致的錯誤。

翻轉(zhuǎn)變換(Flipping):通常是關于水平或者豎直的軸進行圖像翻轉(zhuǎn)操作,這種擴充是最容易實現(xiàn)的擴充,并且已經(jīng)證明對ImageNet數(shù)據(jù)集有效。

裁剪(Cropping):如果輸入數(shù)據(jù)集合的大小是變化的,裁剪可以作為數(shù)據(jù)預處理的一個手段,通過裁剪圖像的中央色塊,可以得到新的數(shù)據(jù)。在實際使用過程之中,這些數(shù)據(jù)增強算法不是只使用一種,而是使用一套數(shù)據(jù)增強策略,在AutoAugment這篇文章中,作者嘗試讓模型自動選擇數(shù)據(jù)增強策略。

d370ce78-1a84-11ed-ba43-dac502259ad0.jpg

第二個類別是基于深度學習的數(shù)據(jù)增強算法:

特征空間增強(Feature Space Augmentation):神經(jīng)網(wǎng)絡可以將圖像這種高維向量映射為低維向量,之前討論的所有圖像數(shù)據(jù)增強方法都應用于輸入空間中的圖像?,F(xiàn)在可以在特征空間進行數(shù)據(jù)增強操作,例如:SMOTE算法,它是一種流行的增強方法,通過將k個最近的鄰居合并以形成新實例來緩解類不平衡問題。

對抗生成(Adversarial Training):對抗攻擊表明,圖像表示的健壯性遠不及預期的健壯性,Moosavi-Dezfooli等人充分證明了這一點。對抗生成可以改善學習的決策邊界中的薄弱環(huán)節(jié),提高模型的魯棒性。

基于GAN的數(shù)據(jù)增強(GAN-based Data Augmentation):使用 GAN 生成模型來生成更多的數(shù)據(jù),可用作解決類別不平衡問題的過采樣技術(shù)。

神經(jīng)風格轉(zhuǎn)換(Neural Style Transfer):通過神經(jīng)網(wǎng)絡風格遷移來生成不同風格的數(shù)據(jù),防止模型過擬合。

如果想要閱讀更多的細節(jié),請參考這篇文章:

https://link.springer.com/article/10.1186/s40537-019-0197-0

自然語言處理數(shù)據(jù)增強

在自然語言處理領域,被驗證為有效的數(shù)據(jù)增強算法相對要少很多,下面我們介紹幾種常見方法。

同義詞詞典(Thesaurus):Zhang Xiang等人提出了Character-level Convolutional Networks for Text Classification,通過實驗,他們發(fā)現(xiàn)可以將單詞替換為它的同義詞進行數(shù)據(jù)增強,這種同義詞替換的方法可以在很短的時間內(nèi)生成大量的數(shù)據(jù)。

隨機插入(Randomly Insert):隨機選擇一個單詞,選擇它的一個同義詞,插入原句子中的隨機位置,舉一個例子:“我愛中國” —> “喜歡我愛中國”。

隨機交換(Randomly Swap):隨機選擇一對單詞,交換位置。

隨機刪除(Randomly Delete):隨機刪除句子中的單詞。

語法樹結(jié)構(gòu)替換:通過語法樹結(jié)構(gòu),精準地替換單詞。

加噪(NoiseMix) (https://github.com/noisemix/noisemix):類似于圖像領域的加噪,NoiseMix提供9種單詞級別和2種句子級別的擾動來生成更多的句子,例如:這是一本很棒的書,但是他們的運送太慢了。->這是本很棒的書,但是運送太慢了。

情境增強(Contextual Augmentation):這種數(shù)據(jù)增強算法是用于文本分類任務的獨立領域的數(shù)據(jù)擴充。通過用標簽條件的雙向語言模型預測的其他單詞替換單詞,可以增強監(jiān)督數(shù)據(jù)集中的文本。

生成對抗網(wǎng)絡:利用生成對抗網(wǎng)絡的方法來生成和原數(shù)據(jù)同分布的數(shù)據(jù),來制造更多的數(shù)據(jù)。在自然語言處理領域,有很多關于生成對抗網(wǎng)絡的工作:

Generating Text via Adversarial Training

GANS for Sequences of Discrete Elements with the Gumbel-softmax Distribution

SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

回譯技術(shù)(Back Translation):回譯技術(shù)是NLP在機器翻譯中經(jīng)常使用的一個數(shù)據(jù)增強的方法。其本質(zhì)就是快速產(chǎn)生一些翻譯結(jié)果達到增加數(shù)據(jù)的目的?;刈g的方法可以增加文本數(shù)據(jù)的多樣性,相比替換詞來說,有時可以改變句法結(jié)構(gòu)等,并保留語義信息。但是,回譯的方法產(chǎn)生的數(shù)據(jù)嚴重依賴于翻譯的質(zhì)量。

擴句-縮句-句法:先將句子壓縮,得到句子的縮寫,然后再擴寫,通過這種方法生成的句子和原句子具有相似的結(jié)構(gòu),但是可能會帶來語義信息的損失。

無監(jiān)督數(shù)據(jù)擴增(Unsupervised Data Augmentation):通常的數(shù)據(jù)增強算法都是為有監(jiān)督任務服務,這個方法是針對無監(jiān)督學習任務進行數(shù)據(jù)增強的算法,UDA方法生成無監(jiān)督數(shù)據(jù)與原始無監(jiān)督數(shù)據(jù)具備分布的一致性,而以前的方法通常只是應用高斯噪聲和Dropout噪聲(無法保證一致性)。(https://arxiv.org/abs/1904.12848)

此外,這個倉庫(https://github.com/quincyliang/nlp-data-augmentation)中介紹了一些自然語言處理中的數(shù)據(jù)增強技術(shù)。

總結(jié)

數(shù)據(jù)增強是增大數(shù)據(jù)規(guī)模,減輕模型過擬合的有效方法,但是,數(shù)據(jù)增強不能保證總是有利的。在數(shù)據(jù)非常有限的域中,這可能導致進一步過度擬合。因此,重要的是要考慮搜索算法來推導增強數(shù)據(jù)的最佳子集,以便訓練深度學習模型。

雖然相比于計算視覺,自然語言處理領域中的數(shù)據(jù)增強應用更少,難度也要更大,但是同時也意味著更大的機遇。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4844

    瀏覽量

    108212
  • nlp
    nlp
    +關注

    關注

    1

    文章

    491

    瀏覽量

    23347
  • 計算視覺
    +關注

    關注

    0

    文章

    5

    瀏覽量

    1729

原文標題:一文了解NLP和CV領域的數(shù)據(jù)增強

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    進來選!數(shù)字信號轉(zhuǎn)網(wǎng)絡輸出的AI圖像處理

    數(shù)字接口相較于模擬接口,在傳輸速率和穩(wěn)定性方面更具優(yōu)勢。數(shù)字信號在傳輸過程中不易受到干擾,能夠保持較高的傳輸質(zhì)量;同時,數(shù)字接口采用高速傳輸技術(shù),能夠?qū)崿F(xiàn)大數(shù)據(jù)量的快速傳輸,例如cameralink
    的頭像 發(fā)表于 04-21 17:50 ?315次閱讀
    進來選!數(shù)字信號轉(zhuǎn)網(wǎng)絡輸出的AI<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>板

    技術(shù)選型參考:圖像視頻數(shù)據(jù)匿名化工具 brighter AI 功能解析

    數(shù)據(jù)驅(qū)動型產(chǎn)業(yè)(如自動駕駛、智能安防)快速發(fā)展的背景下,如何在數(shù)據(jù)利用與個人隱私保護之間取得平衡,已成為企業(yè)必須面對的技術(shù)合規(guī)課題。當開發(fā)團隊在AI平臺搜索“圖像視頻
    的頭像 發(fā)表于 03-16 15:52 ?252次閱讀
    <b class='flag-5'>技術(shù)</b>選型參考:<b class='flag-5'>圖像</b>視頻<b class='flag-5'>數(shù)據(jù)</b>匿名化工具 brighter AI 功能解析

    圖像采集卡:連接設備與數(shù)據(jù)圖像樞紐

    在機器視覺與圖像傳輸體系中,圖像采集卡是無可替代的重要樞紐——它一端承接相機、內(nèi)窺鏡、攝像機等前端圖像設備的信號輸出,另一端對接后端數(shù)據(jù)處理、存儲、展示系統(tǒng),通過信號轉(zhuǎn)換、同步協(xié)調(diào)、高
    的頭像 發(fā)表于 01-22 13:51 ?390次閱讀
    <b class='flag-5'>圖像</b>采集卡:連接設備與<b class='flag-5'>數(shù)據(jù)</b>的<b class='flag-5'>圖像</b>樞紐

    EspeedGrab圖像采集軟件介紹(Cameralink轉(zhuǎn)USB采集)

    自動白平衡處理 7 Bayer還原 Bayer圖像還原彩色處理 8 紅外偽彩 可白熱、黑熱、多種偽彩模式可配置 9 圖像降噪 可設定檔位多幀降噪濾波 10
    發(fā)表于 12-23 17:26

    用于高速成像,科學和太陽蛋白紫外線應用的圖像增強器解決方案

    圖像增強器用于增強低照度圖像,直至單光子的檢測和成像。Photonis 是 Exosens 的一部分,為科學應用 (IIT) 提供各種圖像
    的頭像 發(fā)表于 11-19 07:36 ?313次閱讀
    用于高速成像,科學和太陽蛋白紫外線應用的<b class='flag-5'>圖像</b><b class='flag-5'>增強</b>器解決方案

    AI眼鏡視覺處理芯片:從圖像感知到智能增強技術(shù)躍遷

    ,而到2028年,隨著AR功能普及與視覺交互成為標配,出貨量有望逼近4億臺。在這一爆發(fā)性增長背后,視覺處理能力已成為AI眼鏡的核心競爭力,而支撐這一能力的關鍵,正是日益復雜的視覺處理芯片架構(gòu)。 ? AI眼鏡的視覺處理需求升級:從
    的頭像 發(fā)表于 11-16 01:23 ?1.3w次閱讀
    AI眼鏡視覺<b class='flag-5'>處理</b>芯片:從<b class='flag-5'>圖像</b>感知到智能<b class='flag-5'>增強</b>的<b class='flag-5'>技術(shù)</b>躍遷

    圖像采集卡:機器視覺時代的圖像數(shù)據(jù)核心樞紐

    一、圖像采集卡的技術(shù)本質(zhì):從信號到數(shù)據(jù)的“轉(zhuǎn)換器”與“傳輸通道”圖像采集卡(ImageCaptureCard)是機器視覺系統(tǒng)的核心硬件組件,本質(zhì)是通過專用芯片(如FPGA、ASIC)實
    的頭像 發(fā)表于 11-12 15:15 ?895次閱讀
    <b class='flag-5'>圖像</b>采集卡:機器視覺時代的<b class='flag-5'>圖像</b><b class='flag-5'>數(shù)據(jù)</b>核心樞紐

    數(shù)據(jù)處理軟核加速模塊設計

    ,如果用ARM處理器或上位機來實現(xiàn)這個過程會十分耗時,利用FPGA的并行處理技術(shù)可以輕易實現(xiàn)這個功能,整理后的數(shù)據(jù)傳輸形式會為之后的設計產(chǎn)生便利。模塊用了20塊片內(nèi)雙口RAM來實現(xiàn)
    發(fā)表于 10-29 08:09

    基于FPGA的CLAHE圖像增強算法設計

    CLAHE圖像增強算法又稱為對比度有限的自適應直方圖均衡算法,其算法原理是通過有限的調(diào)整圖像局部對比度來增強有效信號和抑制噪聲信號。
    的頭像 發(fā)表于 10-15 10:14 ?826次閱讀
    基于FPGA的CLAHE<b class='flag-5'>圖像</b><b class='flag-5'>增強</b>算法設計

    Photonis圖像增強器:技術(shù)原理、核心優(yōu)勢與應用領域

    Photonis是一家全球領先的光電傳感器與夜視技術(shù)制造商,總部位于荷蘭,專注于高性能圖像增強器、光電倍增管(PMT)和微通道板(MCP)的研發(fā)與生產(chǎn)。其產(chǎn)品廣泛應用于科研、醫(yī)療和工業(yè)領域,尤其在低
    的頭像 發(fā)表于 10-10 09:28 ?1001次閱讀
    Photonis<b class='flag-5'>圖像</b><b class='flag-5'>增強</b>器:<b class='flag-5'>技術(shù)</b>原理、核心優(yōu)勢與應用領域

    Photonis 科學圖像增強器介紹

    對于尋求先進圖像增強技術(shù)增強相機制造商,Photonis 提供具有無與倫比規(guī)格的科學級圖像增強
    的頭像 發(fā)表于 09-19 09:20 ?528次閱讀
    Photonis 科學<b class='flag-5'>圖像</b><b class='flag-5'>增強</b>器介紹

    FPGA 加持,友思特圖像采集卡高速預處理助力視覺系統(tǒng)運行提速增效

    圖像處理圖像處理關鍵環(huán)節(jié),可優(yōu)化數(shù)據(jù)傳輸、減輕主機負擔,其算法可在FPGA等硬件上執(zhí)行。友思特FPGA
    的頭像 發(fā)表于 08-13 17:41 ?1385次閱讀
    FPGA 加持,友思特<b class='flag-5'>圖像</b>采集卡高速預<b class='flag-5'>處理</b>助力視覺系統(tǒng)運行提速增效

    工業(yè)相機圖像采集卡:技術(shù)剖析、應用場景與未來發(fā)展

    CameraLink、CoaXPress、GigEVision等,高效、穩(wěn)定地將數(shù)據(jù)傳輸?shù)接嬎銠C進行后續(xù)的圖像處理、分析和應用。本文將深入剖析工業(yè)相機圖像采集卡的
    的頭像 發(fā)表于 05-28 13:49 ?936次閱讀
    工業(yè)相機<b class='flag-5'>圖像</b>采集卡:<b class='flag-5'>技術(shù)</b>剖析、應用場景與未來發(fā)展
    龙陵县| 蚌埠市| 舟山市| 阳泉市| 济源市| 志丹县| 蒙山县| 怀仁县| 常宁市| 百色市| 盈江县| 子长县| 平武县| 乌什县| 崇义县| 陵川县| 栾城县| 六安市| 科技| 天祝| 福清市| 泊头市| 长泰县| 米易县| 南京市| 苍山县| 察雅县| 贵阳市| 福贡县| 沙雅县| 石首市| 平利县| 瑞安市| 大名县| 鄯善县| 囊谦县| 富源县| 新河县| 皮山县| 历史| 娄烦县|