日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

半監(jiān)督學習:比監(jiān)督學習做的更好

電子設計 ? 來源:電子設計 ? 作者:電子設計 ? 2020-12-08 23:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

首發(fā):AI公園公眾號
作者:Andre Ye
編譯:ronghuaiyang

導讀

為什么半監(jiān)督學習是機器學習的未來。


監(jiān)督學習是人工智能領域的第一種學習類型。從它的概念開始,無數(shù)的算法,從簡單的邏輯回歸到大規(guī)模的神經(jīng)網(wǎng)絡,都已經(jīng)被研究用來提高精確度和預測能力。
然而,一個重大突破揭示了添加“無監(jiān)督數(shù)據(jù)”可以提高模型泛化和性能。事實上,在非常多的場景中,帶有標簽的數(shù)據(jù)并不容易獲得。半監(jiān)督學習可以在標準的任務中實現(xiàn)SOTA的效果,只需要一小部分的有標記數(shù)據(jù) —— 數(shù)百個訓練樣本。
在這個我們對半監(jiān)督學習的探索中,我們會有:

  1. _半監(jiān)督學習簡介_。什么是半監(jiān)督學習,它與其他學習方法相比如何,半監(jiān)督學習算法的框架/思維過程是什么?
  2. _算法:Semi-Supervised GANs_。與傳統(tǒng)GANs的比較,過程的解釋,半監(jiān)督GANs的性能。
  3. _用例和機器學習的未來_。為什么半監(jiān)督學習會有如此大的需求,哪里可以應用。

半監(jiān)督學習介紹

半監(jiān)督學習算法代表了監(jiān)督和非監(jiān)督算法的中間地帶。雖然沒有正式定義為機器學習的“第四個”元素(監(jiān)督、無監(jiān)督、強化),但它將前兩個方面結合成一種自己的方法。
這些算法操作的數(shù)據(jù)有一些標簽,但大部分是沒有標簽的。傳統(tǒng)上,人們要么選擇有監(jiān)督學習的方式,只對帶有標簽的數(shù)據(jù)進行操作,這將極大地減小數(shù)據(jù)集的規(guī)模,要么,就會選擇無監(jiān)督學習的方式,丟棄標簽保留數(shù)據(jù)集的其余部分,然后做比如聚類之類的工作。

這在現(xiàn)實世界中是很常見的。由于標注是很昂貴的,特別是大規(guī)模數(shù)據(jù)集,特別是企業(yè)用途的,可能只有幾個標簽。例如,考慮確定用戶活動是否具有欺詐性。在100萬用戶中,該公司知道有1萬用戶是這樣的,但其他9萬用戶可能是惡意的,也可能是良性的。半監(jiān)督學習允許我們操作這些類型的數(shù)據(jù)集,而不必在選擇監(jiān)督學習或非監(jiān)督學習時做出權衡。
一般來說,半監(jiān)督學習算法在這個框架上運行:

  1. 半監(jiān)督機器學習算法使用有限的標記樣本數(shù)據(jù)集來訓練自己,從而形成一個“部分訓練”的模型。
  2. 部分訓練的模型對未標記的數(shù)據(jù)進行標記。由于樣本標記數(shù)據(jù)集有許多嚴重的限制(例如,在現(xiàn)實數(shù)據(jù)中的選擇偏差),標記的結果被認為是“偽標簽”數(shù)據(jù)。
  3. 結合標記和偽標簽數(shù)據(jù)集,創(chuàng)建一個獨特的算法,結合描述和預測方面的監(jiān)督和非監(jiān)督學習。

半監(jiān)督學習利用分類過程來識別數(shù)據(jù)資產,利用聚類過程將其分成不同的部分。

算法:Semi-Supervised GAN

半監(jiān)督的GAN,簡稱為SGAN,是[生成對抗網(wǎng)絡](https://medium.com/analytics-... -an-直覺解釋-革命概念-2f962c858b95)架構的一個變體,用于解決半監(jiān)督學習問題。
在傳統(tǒng)的GAN中,判別器被訓練來預測由生成器模型生成的圖像是真實的還是假的,允許它從圖像中學習判別特征,即使沒有標簽。盡管大多數(shù)人通常在GANs中使用訓練很好的生成器,可以生成和數(shù)據(jù)集中相似的圖像,判別器還是可以通過以轉移學習作為起點在相同的數(shù)據(jù)集上建立分類器,允許監(jiān)督任務從無監(jiān)督訓練中受益。由于大部分的圖像特征已經(jīng)被學習,因此進行分類的訓練時間和準確率會更好。
然而,在SGAN中,判別器同時接受兩種模式的訓練:無監(jiān)督和監(jiān)督。

  • 在無監(jiān)督模式中,需要區(qū)分真實圖像和生成的圖像,就像在傳統(tǒng)的GAN中一樣。
  • 在監(jiān)督模式中,需要將一幅圖像分類為幾個類,就像在標準的神經(jīng)網(wǎng)絡分類器中一樣。

為了同時訓練這兩種模式,判別器必須輸出1 + _n_個節(jié)點的值,其中1表示“真或假”節(jié)點,_n_是預測任務中的類數(shù)。
在半監(jiān)督GAN中,對判別器模型進行更新,預測K+1個類,其中K為預測問題中的類數(shù),并為一個新的“_假_”類添加額外的類標簽。它涉及到同時訓練無監(jiān)督分類任務和有監(jiān)督分類任務的判別器模型。整個數(shù)據(jù)集都可以通過SGAN進行傳遞 —— 當一個訓練樣本有標簽時,判別器的權值將被調整,否則,分類任務將被忽略,判別器將調整權值以更好地區(qū)分真實的圖像和生成的圖像。

雖然允許SGAN進行無監(jiān)督訓練,允許模型從一個非常大的未標記數(shù)據(jù)集中學習非常有用的特征提取,但有監(jiān)督學習允許模型利用提取的特征并將其用于分類任務。其結果是一個分類器可以在像MNIST這樣的標準問題上取得令人難以置信的結果,即使是在非常非常少的標記樣本(數(shù)十到數(shù)百個)上進行訓練。
SGAN巧妙地結合了無監(jiān)督和監(jiān)督學習的方面,強強聯(lián)合,以最小的標簽量,產生難以置信的結果。

用例和機器學習的未來

在一個可用數(shù)據(jù)量呈指數(shù)級增長的時代,無監(jiān)督數(shù)據(jù)根本不能停下來等待標注。無數(shù)真實世界的數(shù)據(jù)場景會像這樣出現(xiàn) —— 例如,YouTube視頻或網(wǎng)站內容。從爬蟲引擎和內容聚合系統(tǒng)到圖像和語音識別,半監(jiān)督學習被廣泛應用。
半監(jiān)督學習將監(jiān)督學習和非監(jiān)督學習的過擬合和“不擬合”傾向(分別)結合起來的能力,創(chuàng)建了一個模型,在給出最小數(shù)量的標記數(shù)據(jù)和大量的未標記數(shù)據(jù)的情況下,可以出色地執(zhí)行分類任務。除了分類任務,半監(jiān)督算法還有許多其他用途,如增強聚類和異常檢測。盡管這一領域本身相對較新,但由于在當今的數(shù)字領域中發(fā)現(xiàn)了巨大的需求,算法一直在不斷地被創(chuàng)造和完善。
半監(jiān)督學習確實是機器學習的未來。

—END—

英文原文:https://towardsdatascience.co...

推薦閱讀

關注圖像處理,自然語言處理,機器學習等人工智能領域,請點擊關注AI公園專欄。
歡迎關注微信公眾號

審核編輯:符乾江
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1821

    文章

    50366

    瀏覽量

    267056
  • 機器學習
    +關注

    關注

    67

    文章

    8567

    瀏覽量

    137255
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI 算法核心知識清單(深度實戰(zhàn)版2)

    三、機器學習核心算法(入門到實戰(zhàn))?1.監(jiān)督學習算法(已知標簽的模型訓練)?線性模型?線性回歸(回歸任務):?核心原理:假設y=w?+w?x?+w?x?+...+w?x?+ε(ε為誤差項),通過
    的頭像 發(fā)表于 04-24 11:58 ?217次閱讀
    AI 算法核心知識清單(深度實戰(zhàn)版2)

    龍騰半導體順利通過SA8000社會責任國際標準監(jiān)督審核

    3月9日至11日,龍騰半導體順利通過SA8000社會責任國際標準的監(jiān)督審核。本次審核由權威認證機構SGS實施,審核的順利通過標志著龍騰半導體在社會責任管理體系的持續(xù)運行與深化實踐方面,再次獲得國際認可,也進一步彰顯了公司對員工權益保障、職業(yè)健康安全及可持續(xù)發(fā)展承諾的堅定踐行。
    的頭像 發(fā)表于 03-16 11:49 ?642次閱讀

    算法工程師需要具備哪些技能?

    :自動化任務(如數(shù)據(jù)預處理、模型訓練調度)。Git版本控制:團隊協(xié)作開發(fā)(如分支管理、代碼合并)。 機器學習監(jiān)督學習:線性回歸、邏輯回歸、決策樹、SVM等。無監(jiān)督學習:聚類(K-Means)、降維
    發(fā)表于 02-27 10:53

    強化學習會讓自動駕駛模型學習更快嗎?

    是一種讓機器通過“試錯”學會決策的辦法。與監(jiān)督學習不同,監(jiān)督學習是有人提供示范答案,讓模型去模仿;而強化學習不會把每一步的“正確答案”都告訴你,而是把環(huán)境、動作和結果連起來,讓機器自己探索哪個行為長期看起來更有利
    的頭像 發(fā)表于 01-31 09:34 ?852次閱讀
    強化<b class='flag-5'>學習</b>會讓自動駕駛模型<b class='flag-5'>學習</b>更快嗎?

    自動駕駛中常提的模仿學習是什么?

    當談及自動駕駛模型學習時,經(jīng)常會提到模仿學習的概念。所謂模仿學習,就是模型先看別人怎么,然后學著去做。自動駕駛中的模仿學習,就是把人類司機
    的頭像 發(fā)表于 01-16 16:41 ?2181次閱讀

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰(zhàn)課(11大系列課程,共5000+分鐘)

    趨勢: 無監(jiān)督學習普及 當前工業(yè)場景中80%的缺陷檢測項目面臨\"OK樣本充足而NG樣本稀缺\"的困境,傳統(tǒng)監(jiān)督學習方案難以落地。課程第11系列(無監(jiān)督缺陷檢測篇)提供無需標注即可
    發(fā)表于 12-04 09:28

    自動駕駛數(shù)據(jù)標注是所有信息都要標注嗎?

    本身只是像素和點云。標注的工作就是人為地給這些信號貼上語義標簽,告訴模型這是一輛車、這是行人、這是車道線、這個區(qū)域不能通行之類的明確信息。沒有這些標簽,監(jiān)督學習、驗證和評估都無法進行,模型不知道哪些輸入與哪些輸出應該
    的頭像 發(fā)表于 12-04 09:05 ?1221次閱讀
    自動駕駛數(shù)據(jù)標注是所有信息都要標注嗎?

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰(zhàn)課程(11大系列課程,共5000+分鐘)

    趨勢: 無監(jiān)督學習普及 當前工業(yè)場景中80%的缺陷檢測項目面臨\"OK樣本充足而NG樣本稀缺\"的困境,傳統(tǒng)監(jiān)督學習方案難以落地。課程第11系列(無監(jiān)督缺陷檢測篇)提供無需標注即可
    發(fā)表于 12-03 13:50

    自動駕駛中常提的“強化學習”是個啥?

    下,就是一個智能體在環(huán)境里行動,它能觀察到環(huán)境的一些信息,并做出一個動作,然后環(huán)境會給出一個反饋(獎勵或懲罰),智能體的目標是把長期得到的獎勵累積到最大。和監(jiān)督學習不同,強化學習沒有一一對應的“正確答案”給它看,而是靠與環(huán)境交互、自我探索來發(fā)現(xiàn)
    的頭像 發(fā)表于 10-23 09:00 ?926次閱讀
    自動駕駛中常提的“強化<b class='flag-5'>學習</b>”是個啥?

    使用MATLAB的支持向量機解決方案

    支持向量機 (SVM) 是一種有監(jiān)督機器學習算法,它能找到分離兩個類的數(shù)據(jù)點的最佳超平面。
    的頭像 發(fā)表于 10-21 15:00 ?797次閱讀
    使用MATLAB的支持向量機解決方案

    EL非監(jiān)督分割白皮書丨5張OK圖、1分鐘建模、半小時落地的異常檢測工具!

    在工業(yè)4.0浪潮下,制造業(yè)對產品質量的要求愈發(fā)嚴苛。傳統(tǒng)人工質檢效率低、成本高,基于規(guī)則算法的視覺檢測系統(tǒng)難以應對復雜場景,而依賴缺陷樣本的有監(jiān)督AI檢測又面臨樣本不足、泛化能力弱的難題。在此背景下
    的頭像 發(fā)表于 07-11 15:21 ?813次閱讀
    EL非<b class='flag-5'>監(jiān)督</b>分割白皮書丨5張OK圖、1分鐘建模、半小時落地的異常檢測工具!

    任正非說 AI已經(jīng)確定是第四次工業(yè)革命 那么如何從容地加入進來呢?

    的基本理論。了解監(jiān)督學習、無監(jiān)督學習和強化學習的基本原理。例如,在監(jiān)督學習中,理解如何通過標注數(shù)據(jù)來訓練模型進行分類或回歸任務,像通過大量的貓和狗的圖片標注數(shù)據(jù)來訓練一個圖像分類模型,
    發(fā)表于 07-08 17:44

    機器學習異常檢測實戰(zhàn):用Isolation Forest快速構建無標簽異常檢測系統(tǒng)

    本文轉自:DeepHubIMBA無監(jiān)督異常檢測作為機器學習領域的重要分支,專門用于在缺乏標記數(shù)據(jù)的環(huán)境中識別異常事件。本文深入探討異常檢測技術的理論基礎與實踐應用,通過IsolationForest
    的頭像 發(fā)表于 06-24 11:40 ?1622次閱讀
    機器<b class='flag-5'>學習</b>異常檢測實戰(zhàn):用Isolation Forest快速構建無標簽異常檢測系統(tǒng)

    提高IT運維效率,深度解讀京東云AIOps落地實踐(異常檢測篇)

    了一種無閾值方法:基于 LSTM 網(wǎng)絡的基線(一個 LSTM 框架輔助幾個優(yōu)化步驟)和無監(jiān)督檢測(神經(jīng)網(wǎng)絡和多種機器學習算法的組合)協(xié)同綜合分析時間序列。當時間序列顯示出清晰的周期性形態(tài)的情況下基線表現(xiàn)良好,而無監(jiān)督檢測在效率
    的頭像 發(fā)表于 05-22 16:38 ?1177次閱讀
    提高IT運維效率,深度解讀京東云AIOps落地實踐(異常檢測篇)

    使用MATLAB進行無監(jiān)督學習

    監(jiān)督學習是一種根據(jù)未標注數(shù)據(jù)進行推斷的機器學習方法。無監(jiān)督學習旨在識別數(shù)據(jù)中隱藏的模式和關系,無需任何監(jiān)督或關于結果的先驗知識。
    的頭像 發(fā)表于 05-16 14:48 ?1633次閱讀
    使用MATLAB進行無<b class='flag-5'>監(jiān)督學習</b>
    桦甸市| 翁牛特旗| 西乌珠穆沁旗| 崇仁县| 阿图什市| 龙里县| 湖南省| 和平县| 德安县| 大丰市| 丹东市| 安康市| 嘉禾县| 莆田市| 庄河市| 辰溪县| 康保县| 凤山县| 巴林右旗| 龙川县| 云南省| 黑龙江省| 司法| 中西区| 彭水| 大石桥市| 美姑县| 贡嘎县| 肇州县| 黎川县| 定陶县| 双峰县| 长垣县| 天台县| 雅江县| 青神县| 湘潭县| 界首市| 香格里拉县| 延川县| 仙桃市|