日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DeepMind對無監(jiān)督學習的原理近年來取得的成果、發(fā)展前景進行了綜述

jmiy_worldofai ? 來源:lp ? 2019-04-13 11:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在過去十年中,機器學習在圖像識別、自動駕駛汽車和圍棋等領域取得了前所未有的進步。這些成功在很大程度上是靠監(jiān)督學習和強化學習來實現(xiàn)的。

這兩種方法都要求由人設計訓練信號并傳遞給計算機。在監(jiān)督學習的情況下,這些是“目標”(例如圖像的正確標簽);在強化學習的情況下,它們是成功行為的“獎勵”(例如在Atari游戲中獲得高分)。因此,機器學習的極限是由人類訓練師決定的。

但是學習知識還應該有其他的策略,就像讓幼兒學習,不僅有指導(監(jiān)督學習)和鼓勵(強化學習),還應該有自由探索世界(無監(jiān)督學習)。如果要讓AI脫離人類發(fā)展成出通用智能,必須要讓它掌握無監(jiān)督學習的技能。

DeepMind今天在官方博客中對無監(jiān)督學習的原理、近年來取得的成果、發(fā)展前景進行了綜述。

無監(jiān)督學習關鍵的特點是,傳遞給算法的數(shù)據(jù)在內部結構中非常豐富,而用于訓練的目標和獎勵非常稀少。無監(jiān)督學習算法學到的大部分內容必須包括理解數(shù)據(jù)本身,而不是將這種理解應用于特定任務。

解碼視覺元素

2012年是深度學習的里程碑,AlexNet席卷了ImageNet圖像分類競賽,但是更引人注目的是藏在AlexNet之下的事情。

研究人員在分析AlexNet時發(fā)現(xiàn),它通過為輸入構建復雜的內部表示來解釋圖像,低層次的特征,如紋理和邊緣在底層中表示,然后將它們組合在一起形成高級概念,例如更高層次中的輪子和狗。

這與我們的大腦中處理信息的方式非常相似,其中初級感官處理區(qū)域中的簡單邊緣和紋理,然后組裝成復雜對象。因此復雜場景的表示可以由“視覺基元”所構建,這種方式與單詞構成句子大致相同。

在沒有人類明確的指導的情況下,研究人員發(fā)現(xiàn)AlexNet的層可以通過基本的“視覺詞匯”來解決任務。

遷移學習

AlexNet還可以被遷移到訓練之外的視覺任務中,例如識別整個場景而不是單個圖像。

人類就非常擅長這種學習方法,我們能迅速調整自己的經驗,以適應新的技能和理解收集到的信息。例如,經過專業(yè)訓練的鋼琴家可以相對輕松地掌握彈奏爵士鋼琴的方法。

理論上,構成世界正確內部表征的智能體應該能夠做同樣的事情。

但是AlexNet等分類器所學到的表示仍具有局限性,特別是網絡只用單一類別標記圖像訓練時,那些推斷標簽時用不上的信息,無論它在其他任務中用處多大,都可能被網絡所忽略。如果標簽總是指向前景,則表示可能無法獲取圖像的背景。

一種可能的解決方案是提供更全面的訓練信號,比如描述圖像的詳細內容,不單單把圖像描述成“狗”,而是“柯基犬在陽光明媚的公園里叼飛盤”。

但是,這些信息很難大規(guī)模提供,而且這樣做仍然有可能不足以捕獲完成任務所需的全部信息。

無監(jiān)督學習的基本前提是學習豐富、可廣泛轉移表示的最佳方式,這種方式可以學習關于數(shù)據(jù)的全部內容。

如果你覺得轉移的概念看起來過于抽象,那么請想象一個學習簡筆畫的孩子。她發(fā)現(xiàn)了人體形態(tài)的特征。通過增加具體細節(jié),她可以為她的所有同學繪制肖像,加上眼鏡、紅色T恤的同桌等等。

她發(fā)展出這項技能不是為了完成一項特定任務或獲得獎勵,而是為了反映她描繪周圍世界的基本要求。

生成模型和GAN

無監(jiān)督學習的最簡單目標是訓練算法生成自己的數(shù)據(jù)實例,但是模型不應該簡單地重現(xiàn)之前訓練的數(shù)據(jù),否則就是簡單的記憶行為。

它必須是建立一個從數(shù)據(jù)中的基礎類模型。不是生成特定的馬或彩虹照片,而是生成馬和彩虹的圖片集;不是來自特定發(fā)言者的特定話語,而是說出話語的一般分布。

生成模型的指導原則是,能夠構建一個令人信服的數(shù)據(jù)示例是理解它的最有力證據(jù)。正如物理學家理查德·費曼所說:“我不能創(chuàng)造的東西,我就不能了解”(WhatIcannotcreate,Idonotunderstand.)。

對于圖像來說,迄今為止最成功的生成模型是生成對抗網絡(GAN)。它由兩個網絡組成:一個生成器和一個鑒別器,分別負責偽造圖片和識別真假。

生成器產生圖像的目的是誘使鑒別者相信它們是真實的,同時,鑒別者會因為發(fā)現(xiàn)假圖片而獲得獎勵。

GAN開始生成的圖像是雜亂的和隨機的,在許多次迭代中被細化,形成更加逼真的圖像,甚至無法與真實照片區(qū)別開來。最近英偉達的GauGAN還能根據(jù)用戶草圖生成圖片。

通過預測創(chuàng)建內容

無監(jiān)督學習中另一個值得注意的成員是自回歸模型,它把數(shù)據(jù)分成一系列小片段,每個片段依次被預測。這些模型可以通過連續(xù)猜測接下來會發(fā)生什么來作為輸入,并能夠再次生成猜測數(shù)據(jù)。

在語言模型中,每個單詞都是從它之前的單詞預測出來的。它能夠支持在電子郵件和消息應用程序中彈出的文本預測內容。

最近OpenAI公布的GPT-2模型還能能夠生成以假亂真的文字段落。

通過控制用于調節(jié)輸出預測的輸入序列,自回歸模型也能用于將一個序列轉換為另一個序列。例如將文本轉換為逼真的手寫體、自然的語音,還能將一種語言翻譯成另一種語言。

自回歸模型以預測特定順序數(shù)據(jù)的方式來理解數(shù)據(jù)。通過預測任何其他數(shù)據(jù)的任何部分,可以構建更一般的無監(jiān)督學習算法。

例如從句子中刪除一個單詞,并試圖從剩余的內容中預測它。通過學習進行大量局部預測,系統(tǒng)被迫從整體上理解數(shù)據(jù)。

生成模型的出現(xiàn)讓人們產生了一種擔憂,就是它們可能被濫用。雖然通過照片、視頻和音頻編輯操縱證據(jù)歷史已久,但生成模型讓惡意編輯媒體內容變得更加容易。一個知名的“deepfakes”范例是奧巴馬演講視頻片段。

令人鼓舞的是,人們已經做出了面對這些挑戰(zhàn)的努力,包括利用統(tǒng)計技術幫助檢測偽造內容和驗證真實內容、提高公眾意識、以及圍繞限制生成模型使用范圍展開討論。

生成模型本身也能用在檢測偽造內容和異常數(shù)據(jù)。例如,檢測虛假語音或識別支付異常,保護客戶免受欺詐。研究人員需要研究生成模型,以便更好地理解它們并降低風險。

實現(xiàn)通用智能

生成模型本身很吸引人,DeepMind的主要興趣是用它作為通用智能的踏腳石。賦予智能體生成數(shù)據(jù)的能力是一種賦予其想象力的方式,從而能夠規(guī)劃和推理未來。

DeepMind的研究表明,即使沒有明確的生成數(shù)據(jù),學習預測環(huán)境的不同方面可以豐富智能體的世界模型,從而提高其解決問題的能力。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像識別
    +關注

    關注

    9

    文章

    535

    瀏覽量

    40200
  • 機器學習
    +關注

    關注

    67

    文章

    8567

    瀏覽量

    137285
  • DeepMind
    +關注

    關注

    0

    文章

    131

    瀏覽量

    12441

原文標題:DeepMind綜述無監(jiān)督學習:通用智能路上的踏腳石,讓AI更聰明

文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    邀請函 | CET中電技術邀您參加第四屆零碳城市與零碳建筑發(fā)展大會

    今年是“十五五”開局之年,也是我國實現(xiàn)雙碳目標推進城市和建筑綠色低碳轉型的關鍵一年。近年來,雄安新區(qū)在數(shù)字城市、智慧能源、零碳城市與零碳建筑等方面進行了示范創(chuàng)新,形成了一批可學習借鑒的經驗模式。4月
    的頭像 發(fā)表于 04-16 18:05 ?262次閱讀
    邀請函 | CET中電技術邀您參加第四屆零碳城市與零碳建筑<b class='flag-5'>發(fā)展</b>大會

    算法工程師需要具備哪些技能?

    :自動化任務(如數(shù)據(jù)預處理、模型訓練調度)。Git版本控制:團隊協(xié)作開發(fā)(如分支管理、代碼合并)。 機器學習監(jiān)督學習:線性回歸、邏輯回歸、決策樹、SVM等。監(jiān)督學習:聚類(K-Mea
    發(fā)表于 02-27 10:53

    強化學習會讓自動駕駛模型學習更快嗎?

    是一種讓機器通過“試錯”學會決策的辦法。與監(jiān)督學習不同,監(jiān)督學習是有人提供示范答案,讓模型去模仿;而強化學習不會把每一步的“正確答案”都告訴你,而是把環(huán)境、動作和結果連起來,讓機器自己探索哪個行為長期看起來更有利
    的頭像 發(fā)表于 01-31 09:34 ?870次閱讀
    強化<b class='flag-5'>學習</b>會讓自動駕駛模型<b class='flag-5'>學習</b>更快嗎?

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰(zhàn)課(11大系列課程,共5000+分鐘)

    趨勢: 監(jiān)督學習普及 當前工業(yè)場景中80%的缺陷檢測項目面臨\"OK樣本充足而NG樣本稀缺\"的困境,傳統(tǒng)監(jiān)督學習方案難以落地。課程第11系列(
    發(fā)表于 12-04 09:28

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰(zhàn)課程(11大系列課程,共5000+分鐘)

    趨勢: 監(jiān)督學習普及 當前工業(yè)場景中80%的缺陷檢測項目面臨\"OK樣本充足而NG樣本稀缺\"的困境,傳統(tǒng)監(jiān)督學習方案難以落地。課程第11系列(
    發(fā)表于 12-03 13:50

    中興通訊第三屆學習發(fā)展大會圓滿收官

    近日,以“AI時代組織與人才能力重塑”為主題的中興通訊第三屆學習發(fā)展大會在深圳成功舉辦。大會由中興通訊全球學習發(fā)展中心主辦。來自中國移動、中國聯(lián)通、ATD、小米汽車、北森、AACTP、
    的頭像 發(fā)表于 09-26 15:24 ?1072次閱讀

    開源鴻蒙持續(xù)取得顯著成果

    和落地實踐。會上,開源鴻蒙項目群工作委員會委員、華為終端BG軟件部副總裁章曉峰發(fā)表了題為《乘風破浪,共創(chuàng)開源鴻蒙未來》的主題演講,全面闡述了開源鴻蒙在社區(qū)發(fā)展、行業(yè)落地、版本迭代及人才生態(tài)等方面取得的關鍵成果
    的頭像 發(fā)表于 07-28 17:39 ?1093次閱讀

    速度傳感器感應電機控制系統(tǒng)轉速辨識方法研究

    摘 要:速度傳感器感應電機控制技術已成為近年的研究熱點,轉逸估計是速度傳感器感應電機控制技術的核心問題。在此對速度傳感器感應電機轉速辦識技術
    發(fā)表于 07-09 14:23

    任正非說 AI已經確定是第四次工業(yè)革命 那么如何從容地加入進來呢?

    的基本理論。了解監(jiān)督學習、監(jiān)督學習和強化學習的基本原理。例如,在監(jiān)督學習中,理解如何通過標注數(shù)據(jù)來訓練模型
    發(fā)表于 07-08 17:44

    嵌入式核心板的發(fā)展前景與趨勢分析

    ? ? 一、核心板的市場背景與發(fā)展現(xiàn)狀 ? ? 嵌入式核心板(Core Board)作為嵌入式系統(tǒng)的核心組件,集成了處理器、內存、存儲及基礎外設接口,具有高性能、低功耗、模塊化等特點。近年來,隨著物
    的頭像 發(fā)表于 07-03 14:24 ?941次閱讀

    刷雙饋電機專利技術發(fā)展

    機的發(fā)展進行了全面的統(tǒng)計分析,總結了與刷雙饋電機相關的國內和國外專利的申請趨勢、主要中請人分布以及其轉子結構的發(fā)展路線做了一定的分析,并從中得到一定的規(guī)律。 純分享帖,點擊下方附件免
    發(fā)表于 06-25 13:10

    機器學習異常檢測實戰(zhàn):用Isolation Forest快速構建標簽異常檢測系統(tǒng)

    本文轉自:DeepHubIMBA監(jiān)督異常檢測作為機器學習領域的重要分支,專門用于在缺乏標記數(shù)據(jù)的環(huán)境中識別異常事件。本文深入探討異常檢測技術的理論基礎與實踐應用,通過IsolationForest
    的頭像 發(fā)表于 06-24 11:40 ?1641次閱讀
    機器<b class='flag-5'>學習</b>異常檢測實戰(zhàn):用Isolation Forest快速構建<b class='flag-5'>無</b>標簽異常檢測系統(tǒng)

    氧化鎵射頻器件研究進展

    ,首先介紹了 Ga2O3在射頻器件領域的優(yōu)勢和面臨的挑戰(zhàn),然后綜述近年來 Ga2O3射頻器件在體摻雜溝道、AlGaO/Ga2O3調制 摻雜異質結以及與高導熱襯底異質集成方面取得的進展,并對研究結果
    的頭像 發(fā)表于 06-11 14:30 ?2788次閱讀
    氧化鎵射頻器件研究進展

    使用MATLAB進行監(jiān)督學習

    監(jiān)督學習是一種根據(jù)未標注數(shù)據(jù)進行推斷的機器學習方法。監(jiān)督學習旨在識別數(shù)據(jù)中隱藏的模式和關系,
    的頭像 發(fā)表于 05-16 14:48 ?1644次閱讀
    使用MATLAB<b class='flag-5'>進行</b><b class='flag-5'>無</b><b class='flag-5'>監(jiān)督學習</b>

    嵌入式開發(fā)入門指南:從零開始學習嵌入式

    、樹莓派 5. 就業(yè)前景發(fā)展方向嵌入式工程師在通信、汽車電子、航空航天等領域需求旺盛,具備良好發(fā)展前景。
    發(fā)表于 05-15 09:29
    林西县| 大港区| 且末县| 抚远县| 三台县| 胶南市| 宝山区| 拉萨市| 南城县| 商都县| 普宁市| 玉山县| 从江县| 阜新市| 安仁县| 贵德县| 鹤山市| 日喀则市| 郯城县| 五台县| 高安市| 鹤庆县| 万源市| 营山县| 九龙县| 江北区| 桂平市| 怀仁县| 竹北市| 千阳县| 陆丰市| 永靖县| 阳朔县| 当涂县| 禄劝| 上栗县| 临泽县| 稷山县| 定安县| 若羌县| 望江县|