日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

機器學習全靠調(diào)參?谷歌發(fā)布顛覆性研究

新機器視覺 ? 來源:YXQ ? 2019-06-16 09:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機器學習全靠調(diào)參?這個思路已經(jīng)過時了。

谷歌大腦團隊發(fā)布了一項新研究:

只靠神經(jīng)網(wǎng)絡架構(gòu)搜索出的網(wǎng)絡,不訓練,不調(diào)參,就能直接執(zhí)行任務。

這樣的網(wǎng)絡叫做WANN,權(quán)重不可知神經(jīng)網(wǎng)絡。

它在MNIST數(shù)字分類任務上,未經(jīng)訓練和權(quán)重調(diào)整,就達到了92%的準確率,和訓練后的線性分類器表現(xiàn)相當。

除了監(jiān)督學習,WANN還能勝任許多強化學習任務

團隊成員之一的大佬David Ha,把成果發(fā)上了推特,已經(jīng)獲得了1300多贊:

那么,先來看看效果吧。

效果

谷歌大腦用WANN處理了3種強化學習任務。

(給每一組神經(jīng)元,共享同一個權(quán)重。)

第一項任務,Cart-Pole Swing-Up。

這是經(jīng)典的控制任務,一條滑軌,一臺小車,車上一根桿子。

小車在滑軌的范圍里跑,要把桿子從自然下垂的狀態(tài)搖上來,保持在直立的位置不掉下來。

(這個任務比單純的Cart-Pole要難一些:

Cart-Pole桿子的初始位置就是向上直立,不需要小車把它搖上來,只要保持就可以。)

難度體現(xiàn)在,沒有辦法用線性控制器 (Linear Controller) 來解決。每一個時間步的獎勵,都是基于小車到滑軌一頭的距離,以及桿子擺動的角度。

WANN的最佳網(wǎng)絡 (Champion Network) 長這樣:

它在沒有訓練的狀態(tài)下,已經(jīng)表現(xiàn)優(yōu)異:

表現(xiàn)最好的共享權(quán)重,給了團隊十分滿意的結(jié)果:只用幾次擺動便達到了平衡狀態(tài)。

第二項任務,Bipedal Waker-v2。

一只兩足“生物”,要在隨機生成的道路上往前走,越過凸起,跨過陷坑。獎勵多少,就看它從出發(fā)到掛掉走了多長的路,以及電機扭矩的成本(為了鼓勵高效運動) 。

每條腿的運動,都是由一個髖關節(jié)、和一個膝關節(jié)來控制的。有24個輸入,會指導它的運動:包括“激光雷達”探測的前方地形數(shù)據(jù),本體感受到的關節(jié)運動速度等等。

比起第一項任務中的低維輸入,這里可能的網(wǎng)絡連接就更多樣了:

所以,需要WANN對從輸入到輸出的布線方式,有所選擇。

這個高維任務,WANN也優(yōu)質(zhì)完成了。

你看,這是搜索出的最佳架構(gòu),比剛才的低維任務復雜了許多:

它在-1.5的權(quán)重下奔跑,長這樣:

第三項任務,CarRacing-v0。

這是一個自上而下的 (Top-Down) 、像素環(huán)境里的賽車游戲。

一輛車,由三個連續(xù)命令來控制:油門、轉(zhuǎn)向、制動。目標是在規(guī)定的時間里,經(jīng)過盡可能多的磚塊。賽道是隨機生成的。

研究人員把解釋每個像素 (Pixel Interpretation) 的工作交給了一個預訓練的變分自編碼器 (VAE) ,它可以把像素表征壓縮到16個潛在維度。

這16維就是網(wǎng)絡輸入的維度。學到的特征是用來檢測WANN學習抽象關聯(lián) (Abstract Associations) 的能力,而不是編碼不同輸入之間顯式的幾何關系。

這是WANN最佳網(wǎng)絡,在-1.4共享權(quán)重下、未經(jīng)訓練的賽車成果:

雖然路走得有些蜿蜒,但很少偏離跑到。

而把最佳網(wǎng)絡微調(diào)一下,不用訓練,便更加順滑了:

總結(jié)一下,在簡單程度和模塊化程度上,第二、三項任務都表現(xiàn)得優(yōu)秀,兩足控制器只用了25個可能輸入中的17個,忽略了許多LIDAR傳感器和膝關節(jié)的速度。

WANN架構(gòu)不止能在不訓練單個權(quán)重的情況下完成任務,而且只用了210個網(wǎng)絡連接(Connections) ,比當前State-of-the-Art模型用到的2804個連接,少了一個數(shù)量級。

做完強化學習,團隊又瞄準了MNIST,把WANN拓展到了監(jiān)督學習的分類任務上。

一個普通的網(wǎng)絡,在參數(shù)隨機初始化的情況下,MNIST上面的準確率可能只有10%左右。

而新方法搜索到的網(wǎng)絡架構(gòu)WANN,用隨機權(quán)重去跑,準確率已經(jīng)超過了80%

如果像剛剛提到的那樣,喂給它多個權(quán)值的合集,準確率就達到了91.6%。

對比一下,經(jīng)過微調(diào)的權(quán)重,帶來的準確率是91.9%,訓練過的權(quán)重,可以帶來94.2%的準確率。

再對比一下,擁有幾千個權(quán)重的線性分類器:

也只是和WANN完全沒訓練、沒微調(diào)、僅僅喂食了一些隨機權(quán)重時的準確率相當。

論文里強調(diào),MINST手寫數(shù)字分類是高維分類任務。WANN表現(xiàn)得非常出色。

并且沒有哪個權(quán)值,顯得比其他值更優(yōu)秀,大家表現(xiàn)得十分均衡:所以隨機權(quán)重是可行的。

不過,每個不同的權(quán)重形成的不同網(wǎng)絡,有各自擅長分辨的數(shù)字,所以可以把一個擁有多個權(quán)值的WANN,用作一個自給自足的合集 (Self-Contained Ensemble) 。

實現(xiàn)原理

不訓練權(quán)重參數(shù)獲得極高準確度,WANN是如何做到的呢?

神經(jīng)網(wǎng)絡不僅有權(quán)重偏置這些參數(shù),網(wǎng)絡的拓撲結(jié)構(gòu)、激活函數(shù)的選擇都會影響最終結(jié)果。

谷歌大腦的研究人員在論文開頭就提出質(zhì)疑:神經(jīng)網(wǎng)絡的權(quán)重參數(shù)與其架構(gòu)相比有多重要?在沒有學習任何權(quán)重參數(shù)的情況下,神經(jīng)網(wǎng)絡架構(gòu)可以在多大程度上影響給定任務的解決方案。

為此,研究人員提出了一種神經(jīng)網(wǎng)絡架構(gòu)的搜索方法,無需訓練權(quán)重找到執(zhí)行強化學習任務的最小神經(jīng)網(wǎng)絡架構(gòu)。

谷歌研究人員還把這種方法用在監(jiān)督學習領域,僅使用隨機權(quán)重,就能在MNIST上實現(xiàn)就比隨機猜測高得多的準確率。

論文從架構(gòu)搜索、貝葉斯神經(jīng)網(wǎng)絡、算法信息論、網(wǎng)絡剪枝、神經(jīng)科學這些理論中獲得啟發(fā)。

為了生成WANN,必須將權(quán)重對網(wǎng)絡的影響最小化,用權(quán)重隨機采樣可以保證最終的網(wǎng)絡是架構(gòu)優(yōu)化的產(chǎn)物,但是在高維空間進行權(quán)重隨機采樣的難度太大。

研究人員采取了“簡單粗暴”的方法,對所有權(quán)重強制進行權(quán)重共享(weight-sharing),讓權(quán)重值的數(shù)量減少到一個。這種高效的近似可以推動對更好架構(gòu)的搜索。

操作步驟

解決了權(quán)重初始化的問題,接下來的問題就是如何收搜索權(quán)重不可知神經(jīng)網(wǎng)絡。它分為四個步驟:

1、創(chuàng)建初始的最小神經(jīng)網(wǎng)絡拓撲群。

2、通過多個rollout評估每個網(wǎng)絡,并對每個rollout分配不同的共享權(quán)重值。

3、根據(jù)性能和復雜程度對網(wǎng)絡進行排序。

4、根據(jù)排名最高的網(wǎng)絡拓撲來創(chuàng)建新的群,通過競爭結(jié)果進行概率性的選擇。

然后,算法從第2步開始重復,在連續(xù)迭代中,產(chǎn)生復雜度逐漸增加的權(quán)重不可知拓撲(weight agnostic topologies )。

拓撲搜索

用于搜索神經(jīng)網(wǎng)絡拓撲的操作受到神經(jīng)進化算法(NEAT)的啟發(fā)。在NEAT中,拓撲和權(quán)重值同時優(yōu)化,研究人員忽略權(quán)重,只進行拓撲搜索操作。

上圖展示了網(wǎng)絡拓撲空間搜索的具體操作:

一開始網(wǎng)絡上是最左側(cè)的最小拓撲結(jié)構(gòu),僅有部分輸入和輸出是相連的。

然后,網(wǎng)絡按以下三種方式進行更改:

1、插入節(jié)點:拆分現(xiàn)有連接插入新節(jié)點。

2、添加連接:連接兩個之前未連接的節(jié)點,添加新連接。

3、更改激活函數(shù):重新分配隱藏節(jié)點的激活函數(shù)。

圖的最右側(cè)展示了權(quán)重在[2,2]取值范圍內(nèi)可能的激活函數(shù),如線性函數(shù)、階躍函數(shù)、正弦余弦函數(shù)、ReLU等等。

權(quán)重依然重要

WANN與傳統(tǒng)的固定拓撲網(wǎng)絡相比,可以使用單個的隨機共享權(quán)重也能獲得更好的結(jié)果。

雖然WANN在多項任務中取得了最佳結(jié)果,但WANN并不完全獨立于權(quán)重值,當隨機分配單個權(quán)重值時,有時也會失敗。

WANN通過編碼輸入和輸出之間的關系起作用,雖然權(quán)重的大小的重要性并不高,但它們的一致性,尤其是符號的一致性才是關鍵。

隨機共享權(quán)重的另一個好處是,調(diào)整單個參數(shù)的影響變得不重要,無需使用基于梯度的方法。

強化學習任務中的結(jié)果讓作者考慮推廣WANN方法的應用范圍。他們又測試了WANN在圖像分類基礎任務MNIST上的表現(xiàn),結(jié)果在權(quán)重接近0時效果不佳。

有Reddit網(wǎng)友質(zhì)疑WANN的結(jié)果,對于隨機權(quán)重接近于0的情況,該網(wǎng)絡的性能并不好,先強化學習實驗中的具體表現(xiàn)就是,小車會跑出限定范圍。

對此,作者給出解釋,在權(quán)重趨于0的情況下,網(wǎng)絡的輸出也會趨于0,所以后期的優(yōu)化很難達到較好的性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6259

    瀏覽量

    112002
  • 機器學習
    +關注

    關注

    67

    文章

    8567

    瀏覽量

    137259

原文標題:谷歌發(fā)布顛覆性研究:不訓練不調(diào)參,AI自動構(gòu)建超強網(wǎng)絡,告別煉丹一大步

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    1500kW閃充樁+第二代刀片電池,9分鐘充滿,比亞迪“顛覆性技術”亮相!

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)“顛覆性技術”揭曉!3月5日晚,比亞迪正式發(fā)布了第二代刀片電池和配套的閃充技術,包括單槍1500kW功率的比亞迪閃充樁,以及閃充樁建設計劃等。憑借本次推出的一系列技術
    的頭像 發(fā)表于 03-06 09:06 ?7862次閱讀
    1500kW閃充樁+第二代刀片電池,9分鐘充滿,比亞迪“<b class='flag-5'>顛覆性</b>技術”亮相!

    速騰聚創(chuàng)發(fā)布“創(chuàng)世”架構(gòu),激光雷達開啟圖像化感知新紀元

    近日,深圳這座科技創(chuàng)新之城迎來了一場行業(yè)盛會——速騰聚創(chuàng)(RoboSense)舉辦2026 Tech Day技術開放日,正式發(fā)布全新“創(chuàng)世”數(shù)字化架構(gòu),并同步推出兩款基于該架構(gòu)的旗艦SPAD-SoC芯片,標志著激光雷達正式邁入圖像化感知新時代,為智能汽車與機器人產(chǎn)業(yè)帶來
    的頭像 發(fā)表于 04-23 09:55 ?1649次閱讀

    靈汐科技深度編的2026類腦計算芯片技術發(fā)展研究報告正式發(fā)布

    近日,《類腦計算芯片技術發(fā)展研究報告(2026)》 在武漢正式發(fā)布。作為核心編單位,北京靈汐科技有限公司深度參與了此次報告的編制工作,與中國電子技術標準化研究院、清華大學、中國電子科
    的頭像 發(fā)表于 04-14 16:16 ?567次閱讀

    江南大學:AI賦能合成生物傳感,四大領域迎來顛覆性突破

    - 學習(DBTL)全周期的系統(tǒng)整合框架,明確剖析了 AI 賦能細胞型合成生物學傳感器、AI 優(yōu)化無細胞型合成生物學傳感器的差異化工程范式,揭示了計算智能破解兩類傳感平臺特異性技術瓶頸的核心機制。研究將 AI 驅(qū)動的合成生物
    的頭像 發(fā)表于 04-02 20:00 ?6228次閱讀
    江南大學:AI賦能合成生物傳感,四大領域迎來<b class='flag-5'>顛覆性</b>突破

    瑞為技術編起草的具身智能領域首個行業(yè)標準正式發(fā)布

    近日,由中國信息通信研究院牽頭、瑞為技術等40多家單位聯(lián)合編起草的具身智能領域首個行業(yè)標準正式發(fā)布,將于6月1日正式實施,標志著具身智能評測邁入“有標可依”的新階段。
    的頭像 發(fā)表于 04-01 11:34 ?420次閱讀

    谷歌評論卡,碰一碰即可完成谷歌評論 #谷歌評論卡 #NFC標簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發(fā)布于 :2026年01月15日 17:02:00

    工業(yè)制造顛覆性挑戰(zhàn)

    關于工業(yè)制造顛覆性挑戰(zhàn)及可能的戰(zhàn)略選擇。1.AI領域:生成式AI估值修正,泡沫不會全面破裂,工業(yè)AI需依托專業(yè)數(shù)據(jù)、流程與基礎設施,行業(yè)將迎來炒作退潮、價值回歸與應
    的頭像 發(fā)表于 12-17 22:09 ?586次閱讀
    工業(yè)制造<b class='flag-5'>顛覆性</b>挑戰(zhàn)

    PID調(diào)實用方法

    ) 周圍抖動 在講了PI和PD系統(tǒng)的調(diào)節(jié)方式后,下面分享一下PID系統(tǒng)的調(diào)節(jié)方式,首先我們先按照PI系統(tǒng)進行調(diào)節(jié),先調(diào)P在調(diào)I,讓系統(tǒng)有一定的過沖后達到穩(wěn)定. 在出現(xiàn)了上面的 PI 波形之后,下面就開始調(diào)節(jié)D,慢慢增加D,將過沖補償?shù)?,直到系統(tǒng)穩(wěn)定,最終效果如下圖,PID系統(tǒng)就基本調(diào)節(jié)完成了
    發(fā)表于 11-28 07:17

    恭賀!同星智能TSMaster項目榮獲2025全國顛覆性技術創(chuàng)新大賽優(yōu)勝獎

    近日,同星智能憑借“軟硬件解耦、快速迭代、可不斷被軟件定義的汽車電子基礎工具鏈”項目,榮膺2025全國顛覆性技術創(chuàng)新大賽優(yōu)勝獎。這是同星智能在獲得金輯獎、AITX領航創(chuàng)新技術獎、測量與標定技術獎后
    的頭像 發(fā)表于 11-07 20:05 ?767次閱讀
    恭賀!同星智能TSMaster項目榮獲2025全國<b class='flag-5'>顛覆性</b>技術創(chuàng)新大賽優(yōu)勝獎

    安信可雷達模組如何快速配網(wǎng)和調(diào)?

    安信可配網(wǎng)助手app介紹 安信可配網(wǎng)助手app是由安信可開發(fā)的一款 可拿來對安信可模組進行配網(wǎng)以及對雷達模組進行調(diào)的APP 。 下面將對APP搭配安信可雷達模組Rd-01、Rd-03_V2
    的頭像 發(fā)表于 10-31 08:59 ?1019次閱讀
    安信可雷達模組如何快速配網(wǎng)和<b class='flag-5'>調(diào)</b><b class='flag-5'>參</b>?

    傾佳電子Hydrogen Rectifier制氫電源拓撲、技術演進與SiC功率模塊的顛覆性作用

    傾佳電子Hydrogen Rectifier制氫電源拓撲、技術演進與SiC功率模塊的顛覆性作用 傾佳電子(Changer Tech)是一家專注于功率半導體和新能源汽車連接器的分銷商。主要服務于中國
    的頭像 發(fā)表于 09-05 10:37 ?766次閱讀
    傾佳電子Hydrogen Rectifier制氫電源拓撲、技術演進與SiC功率模塊的<b class='flag-5'>顛覆性</b>作用

    NVIDIA RTX AI加速FLUX.1 Kontext系列圖像模型

    Black Forest Labs,作為全球頂尖 AI 研究實驗室之一,為圖像生成領域帶來顛覆性變革。
    的頭像 發(fā)表于 08-05 16:27 ?1356次閱讀
    NVIDIA RTX AI加速FLUX.1 Kontext系列圖像模型

    工業(yè)設備遠程監(jiān)控的“顛覆性突破”:邊緣計算網(wǎng)關讓千里之外如在眼前

    工業(yè)設備遠程監(jiān)控的“顛覆性突破”:邊緣計算網(wǎng)關讓千里之外如在眼前 隨著工業(yè)領域?qū)χ悄芑?、?shù)字化管理需求的不斷攀升,工業(yè)設備遠程監(jiān)控成為提升生產(chǎn)效率、降低運維成本的重要手段,藍蜂網(wǎng)關憑借專業(yè)技術與豐富
    的頭像 發(fā)表于 08-05 15:37 ?702次閱讀

    顛覆性應用指南:EtherCAT轉(zhuǎn)PROFINET網(wǎng)關的工業(yè)場景核爆方案大全

    EtherCAT(以太網(wǎng)控制自動化技術)的核心優(yōu)勢,EtherCAT( Ethernet for Control Automation Technology )是一種高性能、實時強的工業(yè)以太網(wǎng)協(xié)議
    的頭像 發(fā)表于 07-28 15:01 ?537次閱讀
    <b class='flag-5'>顛覆性</b>應用指南:EtherCAT轉(zhuǎn)PROFINET網(wǎng)關的工業(yè)場景核爆方案大全

    邊緣計算如何顛覆人工智能變革

    2025年以來,DeepSeek發(fā)布的大模型熱度居高不下,再次點燃了全球?qū)θ斯ぶ悄艿臒o限熱情。深度學習模型以指數(shù)級速度膨脹,性能不斷突破極限,成本效益也在向著更低的趨勢發(fā)展,這為各行各業(yè)帶來了顛覆性
    的頭像 發(fā)表于 05-30 09:29 ?1182次閱讀
    彝良县| 修武县| 沂源县| 惠来县| 韶关市| 武清区| 霞浦县| 手游| 宁德市| 南川市| 肃宁县| 康保县| 抚宁县| 永济市| 成安县| 松桃| 泸定县| 新疆| 玛曲县| 呼图壁县| 容城县| 拉孜县| 洛南县| 岑溪市| 高安市| 柘城县| 乌拉特前旗| 辽中县| 博野县| 江达县| 昆明市| 宜城市| 邯郸县| 峡江县| 布拖县| 乐亭县| 阿克苏市| 肇源县| 云霄县| 田阳县| 师宗县|