日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Adam模型的新改進(jìn)“Rectified Adam”

DPVg_AI_era ? 來源:lq ? 2019-09-13 16:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

UIUC華人博士生團(tuán)隊提出了對常用機(jī)器學(xué)習(xí)模型優(yōu)化器Adam的新改進(jìn)RAdam,省去了使用Adam必須的“預(yù)熱”環(huán)節(jié),既能保證學(xué)習(xí)率和收斂速度,又能有效避免模型陷入“局部最優(yōu)解”的陷阱,堪稱Adam的優(yōu)秀接班人!

近日,UIUC的華人博士生Liyuan Liu等人的一篇新論文中介紹了Adam模型的新改進(jìn)“Rectified Adam”(簡稱RAdam)。這是基于原始Adam作出的改進(jìn),它既能實(shí)現(xiàn)Adam快速收斂的優(yōu)點(diǎn),又具備SGD方法的優(yōu)勢,令模型收斂至質(zhì)量更高的結(jié)果。

有國外網(wǎng)友親測,效果拔群。

以下是網(wǎng)友測試過程和RAdam的簡介:

我已經(jīng)在FastAI框架下測試了RAdam,并快速獲得了高精度新記錄,而不是ImageNette上兩個難以擊敗的FastAI排行榜得分。我今年測試了許多論文中的模型,大部分模型似乎在文中給出的特定數(shù)據(jù)集上表現(xiàn)良好,而在我嘗試的新的數(shù)據(jù)集上表現(xiàn)不佳。但RAdam不一樣,看起來真的實(shí)現(xiàn)了性能提升,可能成為vanilla Adam的永久“接班人”。

RAdam具備在多種學(xué)習(xí)率下的強(qiáng)大性能,同時仍能快速收斂并實(shí)現(xiàn)更高的性能(CIFAR數(shù)據(jù)集)

RAdam和XResNet50,5個epoch精度即達(dá)到86%

Imagenette排行榜:達(dá)到當(dāng)前最高性能84.6%

下面來看看RAdam的內(nèi)部機(jī)制,看看為什么能夠?qū)崿F(xiàn)更優(yōu)質(zhì)的收斂,更好的訓(xùn)練穩(wěn)定性(相對所選擇的學(xué)習(xí)率更不敏感),為何基于幾乎所有AI應(yīng)用都能實(shí)現(xiàn)更好的準(zhǔn)確性和通用性。

不只是對于CNN:RAdam在Billion Word Dataset上的表現(xiàn)優(yōu)于LSTM

RAdam:無需預(yù)熱,避免模型收斂至“局部最優(yōu)解”

作者指出,雖然每個人都在努力實(shí)現(xiàn)快速穩(wěn)定的優(yōu)化算法,但包括Adam,RMSProp等在內(nèi)的自適應(yīng)學(xué)習(xí)率優(yōu)化器都存在收斂到質(zhì)量較差的局部最優(yōu)解的可能。因此,幾乎每個人都使用某種形式的“預(yù)熱”方式來避免這種風(fēng)險。但為什么需要預(yù)熱?

由于目前對AI社區(qū)中對于“預(yù)熱”出現(xiàn)的潛在原因,甚至最佳實(shí)踐的理解有限,本文作者試圖揭示這個問題的基礎(chǔ)。他們發(fā)現(xiàn),根本問題是自適應(yīng)學(xué)習(xí)率優(yōu)化器具有太大的變化,特別是在訓(xùn)練的早期階段,并且可能由于訓(xùn)練數(shù)據(jù)量有限出現(xiàn)過度跳躍,因此可能收斂至局部最優(yōu)解。

使用原始Adam必須預(yù)熱,否則正態(tài)分布會變得扭曲,是否預(yù)熱的分布對比見上圖

因此,當(dāng)優(yōu)化器僅使用有限的訓(xùn)練數(shù)據(jù)時,采用“預(yù)熱”(這一階段的學(xué)習(xí)率要慢得多)是自適應(yīng)優(yōu)化器要求抵消過度方差的要求。

簡而言之,vanilla Adam和其他自適應(yīng)學(xué)習(xí)速率優(yōu)化器可能會基于訓(xùn)練早期數(shù)據(jù)太少而做出錯誤決策。因此,如果沒有某種形式的預(yù)熱,很可能在訓(xùn)練一開始便會收斂局部最優(yōu)解,這使得訓(xùn)練曲線由于糟糕的開局而變得更長、更難。

然后,作者在不用預(yù)熱的情況下運(yùn)行了Adam,但是在前2000次迭代(adam-2k)中避免使用動量,結(jié)果實(shí)現(xiàn)了與“Adam+預(yù)熱”差不多的結(jié)果,從而驗證了“預(yù)熱”在訓(xùn)練的初始階段中起到“降低方差”的作用,并可以避免Adam在沒有足夠數(shù)據(jù)的情況下在開始訓(xùn)練時即陷入局部最優(yōu)解。

適用于多個數(shù)據(jù)集,堪稱Adam的優(yōu)秀“接班人”

我們可以將“預(yù)熱”作為降低方差的方法,但所需的預(yù)熱程度未知,而且具體情況會根據(jù)數(shù)據(jù)集不同而變化,本文確定了一個數(shù)學(xué)算法,作為“動態(tài)方差減少器”。作者建立了一個“整流項”,可以緩慢而穩(wěn)定地允許將自適應(yīng)動量作為基礎(chǔ)方差的函數(shù)進(jìn)行充分表達(dá)。完整模型是這樣的:

作者指出,在某些情況下,由于衰減率和基本方差的存在,RAdam可以在動量等效的情況下退化為SGD。

實(shí)驗表明,RAdam優(yōu)于傳統(tǒng)的手動預(yù)熱調(diào)整,其中需要預(yù)熱或猜測需要預(yù)熱的步驟數(shù)。RAdam自動提供方差縮減,在各種預(yù)熱長度和各種學(xué)習(xí)率下都優(yōu)于手動預(yù)熱。

總之,RAdam可以說是AI最先進(jìn)的優(yōu)化器,可以說是Adam的優(yōu)秀接班人!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4423

    瀏覽量

    67952
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8569

    瀏覽量

    137353
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1240

    瀏覽量

    26279

原文標(biāo)題:Adam可以換了?UIUC中國博士生提出RAdam,收斂快精度高,大小模型通吃

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    ADAM - 4572:一款強(qiáng)大的1端口Modbus網(wǎng)關(guān)

    ADAM - 4572:一款強(qiáng)大的1端口Modbus網(wǎng)關(guān) 在工業(yè)自動化和通信領(lǐng)域,Modbus網(wǎng)關(guān)扮演著至關(guān)重要的角色,它能夠?qū)崿F(xiàn)不同設(shè)備之間的數(shù)據(jù)通信和協(xié)議轉(zhuǎn)換。今天,我們就來詳細(xì)介紹一款性能出色
    的頭像 發(fā)表于 05-12 15:50 ?54次閱讀

    ADAM TECH 40G Base SR4 100m QSFP+光收發(fā)模塊深度解析

    ADAM TECH 40G Base SR4 100m QSFP+光收發(fā)模塊深度解析 在高速數(shù)據(jù)傳輸領(lǐng)域,光收發(fā)模塊的性能至關(guān)重要。今天我們就來詳細(xì)了解一下ADAM TECH的TVDQSFPPSR4
    的頭像 發(fā)表于 05-11 11:30 ?243次閱讀

    ADAM三TECH 1.25G SFP BIDI 1310nm/1550nm 光模塊技術(shù)解析

    ADAM三TECH 1.25G SFP BIDI 1310nm/1550nm 光模塊技術(shù)解析 在當(dāng)今高速發(fā)展的通信領(lǐng)域,光模塊作為數(shù)據(jù)傳輸?shù)年P(guān)鍵組件,其性能和可靠性至關(guān)重要。ADAM三TECH推出
    的頭像 發(fā)表于 05-11 11:15 ?233次閱讀

    零基礎(chǔ)手寫大模型資料2026

    零基礎(chǔ)純代碼手寫大模型:從數(shù)學(xué)原理到工程實(shí)踐的技術(shù)解析 在深度學(xué)習(xí)框架高度封裝的今天,理解大模型底層原理的開發(fā)者愈發(fā)稀缺。本文將剝離復(fù)雜框架的依賴,從數(shù)學(xué)基礎(chǔ)出發(fā),解析如何用基礎(chǔ)代碼實(shí)現(xiàn)一個具備
    發(fā)表于 05-01 17:44

    齊魯工業(yè)大學(xué) Adam戰(zhàn)隊

    發(fā)表于 04-08 17:01

    Adam Tech連接器可以被國產(chǎn)連接器替代嗎?

    Adam Tech連接器在高可靠性和高端應(yīng)用領(lǐng)域仍具備一定優(yōu)勢,但國產(chǎn)連接器已經(jīng)在中低端及部分中端應(yīng)用中實(shí)現(xiàn)了有效替代。
    的頭像 發(fā)表于 04-08 10:10 ?223次閱讀
    <b class='flag-5'>Adam</b> Tech連接器可以被國產(chǎn)連接器替代嗎?

    ASPICE 是什么?汽車系統(tǒng)過程改進(jìn)和能力確定概念(一)

    Determination ,中文譯名為汽車軟件過程改進(jìn)與能力評定,在 4.0 版本迭代后,其覆蓋范圍擴(kuò)展至 硬件、機(jī)器學(xué)習(xí)等領(lǐng)域 ,“S”的含義從軟件變?yōu)橄到y(tǒng),名稱變?yōu)锳utomotive
    發(fā)表于 04-02 13:53

    Adam Tech NPC-5E-010-GY網(wǎng)線組件解析

    在現(xiàn)代工業(yè)通信系統(tǒng)、數(shù)據(jù)網(wǎng)絡(luò)以及嵌入式設(shè)備中,RJ45以太網(wǎng)線束組件承擔(dān)著關(guān)鍵的數(shù)據(jù)傳輸任務(wù)。穩(wěn)定可靠的網(wǎng)絡(luò)連接不僅關(guān)系到系統(tǒng)通信質(zhì)量,也直接影響設(shè)備的整體運(yùn)行穩(wěn)定性。
    的頭像 發(fā)表于 03-05 20:00 ?151次閱讀
    <b class='flag-5'>Adam</b> Tech NPC-5E-010-GY網(wǎng)線組件解析

    Adam Tech NPC-6-003-BU線束組件技術(shù)解析與替代方案建議

    在工業(yè)通信設(shè)備、網(wǎng)絡(luò)設(shè)備以及嵌入式系統(tǒng)中,RJ45以太網(wǎng)線束組件是實(shí)現(xiàn)設(shè)備之間高速數(shù)據(jù)傳輸?shù)闹匾B接部件。穩(wěn)定可靠的網(wǎng)絡(luò)線束不僅能保證信號傳輸質(zhì)量,還能提高設(shè)備系統(tǒng)運(yùn)行的整體可靠性。
    的頭像 發(fā)表于 03-05 19:47 ?162次閱讀
    <b class='flag-5'>Adam</b> Tech NPC-6-003-BU線束組件技術(shù)解析與替代方案建議

    基于NVIDIA Isaac庫開發(fā)的機(jī)器人調(diào)酒師ADAM亮相國際賽場

    基于 NVIDIA Isaac 庫開發(fā)的機(jī)器人調(diào)酒師 ADAM,為維加斯黃金騎士隊的冰球粉絲帶來了身臨其境的未來式服務(wù)體驗。
    的頭像 發(fā)表于 12-24 10:05 ?664次閱讀

    在Ubuntu20.04系統(tǒng)中訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗

    , activation=\'softmax\', name=\"FC2\"))2. 編譯模型 model.compile(optimizer=\'adam\', loss
    發(fā)表于 10-22 07:03

    Adam Tech推拉式連接器產(chǎn)品特點(diǎn)

    Adam Tech 提供完整系列的推拉式連接器,涵蓋金屬與塑料款式、直角插座以及應(yīng)力緩解設(shè)計,滿足各種應(yīng)用需求。每款產(chǎn)品皆提供多樣化選項,包括不同的針腳數(shù)、安裝方式及尺寸。另有防水型號,符合
    的頭像 發(fā)表于 09-16 14:18 ?799次閱讀

    基于改進(jìn)滑模觀測器的PMSM無位置傳感器控制

    為解決傳統(tǒng)基于滑模觀測器永磁同步電機(jī)無位置傳感器控制系統(tǒng)存在的抖振問題,本文提出了一種基于非線性能量函數(shù)參考模型的新型改進(jìn)滑模觀測器。在分析非線性能量函數(shù)參考模型的基礎(chǔ)上,設(shè)計了改進(jìn)
    發(fā)表于 08-06 14:38

    改進(jìn)電壓模型的異步電機(jī)無速度傳感器矢量控制

    無速度傳感器矢量控制技術(shù)能夠有效提高交流傳動系統(tǒng)的可靠性,降低系統(tǒng)成本。該技術(shù)的核心問題是準(zhǔn)確獲取電機(jī)轉(zhuǎn)子轉(zhuǎn)速,并將其反饋到速度閉環(huán)控制環(huán)節(jié)。介紹一種采用改進(jìn)模型參考自適應(yīng)轉(zhuǎn)速估計方法的異步電機(jī)矢量
    發(fā)表于 05-28 15:43

    改進(jìn)GPC算法在永磁同步電機(jī)控制系統(tǒng)中的應(yīng)用

    (CARIMA)模型?;诖?b class='flag-5'>模型和金元郁等提出的改進(jìn)廣義預(yù)測控制算法(JGPC)設(shè)計出了適用于 PMSM驅(qū)動系統(tǒng)的速度環(huán)的改進(jìn)廣義預(yù)測控制器。仿真實(shí)驗表明,JCPC控制器可以很好的跟蹤
    發(fā)表于 05-28 15:41
    沈阳市| 平谷区| 麻江县| 马关县| 米林县| 汕尾市| 吴堡县| 依兰县| 布尔津县| 甘肃省| 伊金霍洛旗| 临安市| 南漳县| 周宁县| 库伦旗| 大足县| 年辖:市辖区| 靖宇县| 静安区| 北碚区| 礼泉县| 巴林左旗| 栖霞市| 个旧市| 临潭县| 多伦县| 南涧| 金湖县| 莱阳市| 泾阳县| 南澳县| 清丰县| 元朗区| 英超| 宜丰县| 文安县| 利津县| 防城港市| 裕民县| 康保县| 贵港市|