日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ai真的到了嗎,這些業(yè)界的人都看不懂的問(wèn)題,你怎么看

mK5P_AItists ? 來(lái)源:未知 ? 作者:龔婷 ? 2018-03-19 10:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今天,OpenAI在官方博客上丟出了7個(gè)研究過(guò)程中發(fā)現(xiàn)的未解決問(wèn)題。

OpenAI希望這些問(wèn)題能夠成為新手入坑AI的一種有趣而有意義的方式,也幫助從業(yè)者提升技能。

OpenAI版AI界七大未解之謎,現(xiàn)在正式揭曉——

丨1. Slitherin

難度指數(shù):☆☆

實(shí)現(xiàn)并解決貪吃蛇的多玩家版克隆作為Gym環(huán)境。

環(huán)境:場(chǎng)地很大,里面有多條蛇,蛇通過(guò)吃隨機(jī)出現(xiàn)的水果生長(zhǎng),一條蛇在與另一條蛇、自己或墻壁相撞時(shí)即死亡,當(dāng)所有的蛇都死了,游戲結(jié)束。

智能體:使用自己選擇的自我對(duì)弈的RL算法解決環(huán)境問(wèn)題。你需要嘗試各種方法克服自我對(duì)弈的不穩(wěn)定性。

檢查學(xué)習(xí)行為:智能體是否學(xué)會(huì)了適時(shí)捕捉食物并避開(kāi)其他蛇類?是否學(xué)會(huì)了攻擊、陷害、或者聯(lián)合起來(lái)對(duì)付競(jìng)爭(zhēng)對(duì)手?

丨2. 分布式強(qiáng)化學(xué)習(xí)中的參數(shù)平均

難度指數(shù):☆☆☆

這指的是探究參數(shù)平均方案對(duì)RL算法中樣本復(fù)雜度和通信量影響。一種簡(jiǎn)單的解決方法是平均每個(gè)更新的每個(gè)worker的梯度,但也可以通過(guò)獨(dú)立地更新worker、減少平均參數(shù)節(jié)省通信帶寬。

這樣做還有一個(gè)好處:在任何給定的時(shí)間內(nèi),我們都有不同參數(shù)的智能體,可能出現(xiàn)更好的探測(cè)行為。另一種可能是使用EASGD這樣的算法,它可以在每次更新時(shí)將參數(shù)部分結(jié)合在一起。

丨3. 通過(guò)生成模型完成的不同游戲中的遷移學(xué)習(xí)

難度指數(shù):☆☆☆

這個(gè)流程如下:

訓(xùn)練11個(gè)Atari游戲的策略。從每個(gè)游戲的策略中,生成1萬(wàn)個(gè)軌跡,每個(gè)軌跡包含1000步行動(dòng)。

將一個(gè)生成模型(如論文Attention Is All You Need提出的Transformer)與10個(gè)游戲產(chǎn)生的軌跡相匹配。

然后,在第11場(chǎng)比賽中微調(diào)上述模型。

你的目標(biāo)是量化10場(chǎng)比賽預(yù)訓(xùn)練時(shí)的好處。這個(gè)模型需要什么程度的訓(xùn)練才能發(fā)揮作用?當(dāng)?shù)?1個(gè)游戲的數(shù)據(jù)量減少10x時(shí),效果的大小如何變化?如果縮小100x呢?

丨4. 線性注意Transformer

難度指數(shù):☆☆☆

Transformer模型使用的是softmax中的軟注意力(soft attention)。如果可以使用線性注意力(linear attention),我們就能將得到的模型用于強(qiáng)化學(xué)習(xí)。

具體來(lái)說(shuō),在復(fù)雜環(huán)境下使用Transformer部署RL不切實(shí)際,但運(yùn)行一個(gè)具有快速權(quán)重(fast weight)的RNN可行。

你的目標(biāo)是接受任何語(yǔ)言建模任務(wù),訓(xùn)練Transformer,然后找到一種在不增加參數(shù)總數(shù)情況下,用具有不同超參數(shù)的線性注意Transformer獲取每個(gè)字符/字的相同位元的方法。

先給你潑盆冷水:這可能是無(wú)法實(shí)現(xiàn)的。再給你一個(gè)潛在的有用提示,與使用softmax注意力相比,線性注意轉(zhuǎn)化器很可能需要更高的維度key/value向量,這能在不顯著增加參數(shù)數(shù)量的情況下完成。

丨5. 已學(xué)習(xí)數(shù)據(jù)的擴(kuò)充

難度指數(shù):☆☆☆

可以用學(xué)習(xí)過(guò)的數(shù)據(jù)VAE執(zhí)行“已學(xué)習(xí)數(shù)據(jù)的擴(kuò)充”。

我們首先可能需要在輸入數(shù)據(jù)上訓(xùn)練一個(gè)VAE,然后將每個(gè)訓(xùn)練點(diǎn)編碼到一個(gè)潛在的空間,之后在其中應(yīng)用一個(gè)簡(jiǎn)單(如高斯)擾動(dòng),最后解碼回到觀察的空間。用這種方法是否能得到更好的泛化,目前還是一個(gè)謎題。

這種數(shù)據(jù)擴(kuò)充的一個(gè)潛在優(yōu)勢(shì)是,它可能包含視角變換、場(chǎng)景光纖變化等很多非線性

轉(zhuǎn)換。

丨6. 強(qiáng)化學(xué)習(xí)中的正則化

難度指數(shù):☆☆☆☆

這指的是實(shí)驗(yàn)性研究和定性解釋不同正則化方法對(duì)RL算法的影響。

在監(jiān)督學(xué)習(xí)中,正則化對(duì)于優(yōu)化模型和防止過(guò)擬合具有極其重要的意義,其中包含一些效果很贊的方法,如dropout、批標(biāo)準(zhǔn)化和L2正則化等。

然而,在策略梯度和Q-learning等強(qiáng)化學(xué)習(xí)算法上,研究人員還沒(méi)有找到合適的正則化方法。順便說(shuō)一下,人們?cè)赗L中使用的模型要比在監(jiān)督學(xué)習(xí)中使用的模型小得多,因?yàn)榇竽P捅憩F(xiàn)更差。

丨7. Olympiad Inequality問(wèn)題的自動(dòng)解決方案

難度指數(shù):☆☆☆☆☆

Olympiad Inequality問(wèn)題很容易表達(dá),但解決這個(gè)問(wèn)題往往需要巧妙的手法。

建立一個(gè)關(guān)于Olympiad Inequality問(wèn)題的數(shù)據(jù)集,編寫(xiě)一個(gè)可以解決大部分問(wèn)題的程序。目前還不清楚機(jī)器學(xué)習(xí)在這里是否有用,但你可以用一個(gè)學(xué)習(xí)的策略減少分支因素。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41315

    瀏覽量

    302691
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50366

    瀏覽量

    267056

原文標(biāo)題:AI界的七大未解之謎:OpenAI丟出一組AI研究課題

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Java轉(zhuǎn) AI高薪領(lǐng)域必備 從0到1打通生產(chǎn)級(jí)AI Agent開(kāi)發(fā) 教程資料

    的是直接的“利潤(rùn)增量”。 Java程序員轉(zhuǎn)型AI Agent開(kāi)發(fā),其最大的經(jīng)濟(jì)優(yōu)勢(shì)在于“跨界的稀缺性”。懂大模型底層算法的人往往不懂企業(yè)級(jí)復(fù)雜的Java后端架構(gòu)、微服務(wù)治理和歷史遺留的沉疴數(shù)據(jù);而傳統(tǒng)
    發(fā)表于 04-29 17:08

    PCB別人包地包地,但別人的隔離度比你好10dB不止

    就著看吧。 關(guān)鍵是這篇文章的題目就給得怪嚇人的啊,難道那么多年的老設(shè)計(jì)工程師真的不懂包地?這樣吧,Chris今兒給大家展示一個(gè)例子,看看大家的想法吧…… 最近Chris做了塊測(cè)試板來(lái)模擬表層射頻信號(hào)包
    發(fā)表于 04-13 11:21

    剛?cè)胄?b class='flag-5'>看不懂電路圖怎么辦?

    剛?cè)胄?b class='flag-5'>看不懂電路圖怎么辦?很多電子新手剛?cè)胄袝r(shí),面對(duì)密密麻麻的電路圖總會(huì)犯怵:“這么多元件和線路,到底從哪看起?”別慌!今天就帶大家拆解電路圖的核心邏輯,只要掌握這5大模塊,看懂電路圖真的沒(méi)那么難
    的頭像 發(fā)表于 04-02 09:01 ?335次閱讀
    剛?cè)胄?b class='flag-5'>看不懂</b>電路圖怎么辦?

    VirtualLab Fusion光源的這些設(shè)置方法,掌握了嗎?

    VirtualLab Fusion中光源設(shè)置的四種方式,歡迎關(guān)注黌論網(wǎng)校觀看本期案例視頻,獲取相應(yīng)代碼。 好了,今天的分享就到這里,學(xué)會(huì)了嗎?
    發(fā)表于 04-02 08:19

    工業(yè)用電總跳閘,的電抗器真的選對(duì)了嗎?

    是不是也遇到過(guò)這樣的困擾:工廠生產(chǎn)線上的設(shè)備頻繁跳閘,檢查了半天也沒(méi)找出原因?配電柜里的斷路器總是無(wú)緣無(wú)故地跳開(kāi),不僅耽誤生產(chǎn),還可能燒毀昂貴的設(shè)備?這些頭疼不已的問(wèn)題,根源可能并不在設(shè)備本身
    的頭像 發(fā)表于 02-06 13:05 ?489次閱讀
    工業(yè)用電總跳閘,<b class='flag-5'>你</b>的電抗器<b class='flag-5'>真的</b>選對(duì)<b class='flag-5'>了嗎</b>?

    華芯微電子紅外智能開(kāi)發(fā)軟件的核心亮點(diǎn)

    還在為紅外遙控器方案開(kāi)發(fā)頭疼?不懂單片機(jī)編程、看不懂復(fù)雜代碼,卻想快速落地項(xiàng)目?今天給大家推薦一款“開(kāi)發(fā)神器”—— 華芯微紅外智能開(kāi)發(fā)軟件,讓普通紅外發(fā)射方案開(kāi)發(fā)變得簡(jiǎn)單高效,新手也能輕松拿捏!
    的頭像 發(fā)表于 01-20 16:05 ?1046次閱讀
    華芯微電子紅外智能開(kāi)發(fā)軟件的核心亮點(diǎn)

    簡(jiǎn)單認(rèn)識(shí)音頻時(shí)鐘的精度與相噪

    前 3 期我們聊了音頻時(shí)鐘的核心作用、對(duì)音質(zhì)的影響,以及多設(shè)備場(chǎng)景的應(yīng)用 —— 但不少朋友問(wèn):“精度 10ppm、相噪 -120dBc/Hz,這些數(shù)字到底是什么意思?選設(shè)備時(shí)該怎么看?”
    的頭像 發(fā)表于 12-23 09:15 ?1051次閱讀
    簡(jiǎn)單認(rèn)識(shí)音頻時(shí)鐘的精度與相噪

    第5章 定時(shí)器與數(shù)碼管基礎(chǔ)(5.1 5.2)

    ? ? ? 隨著學(xué)習(xí)內(nèi)容越來(lái)越多,個(gè)別細(xì)節(jié)可能會(huì)感覺(jué)略有吃力。但是不要擔(dān)心,這個(gè)跟小孩學(xué)走路一樣,剛開(kāi)始走得不太穩(wěn),沒(méi)關(guān)系,多走幾步多練練。教材的時(shí)候要注意專心,一遍看不懂,思考一下,再回頭第二
    的頭像 發(fā)表于 11-20 17:43 ?697次閱讀
    第5章 定時(shí)器與數(shù)碼管基礎(chǔ)(5.1 5.2)

    華為云Flexus AI智能體,讓每家企業(yè)擁有開(kāi)箱即用的AI超能力

    2024年,不談AI的企業(yè)已被時(shí)代拋下。但真正試過(guò)的人知道:大模型很強(qiáng),落地很難。招不到AI工程師、搞不懂復(fù)雜參數(shù)、擔(dān)心數(shù)據(jù)泄露、算力成本
    的頭像 發(fā)表于 11-17 17:07 ?1013次閱讀
    華為云Flexus <b class='flag-5'>AI</b>智能體,讓每家企業(yè)<b class='flag-5'>都</b>擁有開(kāi)箱即用的<b class='flag-5'>AI</b>超能力

    AD421環(huán)路輸出,沒(méi)有電流

    本人小白,看不懂原理圖,搞的AD421模塊測(cè)不出來(lái)4-20mA電流,有償服務(wù)。
    發(fā)表于 11-17 14:21

    激光位移傳感器參數(shù)看不懂?一篇講透關(guān)鍵指標(biāo)

    今天用通俗語(yǔ)言拆解3個(gè)必看參數(shù),結(jié)合光子精密激光位移傳感器的實(shí)測(cè)數(shù)據(jù),幫你直觀搞懂參數(shù)的實(shí)際價(jià)值。
    的頭像 發(fā)表于 09-27 15:46 ?1913次閱讀
    激光位移傳感器參數(shù)<b class='flag-5'>看不懂</b>?一篇講透關(guān)鍵指標(biāo)

    AI 芯片浪潮下,職場(chǎng)晉升新契機(jī)?

    職場(chǎng)、渴望在專業(yè)領(lǐng)域更進(jìn)一步的人來(lái)說(shuō),AI 芯片與職稱評(píng)審之間,實(shí)則有著千絲萬(wàn)縷的聯(lián)系,為職業(yè)晉升開(kāi)辟了新的路徑。 AI 芯片領(lǐng)域細(xì)分與職稱對(duì)應(yīng) 目前,AI 芯片從技術(shù)架構(gòu)上主要分為
    發(fā)表于 08-19 08:58

    KF2EDGK-5.05P這個(gè)封裝的數(shù)據(jù)手冊(cè)怎么看?

    *附件:KF2EDGK5.0-5P.pdf 看不懂,沒(méi)有孔徑,沒(méi)有從孔中心到邊界的距離,這種PCB封裝怎么畫(huà)?
    發(fā)表于 07-17 19:40

    所以做出來(lái)了嗎

    所以做出來(lái)了嗎,求
    發(fā)表于 06-16 01:43

    失去工作不是因?yàn)?b class='flag-5'>AI,而是因?yàn)槭褂?b class='flag-5'>AI的人

    當(dāng)算法能精準(zhǔn)預(yù)測(cè)消費(fèi)者需求時(shí),當(dāng)AI生成的文案比人類更懂傳播心理學(xué)時(shí),當(dāng)自動(dòng)化系統(tǒng)開(kāi)始取代基礎(chǔ)決策崗位時(shí),真正的危機(jī)已悄然降臨—— 不是AI在搶奪的工作,而是那些比你更早掌握AI、更
    的頭像 發(fā)表于 05-13 12:05 ?1008次閱讀
    <b class='flag-5'>你</b>失去工作不是因?yàn)?b class='flag-5'>AI</b>,而是因?yàn)槭褂?b class='flag-5'>AI</b><b class='flag-5'>的人</b>
    汪清县| 德格县| 天门市| 北京市| 泗阳县| 太仆寺旗| 安平县| 高邑县| 陇南市| 台东县| 桃江县| 峡江县| 息烽县| 仙游县| 商都县| 仪陇县| 霍林郭勒市| 金坛市| 福海县| 光泽县| 长宁县| 响水县| 鱼台县| 文水县| 浦城县| 天峨县| 祥云县| 娱乐| 高阳县| 稷山县| 航空| 卢龙县| 香格里拉县| 合肥市| 肇东市| 萍乡市| 丹寨县| 江都市| 林芝县| 仙游县| 宜章县|