日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

美國(guó)陸軍研發(fā)了一種高效的地面機(jī)器人學(xué)習(xí)模型

姚小熊27 ? 來源:人工智能實(shí)驗(yàn)室 ? 作者:人工智能實(shí)驗(yàn)室 ? 2021-01-06 09:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

美國(guó)陸軍面向未來多域作戰(zhàn)概念研發(fā)了一種高效的地面機(jī)器人學(xué)習(xí)模型,該模型提出基于強(qiáng)化學(xué)習(xí)的策略,可有效減少當(dāng)前訓(xùn)練強(qiáng)化學(xué)習(xí)策略的不可預(yù)測(cè)性,使自主智能體能夠推理并適應(yīng)不斷變化的戰(zhàn)場(chǎng)條件。

強(qiáng)化學(xué)習(xí)是智能體(Agent)以“試錯(cuò)”的方式進(jìn)行學(xué)習(xí),通過與環(huán)境進(jìn)行交互獲得的獎(jiǎng)賞指導(dǎo)行為,目標(biāo)是使智能體獲得最大的獎(jiǎng)賞。強(qiáng)化學(xué)習(xí)技術(shù)具備解決復(fù)雜問題的能力,近年來在如圍棋、象棋和電子游戲等領(lǐng)域有較為長(zhǎng)足的發(fā)展。美國(guó)陸軍將這種強(qiáng)化學(xué)習(xí)技術(shù)應(yīng)用在地面機(jī)器人面臨著兩個(gè)巨大挑戰(zhàn)。首先是算法的限制。在強(qiáng)化學(xué)習(xí)中,策略梯度方法(Policy Gradient Methods)是連續(xù)空間可伸縮算法的基礎(chǔ),但是現(xiàn)有技術(shù)無法支持更廣泛的決策目標(biāo),例如風(fēng)險(xiǎn)敏感性、安全約束、對(duì)先驗(yàn)知識(shí)的探索和發(fā)散。其次就是數(shù)據(jù)量的問題。強(qiáng)化學(xué)習(xí)需要大量的樣本復(fù)雜性,而美國(guó)陸軍多域作戰(zhàn)概念和下一代戰(zhàn)斗車輛(NGCV)項(xiàng)目目前數(shù)據(jù)匱乏并不支持現(xiàn)有訓(xùn)練機(jī)制。

在陸軍多域作戰(zhàn)概念和NGCV項(xiàng)目中應(yīng)用強(qiáng)化學(xué)習(xí),訓(xùn)練機(jī)制必須提高連續(xù)空間中的樣本效率和可靠性,ARL通過將現(xiàn)有的策略搜索方案推廣到通用工具,取得了重要突破。研究人員為通用程序開發(fā)了新的策略搜索方案,并且還確定了其樣本復(fù)雜度。由此產(chǎn)生的策略搜索方案減少了獎(jiǎng)勵(lì)積累的波動(dòng)性,形成了對(duì)未知領(lǐng)域的有效探索和先驗(yàn)的機(jī)制。值得注意的是,地面機(jī)器人獲取數(shù)據(jù)的成本很高。減少獎(jiǎng)勵(lì)積累的波動(dòng)性,確保以有效的方式探索未知領(lǐng)域,或者吸收以前的經(jīng)驗(yàn),都將有助于打破強(qiáng)化學(xué)習(xí)中現(xiàn)行實(shí)踐的樣本效率壁壘。通過減少隨機(jī)抽樣的數(shù)量,可以實(shí)現(xiàn)策略優(yōu)化。

這項(xiàng)研究為強(qiáng)化學(xué)習(xí)中的經(jīng)典策略梯度定理做出了貢獻(xiàn)。裝備有強(qiáng)化學(xué)習(xí)功能的自主機(jī)器人將能夠協(xié)助戰(zhàn)士在未來戰(zhàn)場(chǎng)上進(jìn)行偵察探索和風(fēng)險(xiǎn)評(píng)估。研究人員下一步計(jì)劃在強(qiáng)化學(xué)習(xí)中將更廣泛的決策目標(biāo)納入多主體設(shè)置,并研究強(qiáng)化學(xué)習(xí)主體之間的交互設(shè)置如何在團(tuán)隊(duì)之間產(chǎn)生協(xié)同和對(duì)抗性推理。
責(zé)任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31494

    瀏覽量

    223880
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    大象機(jī)器人myCobot 320機(jī)械臂如何憑實(shí)力走進(jìn)頂尖學(xué)府

    在復(fù)旦大學(xué)邯鄲校區(qū)某棟實(shí)驗(yàn)樓里,堂關(guān)于《機(jī)器人學(xué)導(dǎo)論》的課程剛剛結(jié)束。學(xué)生們沒有急著離開,而是圍在實(shí)驗(yàn)臺(tái)前,對(duì)著桌面上臺(tái)精巧的白色機(jī)械臂,熱烈地討論著剛剛跑通的抓取算法。
    的頭像 發(fā)表于 03-20 09:43 ?334次閱讀

    基于NVIDIA Isaac Lab拓展多模態(tài)機(jī)器人學(xué)習(xí)

    構(gòu)建強(qiáng)大的智能機(jī)器人需要在復(fù)雜環(huán)境中進(jìn)行測(cè)試。然而,在現(xiàn)實(shí)世界中收集數(shù)據(jù)不僅成本高昂、耗時(shí)漫長(zhǎng),還常常伴隨高風(fēng)險(xiǎn)。針對(duì)關(guān)鍵危險(xiǎn)場(chǎng)景(例如高速碰撞或硬件故障)進(jìn)行安全訓(xùn)練幾乎是不可能的。更嚴(yán)重的是,現(xiàn)實(shí)世界的數(shù)據(jù)往往偏向“正常”運(yùn)行條件,導(dǎo)致機(jī)器人在面對(duì)突發(fā)狀況時(shí)缺乏應(yīng)對(duì)能
    的頭像 發(fā)表于 03-09 16:26 ?990次閱讀
    基于NVIDIA Isaac Lab拓展多模態(tài)<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>

    NVIDIA神經(jīng)網(wǎng)絡(luò)創(chuàng)新研究重塑機(jī)器人學(xué)習(xí)

    目前,機(jī)器人在受控的環(huán)境中能夠有出色的表現(xiàn),但在面對(duì)現(xiàn)實(shí)世界任務(wù)時(shí),仍難以應(yīng)對(duì)其中的不可預(yù)測(cè)性、操作靈活性和細(xì)微的交互需求,例如組裝精密組件或是以接近人類的精度操控日常物體。
    的頭像 發(fā)表于 10-21 11:07 ?2190次閱讀
    NVIDIA神經(jīng)網(wǎng)絡(luò)創(chuàng)新研究重塑<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>

    NVIDIA Isaac Lab 2.3新增功能助力簡(jiǎn)化機(jī)器人學(xué)習(xí)

    基于真實(shí)世界演示訓(xùn)練機(jī)器人策略,不僅成本高、速度慢,還容易出現(xiàn)過擬合問題,進(jìn)而限制其在不同任務(wù)與環(huán)境中的泛化能力。而仿真優(yōu)先的方法可簡(jiǎn)化開發(fā)流程、降低風(fēng)險(xiǎn)與成本,同時(shí)部署到真實(shí)環(huán)境也將更安全、適應(yīng)性更強(qiáng)。
    的頭像 發(fā)表于 10-21 10:50 ?1328次閱讀

    NVIDIA開源物理引擎與OpenUSD加速機(jī)器人學(xué)習(xí)

    開發(fā)能在工廠、醫(yī)院和公共空間與人類協(xié)同作業(yè)的機(jī)器人項(xiàng)巨大的技術(shù)挑戰(zhàn)。這類機(jī)器人需具備與人類接近的靈巧性、感知能力、認(rèn)知能力和全身協(xié)調(diào)性,以便于實(shí)時(shí)應(yīng)對(duì)充滿不確定性的真實(shí)環(huán)境。
    的頭像 發(fā)表于 10-13 11:15 ?1238次閱讀

    NVIDIA 發(fā)布三大利器,推動(dòng)人形機(jī)器人邁向新紀(jì)元

    電子發(fā)燒友網(wǎng)綜合報(bào)道 在節(jié)前的機(jī)器人學(xué)習(xí)大會(huì)(CoRL)上,NVIDIA 發(fā)布了系列突破性技術(shù),包括開源物理引擎 Newton、機(jī)器人基礎(chǔ)模型 Isaac GROOT N1.6以及全
    的頭像 發(fā)表于 10-13 04:42 ?6027次閱讀

    英偉達(dá)發(fā)布機(jī)器人 “新大腦”,黃仁勛:人形機(jī)器人三年普及

    完成如 “烤面包” 這樣的復(fù)雜任務(wù)。結(jié)合 Omniverse 仿真平臺(tái),訓(xùn)練效率提高了10倍,大大縮短了機(jī)器人學(xué)習(xí)和適應(yīng)現(xiàn)實(shí)環(huán)境的時(shí)間。 英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛在鏈博會(huì)上發(fā)表演講時(shí)指出,物理 AI 將推動(dòng) AI 從虛擬世界邁向?qū)嶓w領(lǐng)域,重構(gòu)工業(yè)和日常生活
    的頭像 發(fā)表于 08-25 18:34 ?554次閱讀

    地平線H-RDT模型斬獲CVPR 2025大賽冠軍

    近日,在計(jì)算機(jī)視覺與模式識(shí)別領(lǐng)域頂級(jí)會(huì)議CVPR 2025舉辦的RoboTwin雙臂機(jī)器人競(jìng)賽中,地平線機(jī)器人實(shí)驗(yàn)室與清華大學(xué)計(jì)算機(jī)系朱軍團(tuán)隊(duì)聯(lián)合提出的H-RDT憑強(qiáng)大性能和領(lǐng)先成功率,舉斬獲真機(jī)賽冠軍(
    的頭像 發(fā)表于 08-21 10:02 ?818次閱讀
    地平線H-RDT<b class='flag-5'>模型</b>斬獲CVPR 2025大賽冠軍

    易控智駕與中科院端到端自動(dòng)駕駛方案入選CoRL 2025

    近日,旨在分享和探討機(jī)器人技術(shù)與機(jī)器學(xué)習(xí)交叉領(lǐng)域最新進(jìn)展的國(guó)際頂級(jí)機(jī)器人學(xué)習(xí)會(huì)議CoRL 2025 (Conference on Robot Learning)論文接收結(jié)果揭曉。
    的頭像 發(fā)表于 08-18 14:43 ?2555次閱讀
    易控智駕與中科院端到端自動(dòng)駕駛方案入選CoRL 2025

    NVIDIA展示機(jī)器人領(lǐng)域的研究成果

    在今年的機(jī)器人科學(xué)與系統(tǒng)會(huì)議 (RSS) 上,NVIDIA 研究中心展示了系列推動(dòng)機(jī)器人學(xué)習(xí)的研究成果,展示了在仿真、現(xiàn)實(shí)世界遷移和決策制定領(lǐng)域的突破。
    的頭像 發(fā)表于 07-23 10:43 ?1683次閱讀

    NVIDIA Isaac Lab可用環(huán)境與強(qiáng)化學(xué)習(xí)腳本使用指南

    Lab 是個(gè)適用于機(jī)器人學(xué)習(xí)的開源模塊化框架,其模塊化高保真仿真適用于各種訓(xùn)練環(huán)境,Isaac Lab 同時(shí)支持模仿學(xué)習(xí)(模仿人類)和強(qiáng)化學(xué)習(xí)(在嘗試和錯(cuò)誤中進(jìn)行
    的頭像 發(fā)表于 07-14 15:29 ?2678次閱讀
    NVIDIA Isaac Lab可用環(huán)境與強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>腳本使用指南

    通過NVIDIA Cosmos模型增強(qiáng)機(jī)器人學(xué)習(xí)

    通用機(jī)器人的時(shí)代已經(jīng)到來,這得益于機(jī)械電子技術(shù)和機(jī)器人 AI 基礎(chǔ)模型的進(jìn)步。但目前機(jī)器人技術(shù)的發(fā)展仍面臨個(gè)關(guān)鍵挑戰(zhàn):
    的頭像 發(fā)表于 07-14 11:49 ?1332次閱讀
    通過NVIDIA Cosmos<b class='flag-5'>模型</b>增強(qiáng)<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>

    NVIDIA Isaac Sim和Isaac Lab現(xiàn)已推出早期開發(fā)者預(yù)覽版

    NVIDIA 發(fā)布了機(jī)器人仿真參考應(yīng)用 Isaac Sim 和機(jī)器人學(xué)習(xí)框架 Isaac Lab 的開發(fā)者預(yù)覽版。開發(fā)者現(xiàn)在可以通過 GitHub 訪問早期版本,搶先體驗(yàn)先進(jìn)功能,用于在基于物理的仿真環(huán)境中構(gòu)建、訓(xùn)練和測(cè)試 AI 驅(qū)動(dòng)的
    的頭像 發(fā)表于 07-04 14:23 ?2068次閱讀

    輪式移動(dòng)機(jī)器人電機(jī)驅(qū)動(dòng)系統(tǒng)的研究與開發(fā)

    系統(tǒng),開發(fā)了套二輪差速驅(qū)動(dòng)轉(zhuǎn)向移動(dòng)機(jī)器人電機(jī)驅(qū)動(dòng)系統(tǒng),完成了系統(tǒng)各部件的整體裝配和調(diào)試。試驗(yàn)結(jié)果表明,該設(shè)計(jì)方案可行、系統(tǒng)運(yùn)行穩(wěn)定可靠、成本低廉、所用元件易于購(gòu)置,具有較好的實(shí)用的價(jià)值和應(yīng)用前景。 純
    發(fā)表于 06-11 14:30

    NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了機(jī)器人仿真參考應(yīng)用 NVIDIA Isaac Sim 和機(jī)器人學(xué)習(xí)框架 NVIDIA Isaac Lab 的更新,以加速各種形態(tài)機(jī)器人的開發(fā)。
    的頭像 發(fā)表于 05-28 10:06 ?2442次閱讀
    喀喇沁旗| 江油市| 虹口区| 收藏| 美姑县| 莲花县| 北海市| 青田县| 吉木萨尔县| 龙井市| 柘城县| 乌拉特前旗| 兴山县| 新泰市| 星子县| 洛隆县| 海宁市| 兴业县| 西吉县| 承德市| 济宁市| 石嘴山市| 新沂市| 莱西市| 虞城县| 武城县| 班戈县| 定边县| 古交市| 体育| 朔州市| 明星| 通河县| 山东| 富民县| 杭州市| 南涧| 南平市| 波密县| 武强县| 东源县|