10月27日消息,據(jù)外媒報道,約翰斯霍普金斯大學博士生安德魯洪特(Andrew Hundt) 近日發(fā)布一篇新論文,指出應通過正強化法訓練機器人學習新技能。
這篇論文的核心思想是,在訓練機器人的過程中,應采用正強化法,即相比于在它做錯時進行懲罰,更應在它做對時進行激勵。而對于機器人來說,這種激勵機制是以評分系統(tǒng)的形式呈現(xiàn)的,類似玩游戲一樣,根據(jù)執(zhí)行任務的情況獲得積分。
安德魯表示,這種方法能夠大大縮短訓練機器人執(zhí)行任務的時間。“機器人希望能得到更高的分數(shù),所以它們很快就可以完成相關任務。過去機器人需要一個月的練習才能達到100%的準確性,現(xiàn)在只用兩天就能做到?!?/p>
不過他也指出,目前機器人執(zhí)行的這些任務仍然是比較初級的,比如堆積木。但在未來,機器人有望通過正強化法完成更復雜和有意義的任務。
責任編輯:YYX
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
機器人
+關注
關注
213文章
31494瀏覽量
223865
發(fā)布評論請先 登錄
相關推薦
熱點推薦
基于NVIDIA Isaac Lab拓展多模態(tài)機器人學習
構建強大的智能機器人需要在復雜環(huán)境中進行測試。然而,在現(xiàn)實世界中收集數(shù)據(jù)不僅成本高昂、耗時漫長,還常常伴隨高風險。針對關鍵危險場景(例如高速碰撞或硬件故障)進行安全訓練幾乎是不可能的。更嚴重的是,現(xiàn)實世界的數(shù)據(jù)往往偏向“正常”運行條件,導致
NVIDIA神經(jīng)網(wǎng)絡創(chuàng)新研究重塑機器人學習
目前,機器人在受控的環(huán)境中能夠有出色的表現(xiàn),但在面對現(xiàn)實世界任務時,仍難以應對其中的不可預測性、操作靈活性和細微的交互需求,例如組裝精密組件或是以接近人類的精度操控日常物體。
NVIDIA Isaac Lab 2.3新增功能助力簡化機器人學習
基于真實世界演示訓練機器人策略,不僅成本高、速度慢,還容易出現(xiàn)過擬合問題,進而限制其在不同任務與環(huán)境中的泛化能力。而仿真優(yōu)先的方法可簡化開發(fā)流程、降低風險與成本,同時部署到真實環(huán)境也將更安全、適應性更強。
NVIDIA開源物理引擎與OpenUSD加速機器人學習
開發(fā)能在工廠、醫(yī)院和公共空間與人類協(xié)同作業(yè)的機器人是一項巨大的技術挑戰(zhàn)。這類機器人需具備與人類接近的靈巧性、感知能力、認知能力和全身協(xié)調(diào)性,以便于實時應對充滿不確定性的真實環(huán)境。
NVIDIA 發(fā)布三大利器,推動人形機器人邁向新紀元
電子發(fā)燒友網(wǎng)綜合報道 在節(jié)前的機器人學習大會(CoRL)上,NVIDIA 發(fā)布了一系列突破性技術,包括開源物理引擎 Newton、機器人基礎模型 Isaac GROOT N1.6以及全新 AI
NVIDIA Isaac Lab多GPU多節(jié)點訓練指南
NVIDIA Isaac Lab 是一個適用于機器人學習的開源統(tǒng)一框架,基于 NVIDIA Isaac Sim 開發(fā),其模塊化高保真仿真適用于各種訓練環(huán)境,可提供各種物理 AI 功能和由 GPU 驅(qū)動的物理仿真,縮小仿真與現(xiàn)實世界之間的差距。
英偉達發(fā)布機器人 “新大腦”,黃仁勛:人形機器人三年普及
完成如 “烤面包” 這樣的復雜任務。結合 Omniverse 仿真平臺,訓練效率提高了10倍,大大縮短了機器人學習和適應現(xiàn)實環(huán)境的時間。 英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛在鏈博會上發(fā)表演講時指出,物理 AI 將推動 AI 從虛擬世界邁向?qū)嶓w領域,重構工業(yè)和日常生活
易控智駕與中科院端到端自動駕駛方案入選CoRL 2025
近日,旨在分享和探討機器人技術與機器學習交叉領域最新進展的國際頂級機器人學習會議CoRL 2025 (Conference on Robot Learning)論文接收結果揭曉。
海默智能噴涂機器人——為工業(yè)噴涂解鎖新技能
在工業(yè)噴涂領域面臨高精度與柔性化雙重挑戰(zhàn)的今天,傳統(tǒng)方式受限于編程效率與復雜曲面適應性,而資深技師的寶貴經(jīng)驗亟待數(shù)字化傳承。海默機器人依托技術積累,推出移動式慣導隨動噴涂協(xié)作機器人,以“雙核動態(tài)捕捉
NVIDIA展示機器人領域的研究成果
在今年的機器人科學與系統(tǒng)會議 (RSS) 上,NVIDIA 研究中心展示了一系列推動機器人學習的研究成果,展示了在仿真、現(xiàn)實世界遷移和決策制定領域的突破。
NVIDIA Isaac Lab可用環(huán)境與強化學習腳本使用指南
Lab 是一個適用于機器人學習的開源模塊化框架,其模塊化高保真仿真適用于各種訓練環(huán)境,Isaac Lab 同時支持模仿學習(模仿人類)和強化學習(在嘗試和錯誤中進行
通過NVIDIA Cosmos模型增強機器人學習
通用機器人的時代已經(jīng)到來,這得益于機械電子技術和機器人 AI 基礎模型的進步。但目前機器人技術的發(fā)展仍面臨一個關鍵挑戰(zhàn):機器人需要大量的訓練
NVIDIA Isaac Sim和Isaac Lab現(xiàn)已推出早期開發(fā)者預覽版
NVIDIA 發(fā)布了機器人仿真參考應用 Isaac Sim 和機器人學習框架 Isaac Lab 的開發(fā)者預覽版。開發(fā)者現(xiàn)在可以通過 GitHub 訪問早期版本,搶先體驗先進功能,用于在基于物理的仿真環(huán)境中構建、訓練和測試 AI
NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新
在 COMPUTEX 2025 上,NVIDIA 宣布了機器人仿真參考應用 NVIDIA Isaac Sim 和機器人學習框架 NVIDIA Isaac Lab 的更新,以加速各種形態(tài)機器人的開發(fā)。
如何訓練機器人學習新技能
評論