根據(jù)《自然》最新發(fā)表的一項研究,一類增強學習算法在雅達利經(jīng)典游戲中的得分超過了人類玩家和已有的人工智能系統(tǒng)。這類算法被統(tǒng)稱為Go-Explore,它改善了對復雜環(huán)境的探索方式,或有望朝著實現(xiàn)真正智能學習體邁出重要一步。
增強學習可以讓人工智能系統(tǒng)通過探索和理解復雜環(huán)境來進行決策,并學習如何以最優(yōu)的方式獲得獎勵。然而,當遇到很少給予反饋的復雜環(huán)境時,目前的加強學習算法似乎很容易碰壁。
但Go-Explore突破了這些障礙。它可以對環(huán)境進行全面探索,同時構建一個檔案庫來記住它去過的地方,確保自己不會忘記通往有望成功的中期階段或是最終勝利(獎勵)的路線。
利用這類算法,論文作者解決了之前未能解決的2600個雅達利游戲,驗證了這類算法的潛力。作者指出,記住并回到有望成功的探索區(qū)域的簡單原則,是一種強大、通用的探索方法。他們認為論文所報道的算法有望應用于機器人、語言理解和藥物設計。
責任編輯:YYX
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
人工智能
+關注
關注
1821文章
50396瀏覽量
267181 -
學習算法
+關注
關注
0文章
16瀏覽量
7632
發(fā)布評論請先 登錄
相關推薦
熱點推薦
嵌入式人工智能課程(華清遠見)
嵌入式 AI 編譯器優(yōu)化:華清遠見課程,解鎖極致端側性能
隨著人工智能從云端全面向邊緣側和終端側下沉,“萬物智聯(lián)”的時代已經(jīng)悄然到來。然而,在這股浪潮背后,隱藏著一個巨大的技術鴻溝:在算力受限
發(fā)表于 04-16 18:47
人工智能多模態(tài)與視覺大模型開發(fā)實戰(zhàn) - 2026必會
視覺大模型特訓:從原理到部署一站式學會
在科技飛速發(fā)展的當下,視覺大模型已成為人工智能領域的一顆璀璨明星,廣泛應用于安防監(jiān)控、自動駕駛、醫(yī)療影像分析等眾多領域,深刻改變著我們的生活與工作方式。如今
發(fā)表于 04-15 16:06
九天菜菜大模型agent智能體開發(fā)實戰(zhàn)2026一月班
的正式開啟。在這個充滿無限可能的時代,讓我們抓住機遇,積極投身于大模型 Agent 的開發(fā)浪潮中,共同探索人工智能的未來邊界,創(chuàng)造更加美好的智能世界。
發(fā)表于 04-15 16:04
人工智能與機器學習在這些行業(yè)的深度應用
自人工智能和機器學習問世以來,多個在線領域的數(shù)字化格局迎來了翻天覆地的變化。這些技術從誕生之初就為企業(yè)賦予了競爭優(yōu)勢,而在線行業(yè)正是受其影響最為顯著的領域。人工智能(AI)與機器學習(
嵌入式系統(tǒng)中的人工智能
等領域,讓這些領域的設備能夠實時學習、適應并做出決策。然而,人工智能的發(fā)展也讓網(wǎng)絡安全威脅愈發(fā)普遍,這些安全隱患必須得到解決。英偉達等科技企業(yè)率先在嵌入式系統(tǒng)中植
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+具身智能芯片
為計算機可以處理的數(shù)字信息。
認知層:
認知層是具身智能的第二層,
負責對數(shù)據(jù)進行處理和分析,以便更好地理解和利用這些數(shù)據(jù)。
包括各種算法和模型,如DNN、神經(jīng)形態(tài)計算、決策樹等。
作
發(fā)表于 09-18 11:45
利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能
的框架小 10 倍,速度也快 10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文中,我們將介紹這對開發(fā)人員意味著什么,以及使用 Neuton 模型如何改進您的開發(fā)和終端
發(fā)表于 08-31 20:54
挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器
和生態(tài)體系帶到使用者身邊 ,讓我們在技術學習和使用上不再受制于人。
三、多模態(tài)實驗,解鎖AI全流程
它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能領域主要
發(fā)表于 08-07 14:30
挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!
和生態(tài)體系帶到使用者身邊 ,讓我們在技術學習和使用上不再受制于人。
三、多模態(tài)實驗,解鎖AI全流程
它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能領域主要
發(fā)表于 08-07 14:23
兆芯攜手合作伙伴在WAIC 2025展示人工智能計算與決策解決方案
2025世界人工智能大會近日在上海盛大開幕。大會期間,兆芯攜手上交智算院、科算云共同呈現(xiàn)了基于自研CPU的人工智能計算與決策解決方案,展現(xiàn)了自主CPU技術與AI應用的融合創(chuàng)新,激發(fā)新質(zhì)生產(chǎn)力的強大活力。
超小型Neuton機器學習模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應用.
Neuton 是一家邊緣AI 公司,致力于讓機器 學習模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文中,我們將介紹
發(fā)表于 07-31 11:38
最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)
在人工智能大模型重塑教育與社會發(fā)展的當下,無論是探索未來職業(yè)方向,還是更新技術儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學術研究的智能工具,大模
發(fā)表于 07-04 11:10
TDK收購SoftEye,打造智能眼鏡系統(tǒng)實現(xiàn)通過眼球運動與人工智能進行交互
·TDK收購了人工智能/智能眼鏡應用領域的領先技術推動者SoftEye,lnc ? ·通過此次收購,TDK將能夠以更快的速度交付完整的智能眼鏡系統(tǒng),并打造全新的人機界面,實現(xiàn)
維智科技為什么提出時空人工智能
在AI技術突飛猛進的今天,語言、圖像和語音的智能能力不斷突破,但一個更本質(zhì)的問題逐漸顯現(xiàn):人工智能真的理解我們所處的空間世界嗎?從智能城市到商業(yè)選址,從應急調(diào)度到人機交互,AI正走向“
增強學習可讓人工智能通過探索和理解來進行決策
評論