日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

決策神經(jīng)科學(xué):解決機(jī)器人技術(shù)中的關(guān)鍵挑戰(zhàn)

DPVg_AI_era ? 來源:lq ? 2019-02-25 08:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

通過模仿人類大腦在日常生活中做出決策時(shí)使用的策略,可以顯著增強(qiáng)機(jī)器人智能。最近,科學(xué)家們找到了最新觀點(diǎn)。

本周五在國內(nèi)上映的《阿麗塔:戰(zhàn)斗天使》又掀起了一波智能熱,這部由著導(dǎo)演詹姆斯·卡梅?。↗ames Cameron)擔(dān)任編劇和制片的電影,講述了擁有人類大腦、機(jī)械身軀的女主角,不斷改變世界、認(rèn)識(shí)自我的故事。

這部背景發(fā)生在26世紀(jì)的電影,依舊把人類大腦作為承載智慧、情感和決策的關(guān)鍵能力。

而現(xiàn)在,一份來自韓國高等科學(xué)技術(shù)研究院(KAIST)、劍橋大學(xué)、日本國家信息通信技術(shù)研究所(NICT)和谷歌DeepMind的聯(lián)合研究認(rèn)為,通過模仿人類大腦在日常生活中做出決策時(shí)使用的策略,可以顯著增強(qiáng)機(jī)器人智能,他們的方法是:將神經(jīng)科學(xué)應(yīng)用于機(jī)器人大腦。

最近,這項(xiàng)研究發(fā)表在了Science Robotics雜志上。

決策神經(jīng)科學(xué):解決機(jī)器人技術(shù)中的關(guān)鍵挑戰(zhàn)

人類和自主機(jī)器人不斷需要學(xué)習(xí)和適應(yīng)新的環(huán)境。兩者的不同之處在于,人類能夠根據(jù)獨(dú)特情況做出決策,而機(jī)器人仍然依靠預(yù)定數(shù)據(jù)來做出決策,這是目前機(jī)器人的短板。

強(qiáng)化學(xué)習(xí)(RL)成為通過與世界交互來理解決策的主要理論框架,并且最近在構(gòu)建具有超人類表現(xiàn)的智能體方面取得成功。然而,哪怕是最新的強(qiáng)化算法仍然存在很大的局限性,例如,缺乏制定目標(biāo)導(dǎo)向策略的能力,或依賴大量經(jīng)驗(yàn)來學(xué)習(xí)。

這些限制阻礙了機(jī)器人在任務(wù)或背景頻繁變化的動(dòng)態(tài)環(huán)境中快速適應(yīng)的能力。

相比之下,人類在經(jīng)驗(yàn)有限的條件下迅速適應(yīng)環(huán)境變化方面具有非凡的能力。決策神經(jīng)科學(xué)(decision neuroscience)的最新發(fā)現(xiàn)表明,大腦不僅為RL使用多個(gè)控制系統(tǒng),而且還使用一種靈活的元控制機(jī)制(metacontrol mechanism)來選擇控制選項(xiàng),每個(gè)不同選項(xiàng)分別與預(yù)測(cè)性能、認(rèn)知負(fù)荷和學(xué)習(xí)速度相關(guān)。

理解大腦如何實(shí)現(xiàn)這些選項(xiàng)可能會(huì)讓RL算法解決機(jī)器人的實(shí)際控制問題。

在Science Robotics上發(fā)表的研究中,研究人員討論了人類RL相關(guān)的最新發(fā)現(xiàn),這些發(fā)現(xiàn)可能會(huì)解決機(jī)器人技術(shù)中的幾個(gè)關(guān)鍵挑戰(zhàn):性能—效率—速度權(quán)衡、多機(jī)器人設(shè)置中的沖突需求以及探索—開發(fā)困境。

詳細(xì)解讀:元控制可以類似大腦

首先,決策神經(jīng)科學(xué)的證據(jù)表明,人類利用兩種不同的行為控制策略:

刺激驅(qū)動(dòng)的習(xí)慣性(stimulus--driven habitual);

目標(biāo)導(dǎo)向的認(rèn)知控制(goal--directed cognitive control)。

習(xí)慣性控制是自動(dòng)且快速的,盡管它在不穩(wěn)定的環(huán)境中很脆弱,并且能由model--free RL很好地解釋,model--free RL通過無環(huán)境模型下的試錯(cuò)過程來逐步學(xué)習(xí)行為的價(jià)值。

相反,目標(biāo)導(dǎo)向的控制可以迅速適應(yīng)環(huán)境的變化,但它具有認(rèn)知需求。它通過學(xué)習(xí)環(huán)境模型來指導(dǎo)行動(dòng),并利用這個(gè)知識(shí)庫快速適應(yīng)環(huán)境結(jié)構(gòu)的變化,例如學(xué)習(xí)狀態(tài)-行動(dòng)空間中的潛在(隱藏)原因。

model--based RL和model--free RL之間的這種計(jì)算上的區(qū)別表明它們之間存在不可避免的妥協(xié)。model--free RL學(xué)習(xí)起來比較慢,但一旦策略被學(xué)習(xí)并實(shí)現(xiàn)自動(dòng)化,就可以快速地實(shí)現(xiàn)目標(biāo)。model--based RL通常比model--free RL提供更多的準(zhǔn)確預(yù)測(cè),但計(jì)算量要大得多。每種策略都提供了關(guān)于準(zhǔn)確性、速度和認(rèn)知負(fù)荷的互補(bǔ)解決方案,突出了預(yù)測(cè)性能和計(jì)算效率之間的權(quán)衡。

其次,RL算法通常需要大量經(jīng)驗(yàn)來充分學(xué)習(xí)不同環(huán)境因素下的因果關(guān)系(incremen-tal learning)。然而,人類的學(xué)習(xí)速度很快——通常一個(gè)從未經(jīng)歷過的事件發(fā)生一次之后就已學(xué)習(xí)(“one--shot learn-ing”)。

神經(jīng)科學(xué)最近的研究發(fā)現(xiàn),當(dāng)與環(huán)境的交互受到限制時(shí),人類有很強(qiáng)的提高學(xué)習(xí)速度的傾向;他們會(huì)努力迅速弄清環(huán)境中未知的部分,即使這會(huì)危及安全。這些結(jié)果表明,大腦是直接執(zhí)行計(jì)算來尋找性能和速度之間的權(quán)衡。

第三,越來越多的證據(jù)支持這樣一種觀點(diǎn),即前額葉皮層使元控制能夠靈活地在不同的學(xué)習(xí)策略之間進(jìn)行選擇,例如在model--based RL和model--free RL 之間,以及在incremental learning和one--shot learning之間。

在新的環(huán)境中,元控制通過選擇model--based RL來強(qiáng)調(diào)性能。因?yàn)檫@在計(jì)算上很昂貴,當(dāng)大腦發(fā)現(xiàn)進(jìn)一步學(xué)習(xí)沒有什么好處時(shí),就會(huì)轉(zhuǎn)向model--free RL:要么環(huán)境非常穩(wěn)定,可以做出精確的預(yù)測(cè);要么高度不穩(wěn)定,以至于基于模型的RL的預(yù)測(cè)不如無模型RL的預(yù)測(cè)可靠。

在其他情況下,元控制優(yōu)先考慮速度。當(dāng)預(yù)估的因果關(guān)系中的不確定性很高時(shí),大腦傾向于轉(zhuǎn)換到one-shot學(xué)習(xí),以快速解決預(yù)測(cè)結(jié)果中的不確定性。然而,當(dāng)agent對(duì)所有可能的因果關(guān)系都同樣不確定時(shí),它會(huì)重新轉(zhuǎn)向incremental learning以確保安全的學(xué)習(xí)。

這些機(jī)制表明類似于大腦的元控制可以處理性能-效率-速度的權(quán)衡。

第四,人類的RL可以解釋在人類進(jìn)化中起重要作用的社會(huì)現(xiàn)象。在多主體相互作用的人類社會(huì)中,存在著具有部分競爭性和部分一致性激勵(lì)機(jī)制的社會(huì)困境。

使用model--based的RL方法成功地在更復(fù)雜的時(shí)間擴(kuò)展設(shè)置中實(shí)現(xiàn)了協(xié)作。

人類似乎通過使用元認(rèn)知(metacognition)來繞過這個(gè)問題——元認(rèn)知是一種評(píng)估自己表現(xiàn)的能力,即評(píng)估自信和/或不確定性的水平。例如,較低的任務(wù)難度或較低的環(huán)境噪聲會(huì)使學(xué)習(xí)主體自信,從而導(dǎo)致更果斷的行動(dòng),而失去自信則會(huì)導(dǎo)致更謹(jǐn)慎和防御性的策略。元認(rèn)知學(xué)習(xí)因此可以快速適應(yīng)環(huán)境的變化,同時(shí)保持對(duì)環(huán)境噪聲的魯棒性。這樣的策略有可能增強(qiáng)機(jī)器人的決策能力。

總之,將人類決策神經(jīng)科學(xué)的發(fā)現(xiàn)整合起來,可以為機(jī)器人的動(dòng)作控制系統(tǒng)提供有價(jià)值的見解,從而實(shí)現(xiàn)更安全、更有能力、更高效的學(xué)習(xí)。

對(duì)大腦建模,算法能否支撐起意識(shí)?

另外,研究團(tuán)隊(duì)還認(rèn)為,這種跨學(xué)科的方法也應(yīng)該引起神經(jīng)科學(xué)的注意,為開發(fā)新的人類決策計(jì)算理論提供一個(gè)可靠的測(cè)試基礎(chǔ)。

最近對(duì)焦慮、抑郁和成癮等精神疾病背后的興趣引起了很多人的興趣,這使得一系列復(fù)雜的理論在沒有某種先進(jìn)的情境平臺(tái)的情況下難以測(cè)試。這種情況需要一種對(duì)人類大腦進(jìn)行建模的方法,以找出它在現(xiàn)實(shí)生活中如何與世界相互作用,以測(cè)試這些模型中的不同異常是否以及如何引起某些疾病。

例如,如果我們可以在機(jī)器人中重現(xiàn)焦慮行為或強(qiáng)迫癥,那么就可以預(yù)測(cè)需要做些什么來治療。研究團(tuán)隊(duì)預(yù)計(jì),開發(fā)不同精神疾病的機(jī)器人模型,與研究人員現(xiàn)在使用動(dòng)物模型的方式類似,將成為臨床研究的關(guān)鍵未來技術(shù)。

最后再回到電影《阿麗塔》。

電影中所有的機(jī)器人都擁有人類的生命、有機(jī)大腦。機(jī)器人能從脊髓或大腦直接將信號(hào)傳遞到假體中的代碼,使截癱或四肢癱瘓的人能夠隨著機(jī)器人技術(shù)的進(jìn)步再次獲得行動(dòng)能力。

如果放到現(xiàn)在的時(shí)代,這種技術(shù)看上去非常棒;但電影設(shè)定發(fā)生在五百年后,AI依然只是作為支撐軀體的技術(shù),核心還是人類的大腦而不是由算法主導(dǎo)意識(shí)與行動(dòng),看來卡梅隆和羅德里格斯導(dǎo)演的腦洞還是小了點(diǎn):)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 控制系統(tǒng)
    +關(guān)注

    關(guān)注

    41

    文章

    6997

    瀏覽量

    114516
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    214

    文章

    31582

    瀏覽量

    224154
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4981

    瀏覽量

    74482

原文標(biāo)題:Science子刊:為機(jī)器人復(fù)制腦代碼,無限接近人類決策

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    六維力傳感器:當(dāng)機(jī)器人擁有“真實(shí)觸覺”,未來會(huì)發(fā)生什么?

    的“觸覺神經(jīng)”。雖然不起眼,但它正在悄悄改變智能制造和機(jī)器人共處的未來。 六維力傳感器是什么? 簡單說,六維力傳感器也叫六軸力傳感器,是目前能測(cè)量力的“最全能的選手”。它能同時(shí)測(cè)出三個(gè)方向上的力
    發(fā)表于 04-29 16:29

    基于米爾RK3576核心板的國產(chǎn)割草機(jī)器人解決方案

    決策 :利用NPU加速運(yùn)行輕量化YOLO等國產(chǎn)優(yōu)化模型,精準(zhǔn)識(shí)別草坪的障礙物。 全覆蓋路徑規(guī)劃 :利用A72大核運(yùn)行弓字形覆蓋算法、邊界回充算法,相比傳統(tǒng)隨機(jī)式機(jī)器人,作業(yè)效率可提升80%以上
    發(fā)表于 04-24 17:31

    為什么說關(guān)節(jié)扭矩傳感器是高端機(jī)器人的“觸覺神經(jīng)”?

    如果把高端機(jī)器人比作一個(gè)“”,那么關(guān)節(jié)扭矩傳感器就是遍布全身的“觸覺神經(jīng)”。沒有它,機(jī)器人就像得了末梢神經(jīng)麻痹——能按程序動(dòng),卻感受不到外
    發(fā)表于 04-17 17:27

    INDEMIND三大AI平臺(tái)助推機(jī)器人產(chǎn)業(yè)革新

    從“自動(dòng)化工具”到“自主智能終端”,機(jī)器人產(chǎn)業(yè)正經(jīng)歷深刻變革。在這一進(jìn)程,空間智能技術(shù)作為連接感知與決策關(guān)鍵橋梁,正重新定義
    的頭像 發(fā)表于 04-15 09:37 ?1439次閱讀

    從“能動(dòng)”到“能用”:人形機(jī)器人規(guī)?;涞氐?b class='flag-5'>關(guān)鍵挑戰(zhàn)

    隨著人形機(jī)器人技術(shù)持續(xù)升溫,行業(yè)正從概念驗(yàn)證邁向工程落地階段。當(dāng)前市場(chǎng)關(guān)注的重點(diǎn),已經(jīng)從“機(jī)器人能做什么”,轉(zhuǎn)向“是否能夠穩(wěn)定運(yùn)行、持續(xù)工作并實(shí)現(xiàn)規(guī)模化部署”。 在人形機(jī)器人走向?qū)嶋H應(yīng)
    的頭像 發(fā)表于 04-09 17:22 ?1852次閱讀
    從“能動(dòng)”到“能用”:人形<b class='flag-5'>機(jī)器人</b>規(guī)?;涞氐?b class='flag-5'>關(guān)鍵</b><b class='flag-5'>挑戰(zhàn)</b>

    機(jī)器人熱管理技術(shù)體系與方案

    機(jī)器人熱管理技術(shù)直接決定機(jī)器人的工作范圍、可靠性與使用壽命,是機(jī)器人向高功率、輕量化、極端環(huán)境適配方向發(fā)展的核心支撐……熱管理系統(tǒng)作為機(jī)器人
    的頭像 發(fā)表于 03-07 08:32 ?944次閱讀
    <b class='flag-5'>機(jī)器人</b>熱管理<b class='flag-5'>技術(shù)</b>體系與方案

    再談低溫?zé)Y(jié)銀的應(yīng)用:從春晚四家機(jī)器人出鏡的幕后推手說起

    、芯片封裝、功率模塊的關(guān)鍵支撐;而低溫?zé)Y(jié)銀正從實(shí)驗(yàn)室走向機(jī)器人、新能源、第三代半導(dǎo)體等產(chǎn)業(yè)核心,成為高端電子互連的 隱形推手。 一、春晚四家機(jī)器人:幕后推手與技術(shù)硬核 1 四家
    發(fā)表于 02-17 14:07

    智能機(jī)器人的“神經(jīng)網(wǎng)絡(luò)”:線圈在驅(qū)動(dòng)與感知的核心作用

    機(jī)器人線圈 是機(jī)器人系統(tǒng)實(shí)現(xiàn)電能轉(zhuǎn)換、運(yùn)動(dòng)驅(qū)動(dòng)與信號(hào)感知的重要基礎(chǔ)元件,廣泛應(yīng)用于工業(yè)機(jī)器人、服務(wù)機(jī)器人、協(xié)作
    的頭像 發(fā)表于 02-05 19:09 ?276次閱讀

    攻堅(jiān)農(nóng)業(yè)仿真挑戰(zhàn):Robotec農(nóng)業(yè)機(jī)器人仿真平臺(tái)

    3DGS與4DGS的核心應(yīng)用實(shí)踐與技術(shù)突破!全球農(nóng)業(yè)正面臨糧食需求增長、可持續(xù)發(fā)展壓力及勞動(dòng)力短缺等多重挑戰(zhàn),農(nóng)業(yè)機(jī)器人已從未來愿景變?yōu)楝F(xiàn)實(shí)應(yīng)用。真實(shí)環(huán)境測(cè)試農(nóng)業(yè)
    的頭像 發(fā)表于 11-18 17:31 ?2487次閱讀
    攻堅(jiān)農(nóng)業(yè)仿真<b class='flag-5'>挑戰(zhàn)</b>:Robotec農(nóng)業(yè)<b class='flag-5'>機(jī)器人</b>仿真平臺(tái)

    N32H高性能32位MCU在具身機(jī)器人上的應(yīng)用

    具身智能(Embodied Intelligence)作為人工智能與機(jī)器人技術(shù)深度融合的前沿方向,強(qiáng)調(diào)智能體通過身體與環(huán)境的持續(xù)交互實(shí)現(xiàn)感知、決策與執(zhí)行的閉環(huán)。在這一過程,微控制器(
    的頭像 發(fā)表于 11-06 15:55 ?952次閱讀

    機(jī)器人芯片:驅(qū)動(dòng)智能機(jī)器的核心技術(shù)引擎

    機(jī)器人芯片是機(jī)器人的“大腦”與“神經(jīng)中樞”,負(fù)責(zé)感知環(huán)境、處理數(shù)據(jù)、決策規(guī)劃并控制執(zhí)行。隨著人工智能與邊緣計(jì)算的爆發(fā)式發(fā)展,機(jī)器人芯片已從傳
    的頭像 發(fā)表于 08-28 10:55 ?1240次閱讀

    集成反饋控制的智能舵機(jī):機(jī)器人閉環(huán)系統(tǒng)的關(guān)鍵角色

    在科技飛速發(fā)展的今天,機(jī)器人已經(jīng)逐漸走進(jìn)我們的生活,從工業(yè)生產(chǎn)線上的機(jī)械臂到家庭的掃地機(jī)器人,它們的身影無處不在。而在機(jī)器人的運(yùn)行過程,
    的頭像 發(fā)表于 08-27 17:40 ?751次閱讀

    機(jī)器人競技幕后:磁傳感器芯片激活 “精準(zhǔn)感知力”

    2025 世界人形機(jī)器人運(yùn)動(dòng)會(huì)于 8 月 17 日?qǐng)A滿收官,賽場(chǎng)上機(jī)器人在跑步、跳躍、抓取等項(xiàng)目中的精彩表現(xiàn),背后是運(yùn)動(dòng)控制、環(huán)境感知等技術(shù)的迭代升級(jí)。而在這些技術(shù)
    發(fā)表于 08-26 10:02

    工業(yè)機(jī)器人的特點(diǎn)

    機(jī)器人關(guān)鍵。工業(yè)互聯(lián)網(wǎng)是通過端上的數(shù)據(jù)傳輸,經(jīng)過大數(shù)據(jù)分析和云計(jì)算處理,再進(jìn)行智能化決策的一整個(gè)過程,其中端的數(shù)據(jù)傳輸是基礎(chǔ)。工業(yè)互聯(lián)網(wǎng)的端包括機(jī)器人、傳感器等一切線下連接端口。因此
    發(fā)表于 07-26 11:22

    ADI人形機(jī)器人的“感覺神經(jīng) + 電力神經(jīng)元”核心芯片方案盤點(diǎn)

    作為全球領(lǐng)先的模擬/混合信號(hào)芯片公司,憑借其在 傳感器、信號(hào)鏈、精密模擬、功率管理與接口技術(shù) 方面的深厚積累,已成為人形機(jī)器人核心組件方案的重要供應(yīng)商。 人形機(jī)器人核心模塊ADI的貢
    的頭像 發(fā)表于 06-17 13:41 ?3231次閱讀
    称多县| 开鲁县| 西藏| 大关县| 庆阳市| 图片| 蒙阴县| 雅安市| 积石山| 平度市| 沅江市| 通渭县| 佛学| 固安县| 承德市| 沙河市| 峨眉山市| 荔波县| 阜平县| 利津县| 蒲城县| 锡林郭勒盟| 兴宁市| 洪泽县| 偃师市| 丁青县| 平谷区| 临朐县| 开封县| 双鸭山市| 东阳市| 锦州市| 龙胜| 苍溪县| 耒阳市| 徐州市| 旬阳县| 新竹县| 凤城市| 牡丹江市| 襄樊市|