日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌大腦的“世界模型”簡(jiǎn)述與啟發(fā)

mK5P_AItists ? 來(lái)源:lq ? 2019-01-30 09:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摘要:我們的視覺(jué)看到什么,部分取決于大腦預(yù)測(cè)未來(lái)會(huì)看到什么。

我們的視覺(jué)看到什么,部分取決于大腦預(yù)測(cè)未來(lái)會(huì)看到什么,例如下圖中,如果你預(yù)計(jì)要看到突出的球體,那也許你就會(huì)看到,如果讓機(jī)器也具有了這樣的能力,會(huì)帶來(lái)什么了?

18年谷歌大腦提出“世界模型”(World Models)可以在復(fù)雜的環(huán)境中通過(guò)自我學(xué)習(xí)產(chǎn)生相應(yīng)的策略,例如玩賽車游戲。

下面是世界模型的整體架構(gòu):

整個(gè)模型分為3個(gè)組件:視覺(jué)組件(V),記憶組件(M),控制組件(C)。視覺(jué)組件V用來(lái)壓縮圖片信息到一個(gè)隱變量z上(其實(shí)只是一個(gè)VAE編碼解碼器):

記憶組件M的輸入是一幀幀的游戲圖片(論文中的一幀圖像似乎叫一個(gè)rollout),輸出是預(yù)測(cè)下一幀圖像的可能分布,其實(shí)就是比一般LSTM更高級(jí)一些的MDN-RNN:

最后控制組件C的目標(biāo),就是把前面視覺(jué)組件V和記憶組件M的輸出一起作為輸入,并輸出這個(gè)時(shí)刻智能體agent應(yīng)該做出的動(dòng)作(action)。

在所謂的“世界模型”,其中的組件模型幾乎沒(méi)有是谷歌大腦自己創(chuàng)新研制的。但世界模型會(huì)很大提高強(qiáng)化學(xué)習(xí)訓(xùn)練穩(wěn)定性和成績(jī) 從而使其與其他強(qiáng)化學(xué)習(xí)相比有一些明顯優(yōu)勢(shì),如下表所示;

世界模型有如下的3個(gè)特點(diǎn)

1. 模型拼接得足夠巧妙,這個(gè)巧妙的拼接模型做到所謂的世界想象能力,就是模型在學(xué)習(xí)時(shí),自身對(duì)環(huán)境假想一個(gè)模擬的環(huán)境,甚至可以在沒(méi)有環(huán)境訓(xùn)練的情況下,自己想象一個(gè)環(huán)境去訓(xùn)練。其實(shí)就是我們?nèi)祟愮R像神經(jīng)元的功能。

2. 抓住了一些“強(qiáng)視覺(jué)”游戲的“痛點(diǎn)”。記憶組件M中的RNN是生成序列的能手,所以根據(jù)之前游戲圖像再“想象”一些圖像幀應(yīng)該不成問(wèn)題(RNN生成一些隱變量z,再根據(jù)隱變量z,由視覺(jué)組件VAE的decode生成的圖像幀即可)。所以對(duì)于“強(qiáng)視覺(jué)”的游戲,把RNN的記憶能力用在視覺(jué)預(yù)測(cè)和控制上是個(gè)好主意 。

3不同于我們常見(jiàn)的“不可生”智能算法,例如遺傳算法和進(jìn)化策略只是強(qiáng)調(diào)了基因的“變異”與在解空間中進(jìn)行搜索,神經(jīng)網(wǎng)絡(luò)只是固定網(wǎng)絡(luò)結(jié)構(gòu);而生物界的基因卻可以指導(dǎo)蛋白質(zhì)構(gòu)成并且“生長(zhǎng)”。如果基因可以構(gòu)造自身個(gè)體,外部環(huán)境和個(gè)體情況也可以反過(guò)來(lái)影響基因,而我們的模型都太固定呆板了,模型結(jié)構(gòu)不能隨內(nèi)部隱變量改進(jìn),當(dāng)然最佳的設(shè)計(jì)形式也許誰(shuí)也不知道。而世界模型做到了讓在內(nèi)部”幻想“的環(huán)境中產(chǎn)生的策略轉(zhuǎn)移到外部世界中。

最后簡(jiǎn)單看一下世界模型的訓(xùn)練過(guò)程:

world models代碼基于chainer計(jì)算框架,步驟如下:

1. 準(zhǔn)備數(shù)據(jù)集,隨機(jī)玩游戲生成訓(xùn)練幀(rollouts意思應(yīng)該就是多少幀):

python random_rollouts.py--gameCarRacing-v0 --num_rollouts10000

2. 訓(xùn)練視覺(jué)組件V,即前面提到的VAE:

python vision.py--gameCarRacing-v0 --z_dim32--epoch1

3. 訓(xùn)練記憶組件M,即前面提到的RNN:

python model.py--gameCarRacing-v0 --z_dim32--hidden_dim256--mixtures5--epoch20

4. 訓(xùn)練控制組件C,即前面提到的CMA-ES算法(其實(shí)就是支持更復(fù)雜輸入和更新的ES):

python controller.py--gameCarRacing-v0 --lambda_64--mu0.25--trials16--target_cumulative_reward900--z_dim32--hidden_dim256--mixtures5--temperature1.0--weights_type1[--cluster_mode]

5. 測(cè)試訓(xùn)練結(jié)果:

python test.py--gameCarRacing-v0 --z_dim32--hidden_dim256--mixtures5--temperature1.0--weights_type1--rollouts100[--record]

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6259

    瀏覽量

    112004
  • 機(jī)器
    +關(guān)注

    關(guān)注

    0

    文章

    801

    瀏覽量

    41942
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    574

    瀏覽量

    11647

原文標(biāo)題:谷歌大腦的“世界模型”簡(jiǎn)述與啟發(fā)

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    小鵬發(fā)布 X-World 世界模型:已全面應(yīng)用第二代VLA

    第二代 VLA 自動(dòng)駕駛系統(tǒng)的研發(fā)、仿真與驗(yàn)證,標(biāo)志著自動(dòng)駕駛從 路測(cè)驅(qū)動(dòng) 邁入 世界模型驅(qū)動(dòng) 的新階段。 何為 X-World? X-World 是基于視頻擴(kuò)散生成技術(shù)構(gòu)建的多視角生成式世界
    的頭像 發(fā)表于 04-14 10:11 ?6042次閱讀

    小馬智行發(fā)布PonyWorld世界模型2.0

    4月10日,小馬智行正式發(fā)布其在物理AI領(lǐng)域的最新技術(shù)成果——PonyWorld世界模型2.0。
    的頭像 發(fā)表于 04-10 17:21 ?1180次閱讀

    小鵬汽車正式發(fā)布世界模型X-World技術(shù)報(bào)告

    近日,小鵬汽車正式發(fā)布世界模型X-World技術(shù)報(bào)告,從數(shù)據(jù)、模型、訓(xùn)練、驗(yàn)證及應(yīng)用等多層面詳解X-World的構(gòu)建與使用。
    的頭像 發(fā)表于 04-02 10:27 ?2479次閱讀
    小鵬汽車正式發(fā)布<b class='flag-5'>世界</b><b class='flag-5'>模型</b>X-World技術(shù)報(bào)告

    如何構(gòu)建適合自動(dòng)駕駛的世界模型?

    提出的。那世界模型是自動(dòng)駕駛落地的正解嗎? 什么是世界模型? 世界模型對(duì)于自動(dòng)駕駛汽車來(lái)說(shuō),更像
    的頭像 發(fā)表于 02-18 08:14 ?1.1w次閱讀
    如何構(gòu)建適合自動(dòng)駕駛的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>?

    谷歌評(píng)論卡,碰一碰即可完成谷歌評(píng)論 #谷歌評(píng)論卡 #NFC標(biāo)簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發(fā)布于 :2026年01月15日 17:02:00

    每年10億美元,蘋果與谷歌官宣合作,Gemini大模型注入Siri

    該協(xié)議,下一代蘋果基礎(chǔ)模型(Apple Foundation Models)將基于谷歌的Gemini模型和云技術(shù)。 ? 蘋果:借Gemini之力,加速AI追趕 ? 長(zhǎng)期以來(lái),蘋果在AI領(lǐng)域的發(fā)展相對(duì)滯后,其語(yǔ)音助手Siri的功能
    的頭像 發(fā)表于 01-13 14:59 ?5929次閱讀

    自動(dòng)駕駛中常提的世界模型是什么?

    在很多廠家的技術(shù)方案中,會(huì)提到世界模型的介紹。世界模型,就是自動(dòng)駕駛系統(tǒng)內(nèi)部用來(lái)表示外部世界并預(yù)測(cè)未來(lái)演變的一組
    的頭像 發(fā)表于 01-05 16:23 ?1123次閱讀

    大曉機(jī)器人發(fā)布開(kāi)悟3.0,國(guó)產(chǎn)世界模型讓機(jī)器人擁有“超級(jí)大腦

    機(jī)器人的使命就是讓每個(gè)機(jī)器人都擁有一個(gè)聰明的大腦,洞察萬(wàn)物,學(xué)會(huì)與視覺(jué)精準(zhǔn)交互。 ? 在此背景下,大曉機(jī)器人憑借其原創(chuàng)的“世界模型”技術(shù)體系,正快速崛起為具身智能領(lǐng)域的關(guān)鍵推動(dòng)者。就在12月,大曉機(jī)器人正式發(fā)布“開(kāi)悟
    的頭像 發(fā)表于 12-25 09:25 ?2837次閱讀
    大曉機(jī)器人發(fā)布開(kāi)悟3.0,國(guó)產(chǎn)<b class='flag-5'>世界</b><b class='flag-5'>模型</b>讓機(jī)器人擁有“超級(jí)<b class='flag-5'>大腦</b>”

    VLA與世界模型有什么不同?

    Language Action,VLA),另一些則致力于構(gòu)建并應(yīng)用世界模型(World Model)。這兩種路徑有什么不同? 什么是VLA,什么是世界模型 先說(shuō)說(shuō)VLA。VLA是英文
    的頭像 發(fā)表于 12-17 09:13 ?896次閱讀
    VLA與<b class='flag-5'>世界</b><b class='flag-5'>模型</b>有什么不同?

    世界模型是讓自動(dòng)駕駛汽車?yán)斫?b class='flag-5'>世界還是預(yù)測(cè)未來(lái)?

    ? [首發(fā)于智駕最前沿微信公眾號(hào)]世界模型在自動(dòng)駕駛技術(shù)中已有廣泛應(yīng)用。但當(dāng)談及它對(duì)自動(dòng)駕駛的作用時(shí),難免會(huì)出現(xiàn)分歧。它到底是讓自動(dòng)駕駛汽車得以理解世界,還是為其提供了預(yù)測(cè)未來(lái)的視角? 世界
    的頭像 發(fā)表于 12-16 09:27 ?1042次閱讀
    <b class='flag-5'>世界</b><b class='flag-5'>模型</b>是讓自動(dòng)駕駛汽車?yán)斫?b class='flag-5'>世界</b>還是預(yù)測(cè)未來(lái)?

    泰凌微:布局端側(cè)AI,產(chǎn)品支持谷歌LiteRT、TVM開(kāi)源模型

    。 ? 公司發(fā)布的基于TL721X系列芯片的TL-EdgeAI平臺(tái),支持谷歌LiteRT、TVM等開(kāi)源模型,是目前世界上功耗最低的智能物聯(lián)網(wǎng)連接協(xié)議平臺(tái)。其芯片已在谷歌(Google)
    的頭像 發(fā)表于 12-15 08:21 ?1w次閱讀

    谷歌AlphaEarth和維智時(shí)空AI大模型的核心差異

    谷歌AlphaEarth和維智時(shí)空AI大模型在技術(shù)理念上存在諸多共性,但兩者在目標(biāo)尺度、數(shù)據(jù)來(lái)源、技術(shù)實(shí)現(xiàn)和應(yīng)用模式上存在顯著差異。
    的頭像 發(fā)表于 10-22 14:50 ?1082次閱讀

    谷歌AlphaEarth和維智時(shí)空AI大模型的技術(shù)路徑

    谷歌AlphaEarth和維智時(shí)空AI大模型在應(yīng)用場(chǎng)景和技術(shù)實(shí)現(xiàn)上各有側(cè)重,但兩者在底層技術(shù)理念上存在顯著共性。
    的頭像 發(fā)表于 10-22 14:48 ?1075次閱讀

    谷歌DeepMind重磅發(fā)布Genie 3,首次實(shí)現(xiàn)世界模型實(shí)時(shí)交互

    電子發(fā)燒友網(wǎng)綜合報(bào)道 當(dāng)?shù)貢r(shí)間2025年8月5日,谷歌DeepMind正式推出第三代通用世界模型Genie3。這款被英偉達(dá)科學(xué)家Jim Fan譽(yù)為“游戲引擎2.0”的模型,通過(guò)單文本提
    的頭像 發(fā)表于 08-13 08:27 ?7215次閱讀

    自動(dòng)駕駛中常提的世界模型是個(gè)啥?

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)的不斷成熟,車輛需要在復(fù)雜多變的道路環(huán)境中安全地行駛,這就要求系統(tǒng)不僅能“看見(jiàn)”周圍的世界,還要能“理解”和“推測(cè)”未來(lái)的變化。世界模型可以被看作一種
    的頭像 發(fā)表于 06-24 08:53 ?1428次閱讀
    自動(dòng)駕駛中常提的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>是個(gè)啥?
    增城市| 江城| 绥阳县| 常宁市| 桃江县| 稻城县| 淮滨县| 江城| 莒南县| 会宁县| 泗阳县| 本溪市| 锡林浩特市| 福建省| 昆山市| 阿坝县| 新巴尔虎右旗| 巴东县| 阳曲县| 贞丰县| 原阳县| 天水市| 疏附县| 灵石县| 阳谷县| 新密市| 江西省| 共和县| 兴隆县| 莎车县| 米易县| 安阳县| 大名县| 抚松县| 灵丘县| 宣恩县| 华坪县| 卢龙县| 砚山县| 呼图壁县| 德阳市|