日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌DeepMind重磅發(fā)布了基礎(chǔ)世界模型:Genie(精靈)

vliwulianw ? 來源:軟件質(zhì)量報(bào)道 ? 2024-02-28 10:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大家都喜歡玩游戲吧?因?yàn)橛螒蜃畲蟮奈κ亲屛覀兲颖墁F(xiàn)實(shí)、幻想一個(gè)遠(yuǎn)離我們眼前現(xiàn)實(shí)的世界,掌控這個(gè)虛擬的現(xiàn)實(shí)世界。現(xiàn)在,我們可以想象一下,如果我們有能力創(chuàng)造自己的世界,那該多好了。 讓我們激動(dòng)的這一天來了! 北美時(shí)間26號(hào)下午,GoogleGenie團(tuán)隊(duì)的負(fù)責(zé)人Tim Rockt?schel非常興奮地宣布:Google DeepMindOpen Endedness團(tuán)隊(duì)開發(fā)的基于互聯(lián)網(wǎng)視頻訓(xùn)練的基礎(chǔ)世界模型(foundation world model)——Genie

(幽靈)發(fā)布了,它可以根據(jù)圖像提示生成無窮無盡的可控動(dòng)作2D世界的各種變化。這個(gè)110億參數(shù)大模型Genie,能從一張圖片就能創(chuàng)造出可玩的虛擬世界,動(dòng)作可控,這也預(yù)示著,AI已經(jīng)真正殺到視頻游戲領(lǐng)域了。

084845f0-d5db-11ee-a297-92fbcf53809c.png

0853455e-d5db-11ee-a297-92fbcf53809c.png

什么是Genie(精靈)?

根據(jù) Google DeepMind 的官方博客文章,Genie 是一個(gè)基礎(chǔ)世界模型,它是根據(jù)來自互聯(lián)網(wǎng)的視頻進(jìn)行訓(xùn)練的。該模型可以“從合成圖像、照片甚至草圖中生成無窮無盡的可玩(動(dòng)作可控)世界”。 研究論文 “Genie:Generative Interactive Environments” 指出,Genie是第一個(gè)從未標(biāo)記的互聯(lián)網(wǎng)視頻中以無監(jiān)督方式訓(xùn)練的生成式交互式環(huán)境。在大小方面,Genie 的參數(shù)為 11B,由時(shí)空視頻標(biāo)記器(spatiotemporal videotokenizer)、自回歸動(dòng)力學(xué)模型(autoregressive dynamics model)和簡(jiǎn)單且可擴(kuò)展的潛在動(dòng)作模型(simple and scalable latent action model)組成。

這些技術(shù)規(guī)范允許 Genie 在生成的環(huán)境中逐幀運(yùn)行,即使在沒有訓(xùn)練、標(biāo)注或任何其他特定領(lǐng)域要求的情況下也是如此。

Genie 能做什么的?

根據(jù)這篇研究論文,Genie是一種新型的生成式人工智能,它使任何人(甚至是兒童)都能夢(mèng)想并進(jìn)入類似于人類設(shè)計(jì)的模擬環(huán)境的生成世界??梢蕴崾?Genie 生成一組不同的交互式和可控環(huán)境,盡管它是在純視頻數(shù)據(jù)上訓(xùn)練的。

簡(jiǎn)而言之,我們已經(jīng)看到了許多生成式 AI 模型,它們使用語言、圖像甚至視頻生成創(chuàng)意內(nèi)容。Genie 是一個(gè)突破,因?yàn)樗梢詮膯蝹€(gè)圖像提示中創(chuàng)建可玩的環(huán)境。

試著記住《哈利·波特與魔法石》中哈利和他的朋友們?cè)谇巴裉m芬多公共休息室的路上進(jìn)入霍格沃茨城堡的場(chǎng)景。年輕的學(xué)生們看到一面墻上掛滿了畫作,每個(gè)角色都在他們的畫面中慢慢地移動(dòng),這些畫作栩栩如生。Genie能使靜止圖像栩栩如生,賦予我們一個(gè)自己的世界。

根據(jù) Google DeepMind 的說法,Genie 可以收到它從未見過的圖像提示,這包括現(xiàn)實(shí)世界的照片、草圖,允許人們與他們想象的虛擬世界互動(dòng),這就是稱之為“基礎(chǔ)世界模型”。在培訓(xùn)方面,研究論文強(qiáng)調(diào),他們更關(guān)注2D平臺(tái)游戲和機(jī)器人技術(shù)的視頻。Genie 使用通用方法進(jìn)行訓(xùn)練,使其能夠在任何類型的域上運(yùn)行,并且可以擴(kuò)展到更大的 Internet 數(shù)據(jù)集。

為什么Genie很重要?

Genie 的突出之處在于它能夠從互聯(lián)網(wǎng)視頻中學(xué)習(xí)和重現(xiàn)游戲中角色的控制。這是值得注意的,因?yàn)榛ヂ?lián)網(wǎng)視頻沒有關(guān)于視頻中執(zhí)行的動(dòng)作的標(biāo)簽,甚至沒有關(guān)于應(yīng)該控制圖像的哪一部分的標(biāo)簽。

Google 博客文章寫道:“Genie不僅可以學(xué)習(xí)觀察的哪些部分通常是可控的,還可以推斷出在生成的環(huán)境中一致的各種潛在行為。請(qǐng)注意,相同的潛在動(dòng)作如何在不同的提示圖像中產(chǎn)生相似的行為,“ 根據(jù) Google DeepMind 的說法,該模型最獨(dú)特的方面是:它允許您從單個(gè)圖像創(chuàng)建一個(gè)全新的交互式環(huán)境。這開辟了許多可能性,尤其是創(chuàng)建和進(jìn)入虛擬世界的新方法。為了證明這一點(diǎn),研究人員使用文本到圖像模型Imagen 2創(chuàng)建了一個(gè)圖像,然后將其用作創(chuàng)建虛擬世界的提示。草圖也可以做同樣的事情。

有了 Genie,任何人都可以創(chuàng)建自己完全想象的虛擬世界。此外,該模型學(xué)習(xí)和開發(fā)新世界模型的能力標(biāo)志著向通用人工智能代理(一個(gè)獨(dú)立的程序或?qū)嶓w,通過傳感器感知其周圍環(huán)境來與環(huán)境交互)的重大飛躍。 開啟另一個(gè)旅程:




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6263

    瀏覽量

    112112
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50436

    瀏覽量

    267441
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3832

    瀏覽量

    5285

原文標(biāo)題:基礎(chǔ)世界模型Google Genie誕生了:根據(jù)提示生成無窮無盡的、可交互的2D世界

文章出處:【微信號(hào):軟件質(zhì)量報(bào)道,微信公眾號(hào):軟件質(zhì)量報(bào)道】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    小鵬汽車發(fā)布世界模型加速器X-Cache

    2026年3月,小鵬發(fā)布自動(dòng)駕駛世界模型(X-World)的技術(shù)報(bào)告,揭示小鵬世界
    的頭像 發(fā)表于 05-09 11:09 ?319次閱讀
    小鵬汽車<b class='flag-5'>發(fā)布</b><b class='flag-5'>世界</b><b class='flag-5'>模型</b>加速器X-Cache

    小馬智行發(fā)布PonyWorld世界模型2.0

    4月10日,小馬智行正式發(fā)布其在物理AI領(lǐng)域的最新技術(shù)成果——PonyWorld世界模型2.0。
    的頭像 發(fā)表于 04-10 17:21 ?1206次閱讀

    小鵬汽車正式發(fā)布世界模型X-World技術(shù)報(bào)告

    近日,小鵬汽車正式發(fā)布世界模型X-World技術(shù)報(bào)告,從數(shù)據(jù)、模型、訓(xùn)練、驗(yàn)證及應(yīng)用等多層面詳解X-World的構(gòu)建與使用。
    的頭像 發(fā)表于 04-02 10:27 ?2519次閱讀
    小鵬汽車正式<b class='flag-5'>發(fā)布</b><b class='flag-5'>世界</b><b class='flag-5'>模型</b>X-World技術(shù)報(bào)告

    大曉機(jī)器人開源實(shí)時(shí)生成世界模型Kairos 3.0-4B

    近日,大曉機(jī)器人重磅開源開悟世界模型3.0(Kairos 3.0)-4B 系列具身原生世界模型。作為業(yè)內(nèi)首個(gè)實(shí)現(xiàn) “多模態(tài)理解 — 生成 —
    的頭像 發(fā)表于 03-14 16:54 ?2049次閱讀
    大曉機(jī)器人開源實(shí)時(shí)生成<b class='flag-5'>世界</b><b class='flag-5'>模型</b>Kairos 3.0-4B

    如何構(gòu)建適合自動(dòng)駕駛的世界模型?

    [首發(fā)于智駕最前沿微信公眾號(hào)]世界模型經(jīng)歷系統(tǒng)動(dòng)力學(xué)階段(1960年~2000年)、認(rèn)知科學(xué)階段(2001年~2017年)、深度學(xué)習(xí)階段(2018年至今),但將其應(yīng)用到自動(dòng)駕駛汽車上,還是近幾年才
    的頭像 發(fā)表于 02-18 08:14 ?1.1w次閱讀
    如何構(gòu)建適合自動(dòng)駕駛的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>?

    云知聲山海知音大模型2.0重磅發(fā)布

    隨著智能體時(shí)代到來,云知聲在“山?!tlas”通用智算基座持續(xù)演進(jìn)基礎(chǔ)上,年前實(shí)現(xiàn)“山海·知醫(yī)”5.0醫(yī)療大模型升級(jí),今天迎來了“山海·知音”2.0的重磅發(fā)布,正在完成“一基兩翼”
    的頭像 發(fā)表于 01-27 14:08 ?373次閱讀
    云知聲山海知音大<b class='flag-5'>模型</b>2.0<b class='flag-5'>重磅</b><b class='flag-5'>發(fā)布</b>

    谷歌正式發(fā)布Gemma Scope 2模型

    大語言模型 (LLM) 具備令人驚嘆的推理能力,但其內(nèi)部決策過程在很大程度上仍然不透明。如果系統(tǒng)未按預(yù)期運(yùn)行,對(duì)其內(nèi)部運(yùn)作機(jī)制缺乏可見性將難以準(zhǔn)確定位問題根源。過去,我們通過發(fā)布 Gemma
    的頭像 發(fā)表于 01-24 14:01 ?785次閱讀

    VLA與世界模型有什么不同?

    [首發(fā)于智駕最前沿微信公眾號(hào)]當(dāng)前自動(dòng)駕駛行業(yè),各車企的技術(shù)路徑普遍選擇單車智能方向。而在實(shí)際落地過程中,不同企業(yè)選擇差異化的技術(shù)實(shí)現(xiàn)方式,部分車企側(cè)重于視覺—語言—?jiǎng)幼?b class='flag-5'>模型(Vision
    的頭像 發(fā)表于 12-17 09:13 ?954次閱讀
    VLA與<b class='flag-5'>世界</b><b class='flag-5'>模型</b>有什么不同?

    泰凌微:布局端側(cè)AI,產(chǎn)品支持谷歌LiteRT、TVM開源模型

    。 ? 公司發(fā)布的基于TL721X系列芯片的TL-EdgeAI平臺(tái),支持谷歌LiteRT、TVM等開源模型,是目前世界上功耗最低的智能物聯(lián)網(wǎng)連接協(xié)議平臺(tái)。其芯片已在
    的頭像 發(fā)表于 12-15 08:21 ?1w次閱讀

    Gemini AI 再進(jìn)化:谷歌聯(lián)合XREAL發(fā)布Project Aura, 打開“看見世界”的新能力

    [2025年12月9日,美國(guó)加利福尼亞州山景城]?—— 在今日舉行的 The Android Show 上,谷歌首次公布 Project Aura產(chǎn)品和 Android XR系統(tǒng)的關(guān)鍵細(xì)節(jié),該產(chǎn)品
    發(fā)表于 12-09 11:06 ?1466次閱讀
    Gemini AI 再進(jìn)化:<b class='flag-5'>谷歌</b>聯(lián)合XREAL<b class='flag-5'>發(fā)布</b>Project Aura, 打開“看見<b class='flag-5'>世界</b>”的新能力

    利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)

    NVIDIA 最近發(fā)布 NVIDIA Cosmos 開放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測(cè)試與驗(yàn)證數(shù)據(jù)生成。借助
    的頭像 發(fā)表于 12-01 09:25 ?1552次閱讀

    中科曙光助力紫東太初4.0大模型重磅發(fā)布

    近日,全球首個(gè)“深度推理+多模態(tài)”大模型——“紫東太初”4.0在2025東湖國(guó)際人工智能高峰論壇上正式發(fā)布。中科曙光作為核心生態(tài)伙伴,依托中國(guó)首個(gè)AI計(jì)算開放架構(gòu),為“紫東太初”4.0提供圖文多模態(tài)模型訓(xùn)推、大語言
    的頭像 發(fā)表于 09-24 09:33 ?872次閱讀

    谷歌DeepMind重磅發(fā)布Genie 3,首次實(shí)現(xiàn)世界模型實(shí)時(shí)交互

    電子發(fā)燒友網(wǎng)綜合報(bào)道 當(dāng)?shù)貢r(shí)間2025年8月5日,谷歌DeepMind正式推出第三代通用世界模型Genie3。這款被英偉達(dá)科學(xué)家Jim Fa
    的頭像 發(fā)表于 08-13 08:27 ?7251次閱讀

    商湯大裝置重磅發(fā)布多項(xiàng)標(biāo)志性成果

    在2025世界人工智能大會(huì)(WAIC 2025)期間,作為“最懂大模型的AI基礎(chǔ)設(shè)施”,商湯大裝置重磅發(fā)布多項(xiàng)標(biāo)志性成果,持續(xù)打造AI基礎(chǔ)設(shè)施發(fā)展新范式,力推動(dòng)產(chǎn)業(yè)生態(tài)與應(yīng)用場(chǎng)景的系統(tǒng)
    的頭像 發(fā)表于 08-05 10:07 ?1196次閱讀

    三張圖深入分析京東開源Genie的8大亮點(diǎn)

    京東開源的Genie智能體的8大亮點(diǎn): 可插拔多Agent和多種工具 迭代式規(guī)劃 跨任務(wù)上下文和文件共享 數(shù)字員工提升用戶體驗(yàn) 大模型+搜索構(gòu)建深度搜素 CodeTool構(gòu)建智能代碼生命周期管理 精心打磨的System Prompt 可配置的MCP Server 審核編輯
    的頭像 發(fā)表于 07-27 12:40 ?580次閱讀
    三張圖深入分析京東開源<b class='flag-5'>Genie</b>的8大亮點(diǎn)
    九龙城区| 莆田市| 石景山区| 丰顺县| 酒泉市| 峨眉山市| 丰宁| 镇远县| 财经| 德江县| 杭锦后旗| 新干县| 锦州市| 贵德县| 蒲城县| 资阳市| 图木舒克市| 莒南县| 安新县| 祥云县| 象州县| 澳门| 昭平县| 光泽县| 保亭| 安宁市| 平凉市| 紫金县| 什邡市| 日照市| 尉氏县| 武隆县| 内乡县| 永靖县| 建昌县| 德兴市| 余庆县| 台北县| 元谋县| 青神县| 延川县|