久久久久午夜免费电影,不卡AV韩国在线,久久久艹艹

大家都喜歡玩游戲吧？因?yàn)橛螒蜃畲蟮奈κ亲屛覀兲颖墁F(xiàn)實(shí)、幻想一個(gè)遠(yuǎn)離我們眼前現(xiàn)實(shí)的世界，掌控這個(gè)虛擬的現(xiàn)實(shí)世界。現(xiàn)在，我們可以想象一下，如果我們有能力創(chuàng)造自己的世界，那該多好了。讓我們激動(dòng)的這一天來了！北美時(shí)間26號(hào)下午，GoogleGenie團(tuán)隊(duì)的負(fù)責(zé)人Tim Rockt?schel非常興奮地宣布：Google DeepMindOpen Endedness團(tuán)隊(duì)開發(fā)的基于互聯(lián)網(wǎng)視頻訓(xùn)練的基礎(chǔ)世界模型（foundation world model）——Genie

（幽靈）發(fā)布了，它可以根據(jù)圖像提示生成無窮無盡的可控動(dòng)作2D世界的各種變化。這個(gè)110億參數(shù)大模型Genie，能從一張圖片就能創(chuàng)造出可玩的虛擬世界，動(dòng)作可控，這也預(yù)示著，AI已經(jīng)真正殺到視頻游戲領(lǐng)域了。

什么是Genie（精靈）？

根據(jù) Google DeepMind 的官方博客文章，Genie 是一個(gè)基礎(chǔ)世界模型，它是根據(jù)來自互聯(lián)網(wǎng)的視頻進(jìn)行訓(xùn)練的。該模型可以“從合成圖像、照片甚至草圖中生成無窮無盡的可玩（動(dòng)作可控）世界”。研究論文 “Genie：Generative Interactive Environments” 指出，Genie是第一個(gè)從未標(biāo)記的互聯(lián)網(wǎng)視頻中以無監(jiān)督方式訓(xùn)練的生成式交互式環(huán)境。在大小方面，Genie 的參數(shù)為 11B，由時(shí)空視頻標(biāo)記器（spatiotemporal videotokenizer）、自回歸動(dòng)力學(xué)模型（autoregressive dynamics model）和簡(jiǎn)單且可擴(kuò)展的潛在動(dòng)作模型（simple and scalable latent action model）組成。

這些技術(shù)規(guī)范允許 Genie 在生成的環(huán)境中逐幀運(yùn)行，即使在沒有訓(xùn)練、標(biāo)注或任何其他特定領(lǐng)域要求的情況下也是如此。

Genie 能做什么的？

根據(jù)這篇研究論文，Genie是一種新型的生成式人工智能，它使任何人（甚至是兒童）都能夢(mèng)想并進(jìn)入類似于人類設(shè)計(jì)的模擬環(huán)境的生成世界?？梢蕴崾?Genie 生成一組不同的交互式和可控環(huán)境，盡管它是在純視頻數(shù)據(jù)上訓(xùn)練的。

簡(jiǎn)而言之，我們已經(jīng)看到了許多生成式 AI 模型，它們使用語言、圖像甚至視頻生成創(chuàng)意內(nèi)容。Genie 是一個(gè)突破，因?yàn)樗梢詮膯蝹€(gè)圖像提示中創(chuàng)建可玩的環(huán)境。

試著記住《哈利·波特與魔法石》中哈利和他的朋友們?cè)谇巴裉m芬多公共休息室的路上進(jìn)入霍格沃茨城堡的場(chǎng)景。年輕的學(xué)生們看到一面墻上掛滿了畫作，每個(gè)角色都在他們的畫面中慢慢地移動(dòng)，這些畫作栩栩如生。Genie能使靜止圖像栩栩如生，賦予我們一個(gè)自己的世界。

根據(jù) Google DeepMind 的說法，Genie 可以收到它從未見過的圖像提示，這包括現(xiàn)實(shí)世界的照片、草圖，允許人們與他們想象的虛擬世界互動(dòng)，這就是稱之為“基礎(chǔ)世界模型”。在培訓(xùn)方面，研究論文強(qiáng)調(diào)，他們更關(guān)注2D平臺(tái)游戲和機(jī)器人技術(shù)的視頻。Genie 使用通用方法進(jìn)行訓(xùn)練，使其能夠在任何類型的域上運(yùn)行，并且可以擴(kuò)展到更大的 Internet 數(shù)據(jù)集。

為什么Genie很重要？

Genie 的突出之處在于它能夠從互聯(lián)網(wǎng)視頻中學(xué)習(xí)和重現(xiàn)游戲中角色的控制。這是值得注意的，因?yàn)榛ヂ?lián)網(wǎng)視頻沒有關(guān)于視頻中執(zhí)行的動(dòng)作的標(biāo)簽，甚至沒有關(guān)于應(yīng)該控制圖像的哪一部分的標(biāo)簽。

Google 博客文章寫道：“Genie不僅可以學(xué)習(xí)觀察的哪些部分通常是可控的，還可以推斷出在生成的環(huán)境中一致的各種潛在行為。請(qǐng)注意，相同的潛在動(dòng)作如何在不同的提示圖像中產(chǎn)生相似的行為，“ 根據(jù) Google DeepMind 的說法，該模型最獨(dú)特的方面是：它允許您從單個(gè)圖像創(chuàng)建一個(gè)全新的交互式環(huán)境。這開辟了許多可能性，尤其是創(chuàng)建和進(jìn)入虛擬世界的新方法。為了證明這一點(diǎn)，研究人員使用文本到圖像模型Imagen 2創(chuàng)建了一個(gè)圖像，然后將其用作創(chuàng)建虛擬世界的提示。草圖也可以做同樣的事情。

有了 Genie，任何人都可以創(chuàng)建自己完全想象的虛擬世界。此外，該模型學(xué)習(xí)和開發(fā)新世界模型的能力標(biāo)志著向通用人工智能代理（一個(gè)獨(dú)立的程序或?qū)嶓w，通過傳感器感知其周圍環(huán)境來與環(huán)境交互）的重大飛躍。開啟另一個(gè)旅程：

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴