日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DeepMind部署自學(xué)AI 攻陷FPS“雷神之錘”

電子工程師 ? 來源:yxw ? 2019-06-02 10:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI攻占了國際象棋和圍棋高地之后,DeepMind在第一人稱射擊游戲(FPS)上也有了新進展。

1997年5月“深藍”擊敗國際象棋世界冠軍卡斯巴羅夫,有玩家在慶幸,我不下象棋,只下圍棋。

2017年5月AlphaGo打敗圍棋世界冠軍柯潔,有玩家慶幸,還好,我不下棋。

2018年6月,OpenAI 人工智能在dota2 5V5模式中以4000分水平擊敗人類玩家,依舊有玩家慶幸,我不玩RPG(角色扮演)對戰(zhàn),我只玩FPS(第一人稱射擊)。

如今,F(xiàn)PS也被AI攻陷。

近日,DeepMind的研究人員在本周的《科學(xué)》雜志上發(fā)表了一篇論文,描述描述了一個完全無監(jiān)督的自學(xué)程序,不僅能夠?qū)W習(xí)如何玩“ Quake III Arena ”(雷神之錘III競技場,一款第一人稱射擊游戲),還能設(shè)計出勝過人類團隊的新穎戰(zhàn)略。

國際象棋和圍棋最初是用來模擬戰(zhàn)爭游戲的,但卻對戰(zhàn)爭復(fù)盤的不好。因為這類游戲通常涉及一個或多個隊友和敵人。而且一個優(yōu)秀的戰(zhàn)爭游戲必然是三維展開。

DeepMind使用的AI叫For The Win(FTW),本質(zhì)是用卷積神經(jīng)網(wǎng)絡(luò)直接通過屏幕上進行訓(xùn)練,屏幕數(shù)據(jù)會被傳遞到兩個LSTM網(wǎng)絡(luò)或能夠?qū)W習(xí)長期依賴性的網(wǎng)絡(luò)。這兩個LSTM一個是在快速時間尺度上,另一個是在慢速時間尺度上運行。它們通過目標(biāo)耦合,能夠?qū)τ螒蚴澜邕M行預(yù)測并通過模擬游戲控制器輸出動作。

FTW總共訓(xùn)練了30個游戲角色,為他們提供了一系列隊友和對手,并隨機選擇游戲階段,以防止他們通過記憶慣性做出選擇。每個角色都明確自己的獎勵信號,從而擁有自己獨特的目標(biāo)(比如奪取旗幟)。此外,他們利用雙層流程(two-tier process)來優(yōu)化內(nèi)部獎勵,通過這些獎勵加強學(xué)習(xí),來制定最重要的游戲策略。每個角色都單獨玩了大約450,000場比賽,相當(dāng)于擁有大約四年的經(jīng)驗。

訓(xùn)練過后的FTW在地圖,團隊名單和團隊規(guī)模選擇方面都可以作出有利的選擇。他們學(xué)習(xí)了類似人類的行為,例如跟隨隊友,在對手的基地露營,以及在一波攻擊中捍衛(wèi)他們自己的基地。而隨著訓(xùn)練的進行,他們還學(xué)會避免人類玩家的一些弱點,比如過于關(guān)注隊友的行為。

在一場有40名人類參加的比賽中,人類和AI在比賽中隨機匹配(對手或隊友),結(jié)果,AI大勝人類玩家,F(xiàn)TW的Elo評級(相當(dāng)于獲勝的概率)為1600,而最好的人類玩家也只有1300,人類玩家平均評級為1050。

倫敦全球大學(xué)計算機科學(xué)教授,DeepMind科學(xué)家Thore Graepel表示,這項工作顯示了多智能體培訓(xùn)(multiagent)推動人工智能發(fā)展的潛力。這是人機交互和系統(tǒng)相互補充或協(xié)同工作的研究的一個重大進步。

AI訓(xùn)練思路

游戲分為兩個陣營,兩方的大本營在游戲時候開會隨機設(shè)置在地圖的兩端。游戲中的玩家可以在游戲地圖中“瞎逛”,借助地圖中的建筑物、數(shù)目以及其他物品與玩家進行互動。

在游戲中,如果一方用激光擊敗了其他玩家,被擊中的玩家丟掉旗幟,回大本營重生。

DeepMind采用的AI玩家會和人類有同樣的視角,AI不知道其他玩家的信息,包括位置、狀態(tài)等。另外這款游戲比其他棋牌游戲更能接近真實的戰(zhàn)場。AI玩家從零開始,用強化學(xué)習(xí)訓(xùn)練,在游戲的開始,真實加入戰(zhàn)場的AI角色是隨機選擇的,這會使得智能體的行為更能接近最初設(shè)置的策略目標(biāo)。

每個智能體都能夠為自己制定策略,這意味著不同角色會采用不同的戰(zhàn)術(shù),即不同AI玩家有不同的專攻方向。

當(dāng)然,也會有限制,即在每1000次迭代后,系統(tǒng)會比較策略并評估整個團隊在模仿與學(xué)習(xí)能力。如果一個智能體的獲勝機會低于另一個智能體的70%,那么較弱的智能體會復(fù)制較強的智能體。同時,強化學(xué)習(xí)還要求AI通過其他指標(biāo)的對比進行調(diào)整。

AI玩家在一開始就像一張白紙,研究人員給他們的目標(biāo)不僅是游戲結(jié)束時候的得分,還要關(guān)注在游戲前期的得分。研究人員指出,如果獎勵機制只和游戲結(jié)果有關(guān)(輸/贏/平局),顯然限制太少,導(dǎo)致學(xué)習(xí)效果非常不好,所以需要考慮動態(tài)的獎勵機制,即根據(jù)游戲的點數(shù)流來變動。

當(dāng)初始位置是隨機生成時,AI通常擊敗人類玩家。即使人類已經(jīng)練習(xí)了12個小時,他們?nèi)匀荒軌蜈A得25%的比賽,平局6%,剩下的是負。

然而,當(dāng)兩名職業(yè)游戲測試人員得到一張?zhí)貏e復(fù)雜的地圖時,這張地圖AI并沒有見過。重新讓AI在這張地圖上訓(xùn)練的話,只需要6個小時的訓(xùn)練就能脫穎而出。

這一結(jié)果沒有在論文說明,而是在向新聞界提供的一份補充文件中作了說明。

目前人們?nèi)匀豢梢栽诮?jīng)過精心設(shè)計的定位戰(zhàn)中擊敗AI,因為現(xiàn)實生活很少提供這樣復(fù)盤重來的機會,畢竟淮海戰(zhàn)役只能打一次!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41492

    瀏覽量

    302806
  • DeepMind
    +關(guān)注

    關(guān)注

    0

    文章

    131

    瀏覽量

    12443

原文標(biāo)題:Science最新:DeepMind部署自學(xué)AI,攻陷FPS“雷神之錘”

文章出處:【微信號:smartman163,微信公眾號:網(wǎng)易智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    哈薩比斯 3:帶領(lǐng)DeepMind實現(xiàn)技術(shù)反超,重回AI 牌桌

    AI
    江蘇易安聯(lián)
    發(fā)布于 :2026年04月14日 11:40:36

    AI模型訓(xùn)練與部署實戰(zhàn) | 線下免費培訓(xùn)

    你是否想系統(tǒng)了解AI落地全鏈路,但缺少一個完整的實戰(zhàn)項目練手?模型部署環(huán)節(jié)繁多,缺乏一套清晰的實戰(zhàn)路徑?4月18日、4月25日、5月16日RT-Thread將分別在蘇州、成都、南京舉辦“AI模型訓(xùn)練
    的頭像 發(fā)表于 04-07 13:08 ?707次閱讀
    <b class='flag-5'>AI</b>模型訓(xùn)練與<b class='flag-5'>部署</b>實戰(zhàn) | 線下免費培訓(xùn)

    AI端側(cè)部署案例(SC171開發(fā)套件V2-FAS)

    AI端側(cè)部署案例(SC171開發(fā)套件V2-FAS) 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 初學(xué)者入門手寫數(shù)字識別案例 32分21秒 https
    發(fā)表于 02-11 12:08

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V2-FAS)

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V2-FAS) 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉(zhuǎn)化指南 27分19秒 https
    發(fā)表于 02-11 11:44

    AI端側(cè)部署案例(SC171開發(fā)套件V3)2026版

    AI端側(cè)部署案例(SC171開發(fā)套件V3)2026版 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 初學(xué)者入門手寫數(shù)字識別案例 25分29秒 https
    發(fā)表于 01-15 10:40

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉(zhuǎn)化指南 27分19秒 https
    發(fā)表于 01-15 10:31

    瑞芯微SOC智能視覺AI處理器

    需要連接多種外設(shè)的產(chǎn)品。顯示: 支持雙屏異顯,最高4K@60fps輸出。 RK1126B: 一款集成自研NPU的智能視覺AI處理器,專注于視頻輸入端的AI分析與處理。CPU: 雙核A53,主要負責(zé)
    發(fā)表于 12-19 13:44

    從云端到邊緣:聯(lián)發(fā)科MT8371/MT8391平臺實現(xiàn)7B大模型本地部署

    的第八代NPU提供高達7/9 TOPS算力,配備16GB大容量LPDDR5高速內(nèi)存,支持Transformer/CNN硬件加速,支持本地部署7B大語言模型,顯著提升生成式AI任務(wù)(如圖像合成、文本
    發(fā)表于 12-15 16:32

    使用瑞薩RUHMI工具實現(xiàn)AI模型部署過程

    AI無處不在。你在部署AI,你的競爭對手也在部署AI,幾乎所有人都在做AI。然而,
    的頭像 發(fā)表于 10-17 10:00 ?2977次閱讀
    使用瑞薩RUHMI工具實現(xiàn)<b class='flag-5'>AI</b>模型<b class='flag-5'>部署</b>過程

    工業(yè)視覺網(wǎng)關(guān):RK3576賦能多路檢測與邊緣AI

    邊緣網(wǎng)關(guān)傳統(tǒng)IPC+獨顯 通道并發(fā)12路1080P@30fps(優(yōu)化可擴)受PCIe/采集卡限制,成本上升 功耗/體積低功耗、小尺寸,邊緣部署友好功耗高、體積大、散熱復(fù)雜 集成成本SoC一體化
    發(fā)表于 10-16 17:56

    BPI-AIM7 RK3588 AI與 Nvidia Jetson Nano 生態(tài)系統(tǒng)兼容的低功耗 AI 模塊

    可以使用以下工具快速部署AI應(yīng)用程序,而無需復(fù)雜的硬件編程: RKNN-Toolkit2 一鍵將 TensorFlow/PyTorch 模型轉(zhuǎn)換為 RKNN 格式,用于 NPU 加速 INT8 量化
    發(fā)表于 10-11 09:08

    ai_cube訓(xùn)練模型最后部署失敗是什么原因?

    ai_cube訓(xùn)練模型最后部署失敗是什么原因?文件保存路徑里也沒有中文 查看AICube/AI_Cube.log,看看報什么錯?
    發(fā)表于 07-30 08:15

    家電電路識圖自學(xué)手冊

    家電電路識圖自學(xué)手冊
    發(fā)表于 07-11 15:49 ?16次下載

    STM32F769是否可以部署邊緣AI?

    STM32F769是否可以部署邊緣AI
    發(fā)表于 06-17 06:44

    企業(yè)部署AI大模型怎么做

    當(dāng)下,AI大模型已成為驅(qū)動決策自動化、服務(wù)智能化與產(chǎn)品創(chuàng)新的核心引擎。然而,企業(yè)面對動輒數(shù)百億參數(shù)的大模型部署時,常陷入算力不足、響應(yīng)延遲高、成本失控等困境。如何突破瓶頸,實現(xiàn)高效、穩(wěn)定的AI
    的頭像 發(fā)表于 06-04 09:26 ?1040次閱讀
    乐都县| 兴和县| 津南区| 温宿县| 始兴县| 高要市| 洱源县| 达州市| 罗城| 峨眉山市| 渝中区| 凤冈县| 怀安县| 康马县| 嘉定区| 麻阳| 中牟县| 策勒县| 长垣县| 云龙县| 丹阳市| 平阳县| 华蓥市| 满城县| 临湘市| 贵州省| 平武县| 阳西县| 石屏县| 海林市| 乌兰察布市| 榆社县| 响水县| 兴隆县| 宜良县| 穆棱市| 罗定市| 鄂托克前旗| 永和县| 普兰县| 中阳县|