日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI賭神贏的背后,只是8天的訓(xùn)練

mK5P_AItists ? 來(lái)源:YXQ ? 2019-08-15 09:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2017年年初,Brain vs AI的德州撲克人機(jī)大戰(zhàn)在卡耐基梅隆大學(xué)(CMU)落幕,由4名人類職業(yè)玩家組成的人類大腦不敵人工智能程序Libratus。

獲勝后人類還遭到了Libratus的無(wú)情嘲諷。

但是那時(shí)候Libratus還只是個(gè)只能在1V1局里稱霸的超級(jí)玩家,要說(shuō)人類最喜歡的6人局這樣的“大場(chǎng)面”,當(dāng)時(shí)的Libratus還沒(méi)有拿到入場(chǎng)券。

而就在昨天,F(xiàn)acebook與CMU學(xué)Noam Brown、Tuomas Sandholm的最新研究成果——Pluribus,就在人類最常見(jiàn)的無(wú)限制德州撲克6人局里,戰(zhàn)勝了人類頂尖選手。

跟還是不跟?高手之間的對(duì)決

Darren Elias(1986年11月18日出生)是一名美國(guó)職業(yè)撲克玩家,曾獲得四項(xiàng)世界撲克巡回賽冠軍。

在他與Pluribus的對(duì)決過(guò)程中,Darren Elias從來(lái)沒(méi)有遇到過(guò)如此不害怕的對(duì)手。

一個(gè)有經(jīng)驗(yàn)的撲克玩家,當(dāng)有兩個(gè)J(一個(gè)面朝上,另一個(gè)藏起來(lái),一手既不好也不壞)時(shí),都會(huì)謹(jǐn)慎行事。但是Elias的對(duì)手看起來(lái)好像不知道該怎么做。即使當(dāng)Elias決定虛張聲勢(shì)(bluff),下注時(shí)看起來(lái)很有信心,而他的對(duì)手似乎在鼓勵(lì)他繼續(xù)!好像一點(diǎn)都沒(méi)有被嚇到。

最后,Elias的虛張聲勢(shì)沒(méi)有起作用,他輸了。

Elias

正如埃利亞斯先生意識(shí)到的,Pluribus知道什么時(shí)候該虛張聲勢(shì),也知道別人在虛張聲勢(shì),還知道什么時(shí)候該改變自己的行為,這樣其他玩家就無(wú)法確定自己的策略。32歲 Elias先生說(shuō): 它確實(shí)做了一些人類很難做到的事情。

贏的背后,只是8天的訓(xùn)練

之前AI和人玩游戲,要么是雙人游戲,如國(guó)際象棋、跳棋等,要么就是雙方之間的零和博弈(一方贏一方輸),AI可以在游戲中找到Nash equilibrium strategy(納什平衡)來(lái)保證自己不會(huì)輸。

關(guān)于Nash equilibrium strategy(納什平衡)屬于博弈論范疇(注:納什證明了,如果允許混合策略,那么任何一個(gè)博弈,只要參與者數(shù)量是有限的、參與者可以選擇的純策略也是有限的,那么這個(gè)博弈至少有一個(gè)納什均衡)。

以經(jīng)典的“石頭剪刀布”游戲?yàn)槔珹I可以在游戲中找到對(duì)方的弱點(diǎn)和常出的手勢(shì)進(jìn)行學(xué)習(xí),以達(dá)到最終的勝利,而多人撲克意味著玩家數(shù)量的增多,在更復(fù)雜的游戲中,AI難以確定如何與納什均衡相抗衡;采用固定策略不能很快觀察到的對(duì)手的策略傾向,而且需要監(jiān)控到多個(gè)玩家在游戲中策略的轉(zhuǎn)變,這對(duì)于AI多人撲克博弈來(lái)說(shuō),是一項(xiàng)挑戰(zhàn)。

鑒于多人游戲,如果學(xué)習(xí)多個(gè)玩家的出牌習(xí)慣等特征的訓(xùn)練數(shù)據(jù)集成本過(guò)大,這里Pluribus采用的策略是自己與自己博弈,不使用人類對(duì)手的數(shù)據(jù)作為模型訓(xùn)練的輸入。在開(kāi)始時(shí),隨機(jī)的選擇玩法,通過(guò)不斷的訓(xùn)練來(lái)提升自己的性能,這里采用的博弈策略是改良版本的迭代的蒙特卡洛CFR(MCCFR),通過(guò)自我博弈,左右手互博,自己制定了一個(gè)blueprint strategy(藍(lán)圖策略),最后對(duì)每個(gè)可能的狀況進(jìn)行概率分布統(tǒng)計(jì),通過(guò)搜索決策樹來(lái)決定下一步的行為,是叫牌還是出牌。

CFR是一種迭代的自我游戲算法,AI從完全隨機(jī)游戲開(kāi)始,然后通過(guò)學(xué)習(xí)擊敗早期版本的自己逐漸改進(jìn)。

在算法的每次迭代中,MCCFR指定一個(gè)玩家作為其當(dāng)前策略在迭代中更新的標(biāo)記。在迭代開(kāi)始時(shí),MCCFR根據(jù)當(dāng)前所有玩家的策略(最初是完全隨機(jī)的)模擬一手撲克牌。一旦模擬完成,人工智能就會(huì)回顧每一個(gè)玩家做出的決定,然后通過(guò)選擇其他可用的行動(dòng)來(lái)預(yù)測(cè)這個(gè)決定的好壞程度。

Pluribus玩家博弈樹

在解決不完全信息博弈中搜索的問(wèn)題,Pluribus跟蹤每一手,根據(jù)其策略達(dá)到目前狀況的可能性。不管Pluribus實(shí)際上握著的牌,它首先會(huì)計(jì)算如何使用可能的每一手,謹(jǐn)慎地平衡所有的策略,以保持對(duì)于對(duì)手的不可預(yù)測(cè)性。

Pluribus 中的實(shí)時(shí)搜索

撲克以外的事

之前在1V1局中大勝人類的Libratus后來(lái)去五角大樓上班去了,國(guó)防部認(rèn)為這種策略型人工智能或許可以幫助他們進(jìn)行戰(zhàn)略的制定。

負(fù)責(zé) Pluribus 項(xiàng)目的 研究員Noam Brown說(shuō):“Pluribus的技術(shù)可以用于華爾街交易、拍賣、政治談判和網(wǎng)絡(luò)安全這些活動(dòng)中,這些活動(dòng)就像撲克一樣,涉及隱藏信息,因?yàn)槟悴⒉豢偸侵勒鎸?shí)世界的狀態(tài)。”

盡管像谷歌這樣的公司,有著“Don't be evil”的信條,但是,不可避免的是這樣能夠理解人類策略的人工智能,還是會(huì)引發(fā)大眾對(duì)于人工智能的某種恐懼,或者說(shuō),如果這樣的人工智能被運(yùn)用到軍事決策中,將會(huì)帶來(lái)多嚴(yán)重的后果?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41492

    瀏覽量

    302806
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8567

    瀏覽量

    137292

原文標(biāo)題:AI賭神升級(jí)!無(wú)懼bluff,6人局德?lián)渫陝偈澜绻谲?,?xùn)練只用了8天

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    合光能如何為數(shù)字經(jīng)濟(jì)打造綠色能源底座

    你有沒(méi)有想過(guò),當(dāng)你刷短視頻、用AI畫圖、甚至只是點(diǎn)個(gè)外賣時(shí),背后都有誰(shuí)在“撐腰”?
    的頭像 發(fā)表于 04-22 17:15 ?1184次閱讀

    AI模型訓(xùn)練與部署實(shí)戰(zhàn) | 線下免費(fèi)培訓(xùn)

    你是否想系統(tǒng)了解AI落地全鏈路,但缺少一個(gè)完整的實(shí)戰(zhàn)項(xiàng)目練手?模型部署環(huán)節(jié)繁多,缺乏一套清晰的實(shí)戰(zhàn)路徑?4月18日、4月25日、5月16日RT-Thread將分別在蘇州、成都、南京舉辦“AI模型訓(xùn)練
    的頭像 發(fā)表于 04-07 13:08 ?707次閱讀
    <b class='flag-5'>AI</b>模型<b class='flag-5'>訓(xùn)練</b>與部署實(shí)戰(zhàn) | 線下免費(fèi)培訓(xùn)

    華為攜手合作伙伴共Agentic AI時(shí)代新增長(zhǎng)

    在華為中國(guó)合作伙伴大會(huì)2026 數(shù)據(jù)通信產(chǎn)業(yè)峰會(huì)上,華為數(shù)據(jù)通信產(chǎn)品線總裁王雷發(fā)表了“星河AI網(wǎng)絡(luò):安全智聯(lián),共Agentic AI時(shí)代新增長(zhǎng)”主題演講并發(fā)布一系列面向AI時(shí)代新需求
    的頭像 發(fā)表于 03-23 16:30 ?478次閱讀

    邊緣AI算力臨界點(diǎn):深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價(jià)值

    調(diào)度與操作系統(tǒng)運(yùn)行。 2、 10個(gè)AI Core (達(dá)芬奇架構(gòu),1.08GHz):專為高密度的矩陣運(yùn)算設(shè)計(jì),承擔(dān)神經(jīng)網(wǎng)絡(luò)推理。 3、 8個(gè)Vector Core (1GHz):輔助進(jìn)行數(shù)據(jù)預(yù)處理和向量
    發(fā)表于 03-10 14:19

    RA8P1部署ai模型指南:從訓(xùn)練模型到部署?|?本周六

    在嵌入式邊緣AI中,如何把“訓(xùn)練好的模型”穩(wěn)定地“跑在板子上”,決定了項(xiàng)目能否落地。我們帶你基于RA8P1平臺(tái),跑通從數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、量化轉(zhuǎn)換,到工程部署的整個(gè)流程,幫助你快速實(shí)現(xiàn)
    的頭像 發(fā)表于 11-20 18:06 ?2472次閱讀
    RA<b class='flag-5'>8</b>P1部署<b class='flag-5'>ai</b>模型指南:從<b class='flag-5'>訓(xùn)練</b>模型到部署?|?本周六

    800G 光模塊:AI 算力洪流的 “超級(jí)傳動(dòng)軸”

    當(dāng) AI 大模型幾小時(shí)內(nèi)完成訓(xùn)練、自動(dòng)駕駛實(shí)時(shí)處理海量數(shù)據(jù),這些場(chǎng)景背后,800G 光模塊是不可或缺的高速傳輸?shù)鬃?。它?b class='flag-5'>只是 “網(wǎng)線升級(jí)品”,更是支撐全球數(shù)字基礎(chǔ)設(shè)施運(yùn)轉(zhuǎn)的核心組件,而
    的頭像 發(fā)表于 10-30 16:54 ?1429次閱讀

    華為云與開(kāi)發(fā)者共AI未來(lái)

    ,與開(kāi)發(fā)者共”主題演講,詳細(xì)闡述了華為云生態(tài)的最新進(jìn)展,并宣布華為開(kāi)發(fā)者空間全面升級(jí),全新集成多種AI原生應(yīng)用開(kāi)發(fā)能力。
    的頭像 發(fā)表于 09-20 15:58 ?1870次閱讀

    一文看懂AI訓(xùn)練、推理與訓(xùn)推一體的底層關(guān)系

    我們正在參加全球電子成就獎(jiǎng)的評(píng)選,歡迎大家?guī)臀覀兺镀薄x謝支持很多人聽(tīng)過(guò)“大模型”,但沒(méi)搞懂兩件事。我們總說(shuō)AI有多強(qiáng),但真正決定AI能否落地的,是它的兩個(gè)階段:訓(xùn)練(Training)和推理
    的頭像 發(fā)表于 09-19 11:58 ?2913次閱讀
    一文看懂<b class='flag-5'>AI</b><b class='flag-5'>訓(xùn)練</b>、推理與訓(xùn)推一體的底層關(guān)系

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    、分布式群體智能 1)物聯(lián)網(wǎng)AGI系統(tǒng) 優(yōu)勢(shì): 組成部分: 2)分布式AI訓(xùn)練 7、發(fā)展重點(diǎn):基于強(qiáng)化學(xué)習(xí)的后訓(xùn)練與推理 8、超越大模型:神經(jīng)符號(hào)計(jì)算 三、AGI芯片的實(shí)現(xiàn) 1、技術(shù)需
    發(fā)表于 09-18 15:31

    睿海光電800G光模塊助力全球AI基建升級(jí)

    領(lǐng)先的技術(shù)研發(fā)實(shí)力、行業(yè)領(lǐng)先的交付速度(較同行快2-3)以及高度兼容的解決方案,迅速崛起為AI光模塊領(lǐng)域的標(biāo)桿企業(yè)。目前,睿海光電已為全球1560余家客戶提供包括800G SR8在內(nèi)的多場(chǎng)景產(chǎn)品矩陣
    發(fā)表于 08-13 19:05

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級(jí)

    引領(lǐng)AI時(shí)代網(wǎng)絡(luò)變革:睿海光電的核心競(jìng)爭(zhēng)力 在AI時(shí)代,數(shù)據(jù)中心正經(jīng)歷從傳統(tǒng)架構(gòu)向AI工廠與AI云的轉(zhuǎn)型。AI工廠依賴超大規(guī)模GPU集群驅(qū)動(dòng)
    發(fā)表于 08-13 19:01

    在K230中,如何使用AI Demo中的object_detect_yolov8n,YOLOV8多目標(biāo)檢測(cè)模型?

    在K230的AI開(kāi)發(fā)教程文檔中,可以看到有源碼的AI Demo,其中包括yolov8n模型,在倉(cāng)庫(kù)里可以看到源碼 我想請(qǐng)問(wèn)各位大佬,如何使用這個(gè)程序?如何更改程序,替換為我自己的數(shù)據(jù)集和
    發(fā)表于 08-07 06:48

    兆芯攜手聯(lián)想開(kāi)在WAIC 2025展示AI公文寫作神器

    2025世界人工智能大會(huì)正在火熱召開(kāi)。本屆大會(huì),兆芯攜手聯(lián)想開(kāi)展示了一套AI公文寫作神器,基于開(kāi)AIPC終端,搭載定制AI算力卡,推理、數(shù)據(jù)完全本地化,內(nèi)置基于海量權(quán)威語(yǔ)料
    的頭像 發(fā)表于 08-04 10:01 ?1253次閱讀

    ai_cube訓(xùn)練模型最后部署失敗是什么原因?

    ai_cube訓(xùn)練模型最后部署失敗是什么原因?文件保存路徑里也沒(méi)有中文 查看AICube/AI_Cube.log,看看報(bào)什么錯(cuò)?
    發(fā)表于 07-30 08:15

    使用 ai cude 里面自帶的案例訓(xùn)練UI顯示異常的原因?怎么解決?

    案例的配置是默認(rèn)的,顯示訓(xùn)練ui更改顯示異常
    發(fā)表于 06-23 06:21
    东海县| 德州市| 河源市| 绥化市| 安庆市| 雷山县| 晋中市| 买车| 得荣县| 黄浦区| 元氏县| 芷江| 黔西县| 电白县| 乌拉特中旗| 洪江市| 建始县| 新密市| 汉川市| 蚌埠市| 东光县| 吉木萨尔县| 临湘市| 靖边县| 和田县| 渭源县| 盐边县| 宝鸡市| 涟水县| 牡丹江市| 砀山县| 望城县| 罗山县| 海盐县| 灵宝市| 延吉市| 吐鲁番市| 鹤岗市| 九龙城区| 丰顺县| 白水县|