魔方可謂20世紀(jì)80年代的標(biāo)志性智力玩具,如今它正在被用作連接深度學(xué)習(xí)與高等數(shù)學(xué)之間的橋梁。
計(jì)算機(jī)科學(xué)教授Pierre Baldi是加州大學(xué)歐文分校(UCI)研究團(tuán)隊(duì)從事此項(xiàng)工作的負(fù)責(zé)人,他認(rèn)為深度學(xué)習(xí)與高等數(shù)學(xué)之間的“鴻溝”是當(dāng)今人工智能所面臨的最大難題。
“大家會(huì)抱怨深度學(xué)習(xí)是一個(gè)黑盒子,他們不知道這個(gè)網(wǎng)絡(luò)在做些什么?!盉aldi說(shuō)道,“而我們可以看到該網(wǎng)絡(luò)正在學(xué)習(xí)數(shù)學(xué)?!?/p>
自從匈牙利雕塑家兼建筑學(xué)教授Ern? Rubik于1974年發(fā)明了魔方之后,這種各個(gè)面色彩不一的立方體就開(kāi)始讓人們?yōu)橹院屠Щ蟆?/p>
研究團(tuán)隊(duì)發(fā)現(xiàn),深度學(xué)習(xí)模型可以用于教會(huì)機(jī)器如何做數(shù)學(xué)題(這里是一種被稱(chēng)為“群論”的代數(shù)概念),這就是Baldi所說(shuō)的“AI 重大挑戰(zhàn)中的一小步”。
無(wú)心插柳
研究人員最初的目標(biāo)是構(gòu)建一個(gè)深度學(xué)習(xí)模型,可在無(wú)需任何人工協(xié)助的情況下解開(kāi)魔方,就像早期的模型掌握了國(guó)際象棋的游戲方式一樣。
為了實(shí)現(xiàn)這一目標(biāo),他們像教小孩子一樣引導(dǎo)模型學(xué)習(xí)如何還原魔方。
從已還原的魔方開(kāi)始,模型首先向后倒退一步,然后還原魔方。接著向后倒退兩步并還原魔方,隨后再向后倒退三步,如此類(lèi)推。這會(huì)讓算法在每一次嘗試中逐漸學(xué)習(xí)。Baldi將這一過(guò)程比作學(xué)習(xí)高爾夫球,首先從近距離推桿進(jìn)球開(kāi)始,然后隨著精確度的提升而逐漸遠(yuǎn)離球洞。
該研究團(tuán)隊(duì)最近發(fā)表了一篇論文,詳細(xì)介紹了他們的工作。該團(tuán)隊(duì)為其開(kāi)發(fā)出的增強(qiáng)學(xué)習(xí)算法起了一個(gè)名字:“自學(xué)迭代(autodidactic iteration)”。該算法可在平均30步之內(nèi)完全還原被打亂的魔方,也可以實(shí)現(xiàn)人類(lèi)玩家所能達(dá)到的最快速度。
研究人員在訓(xùn)練該模型時(shí)使用了搭載NVIDA GPU的機(jī)器,同時(shí)還使用了CUDA編程模型、TensorFlow機(jī)器學(xué)習(xí)框架和Keras神經(jīng)網(wǎng)絡(luò)API。
據(jù)Baldi估計(jì),GPU將工作速度加快了5到10倍,并且其團(tuán)隊(duì)可以無(wú)限制地將更多GPU投入使用,進(jìn)一步推動(dòng)深度學(xué)習(xí)研究。
“我們對(duì)GPU求之若渴,”他說(shuō)道,“它們對(duì)于這項(xiàng)工作來(lái)說(shuō)必不可少?!?/p>
充滿無(wú)限可能的一次進(jìn)步
Baldi表示,魔方展現(xiàn)了一個(gè)獨(dú)特的深度學(xué)習(xí)挑戰(zhàn):魔方的正確解法只有一種,但錯(cuò)誤的組合形式卻有數(shù)百億億之多。這里用的還只是傳統(tǒng)的三階魔方,每個(gè)面各有9個(gè)方塊。
解開(kāi)更高階的魔方是該團(tuán)隊(duì)的下一個(gè)奮斗目標(biāo)。他們想知道將這種“自學(xué)迭代”的方式應(yīng)用于四階和五階魔方的效果如何。但首先,團(tuán)隊(duì)必須對(duì)該方法進(jìn)行調(diào)整,以應(yīng)對(duì)大幅提高的復(fù)雜度。
“如果將速度降至原來(lái)的二分之一,則不會(huì)出現(xiàn)什么問(wèn)題?!盉aldi 說(shuō)道,“但如果將速度減慢到與大陸漂移的速度一樣,那么問(wèn)題就來(lái)了?!?/p>
同時(shí)Baldi發(fā)現(xiàn),也可以利用這種方式教會(huì)自學(xué)迭代模型掌握其他游戲的玩法。
他認(rèn)為這項(xiàng)工作在其他數(shù)學(xué)領(lǐng)域也擁有潛在的應(yīng)用機(jī)會(huì),尤其是高中水平以上的數(shù)學(xué)內(nèi)容。他表示,AI一直在努力實(shí)現(xiàn)這一點(diǎn)。
而B(niǎo)aldi的團(tuán)隊(duì)對(duì)此的看法則是這種難題很快就會(huì)成為明日黃花。同時(shí),解開(kāi)更復(fù)雜、更困難的問(wèn)題才是其奮斗目標(biāo)。
-
gpu
+關(guān)注
關(guān)注
28文章
5292瀏覽量
136113 -
AI
+關(guān)注
關(guān)注
91文章
41431瀏覽量
302763 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5611瀏覽量
124664
原文標(biāo)題:通過(guò)魔方有望實(shí)現(xiàn)AI領(lǐng)域的重大突破
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
開(kāi)發(fā)智能體配置-內(nèi)容合規(guī)
微軟與新思科技分享智能體人工智能技術(shù)的行業(yè)影響
今日看點(diǎn):中科院院士:未來(lái)人工智能助手將取代手機(jī);合肥120億高端光罩項(xiàng)目開(kāi)工
利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能
“人工智能+”,走老路難賺到新錢(qián)
挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器
挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!
關(guān)于人工智能處理器的11個(gè)誤解
超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級(jí)芯片(SoC)上解鎖邊緣人工智能應(yīng)用.
迅為RK3588開(kāi)發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能
最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門(mén)學(xué)習(xí)課程參考2025版(大模型篇)
維智科技為什么提出時(shí)空人工智能
人工智能是做什么的
我們能否打開(kāi)人工智能的“黑箱”?
評(píng)論