日韩精品黄,啪啪啪观看高清91

▲計算機更像人的兩種策略：五歲孩童能輕易解決的問題，卻可以考倒效能最強大的計算機。近年來，藉由研究人類的學(xué)習(xí)方法來教導(dǎo)計算機，以致AI熱潮再起。目前，計算機可從兩種方式來辨識字母A，一種是根據(jù)原始信息，也就是由下而上的方法；另一種則運用既有知識去猜測，是由上而下的方法。

如果你常常跟孩童在一起，一定會好奇他們怎么能既快又廣泛學(xué)習(xí)新事物。歷代哲學(xué)家（一路回溯至柏拉圖）也想知道緣由，但一直沒有找到滿意的答案。我的五歲孫子奧吉已經(jīng)學(xué)習(xí)不少關(guān)于植物、動物和時鐘的知識，更不用提恐龍和宇宙飛船。他也能理解其他人的需求、想法，以及有何感覺。他可以依據(jù)這些知識，把看到和聽到的事分類，并做出新的猜測。舉例來說，他最近認為美國紐約市自然史博物館展出的新發(fā)現(xiàn)物種泰坦巨龍（titanosaur）只吃植物，換句話說，牠其實沒有那么嚇人。

奧吉從環(huán)境中感受到的是一連串撞擊他視網(wǎng)膜的光子，以及振動他耳膜的空氣分子。但在他藍色眼珠后方的神經(jīng)計算機，能設(shè)法從他感官獲取的有限信息，做出關(guān)于草食性泰坦巨龍的猜測。我們不斷在思考一個問題：計算機能否像孩童那般既快又廣泛學(xué)習(xí)新事物？

15年來，信息科學(xué)家和心理學(xué)家努力想找到答案。孩童僅憑著教師或父母灌輸有限的信息就能獲得大量的知識。盡管智能機器已突飛猛進，但效能最強大的計算機的學(xué)習(xí)效率還是無法媲美五歲孩童。

了解孩童大腦實際上如何運作，然后創(chuàng)造出同樣有效率的智能機器，是信息科學(xué)家在未來幾十年要面對的挑戰(zhàn)。但此刻，他們正在發(fā)展的人工智能（AI），已經(jīng)納入一些我們對于人類學(xué)習(xí)方式的認知。

復(fù)興人工智能

1950~60年代AI爆發(fā)第一波熱潮后，發(fā)展停滯了幾十年。不過近幾年AI展現(xiàn)驚人突破，特別是機器學(xué)習(xí)，而AI也成為科技界最熱門的領(lǐng)域。關(guān)于這些進展所代表的意義，人們衍生了很多烏托邦或末日論的預(yù)測。說穿了，這些預(yù)言不是提到永生，就是世界毀滅，很多則是同時提到這兩種可能性。

我猜AI的發(fā)展會引起如此強烈的情緒，是因為我們由衷恐懼機器變得太像人。從中世紀的泥人傳說到科幻小說《科學(xué)怪人》，乃至電影「人造意識」性感的女機器人艾娃，人類有一天或許會創(chuàng)造出跟自己沒有什么差別的人造物的這種想法，總教人深感不安。

但計算機真的可以像人類那樣學(xué)習(xí)新事物嗎？這些情緒強烈的預(yù)測，有多少指出革命性的改變，又有多少只是夸大之詞？計算機如何學(xué)會辨認貓、語音或日文字，其中的細節(jié)可能難以理解，但進一步觀察機器學(xué)習(xí)背后的基本概念，就會發(fā)現(xiàn)其實不像一開始那樣令人費解。

解決上述問題的方法之一，是從奧吉或我們?nèi)魏我蝗私邮盏降囊贿B串光子與空氣分子著手，不過傳送給計算機的是數(shù)字影像的像素以及錄制的聲音樣本。計算機會從數(shù)字數(shù)據(jù)中找出一連串模式，以偵測或辨認周遭世界里完整的物體。這種所謂由下而上（bottom-up）的方法源自許多人的想法，例如哲學(xué)家休姆（David Hume）、彌爾（John Stuart Mill）和心理學(xué)家巴佛洛夫（Ivan Pavlov）、史金納（B. F. Skinner）。

1980年代，科學(xué)家想到強而有力且巧妙應(yīng)用由下而上的策略，讓計算機從數(shù)據(jù)中尋找有意義的模式。聯(lián)結(jié)論（connectionism）或人工神經(jīng)網(wǎng)絡(luò)系統(tǒng)的研究人員從神經(jīng)元的運作機制汲取靈感，神經(jīng)元會把視網(wǎng)膜上的光轉(zhuǎn)換成周遭世界的影像。人工神經(jīng)網(wǎng)絡(luò)采取類似做法，使用相互鏈接的處理組件（模仿神經(jīng)元），在逐層分析數(shù)據(jù)時，把某一層的像素轉(zhuǎn)換成越來越復(fù)雜的影像，例如鼻子或整張臉。

拜深度學(xué)習(xí)（deep learning）這項新技術(shù)之賜，人工神經(jīng)網(wǎng)絡(luò)的概念在最近有復(fù)興之勢。如今，Google、臉書與其他科技巨擘已經(jīng)把深度學(xué)習(xí)運用到商業(yè)行為中。一如摩爾定律的預(yù)測，計算機的運算能力不斷呈指數(shù)增加，也促成了這些新系統(tǒng)，而龐大數(shù)據(jù)集的發(fā)展也有貢獻。在聯(lián)結(jié)論系統(tǒng)具備更好的處理能力和更多可分析的數(shù)據(jù)后，學(xué)習(xí)效率比我們以前認為的還要高。

多年來，對于機器學(xué)習(xí)應(yīng)該采取這種由下而上的方式，還是另一種由上而下的方法，AI社群一直搖擺不定。采取由上而下的方法，計算機就能依據(jù)既有的信息來學(xué)習(xí)新事物。柏拉圖以及所謂的理性主義哲學(xué)家例如笛卡兒（Rene? Descartes），相信人類是采取由上而下的方法來學(xué)習(xí)，而這種方法在早期AI的發(fā)展中也扮演重要角色。2000年代，這類方法也以機率或貝氏（Bayesian）模型的型式重生。

就像科學(xué)家一樣，采取由上而下方法的計算機，一開始會先對世界建構(gòu)抽象又廣泛的假設(shè)。如果假設(shè)正確，計算機會預(yù)測數(shù)據(jù)的模式。然后計算機也像科學(xué)家一樣，會根據(jù)預(yù)測結(jié)果修正假設(shè)。

由下而上

由下而上的方法或許是最容易理解的，所以先說明這種方法。假設(shè)你想要計算機區(qū)分電子郵件信箱里的郵件和詐騙信，你可能會注意到詐騙信有一些容易辨別的特征：一長串收件人地址、尼日利亞或保加利亞的發(fā)信地址、信里會提到百萬美元獎金或威而鋼。但非常重要的郵件可能看起來也一模一樣，你一定不想錯過自己獲得晉升或?qū)W術(shù)獎項的通知。

一旦你比較了夠多的詐騙信和其他類型的郵件，你可能會注意到只有詐騙信顯露某些特征。例如，尼日利亞配上百萬美元獎金的郵件，就代表是詐騙信。事實上，要區(qū)分詐騙信和重要郵件，或許有一些更細微、高階的模式，例如拼錯字和IP地址，但兩者一點也不明顯。如果你找到這些特征，就能正確過濾出垃圾郵件，而不用擔(dān)心錯過「你的威而鋼已寄出」的通知郵件。

采取由下而上方法的機器學(xué)習(xí)可以找出相關(guān)線索，解決這類任務(wù)。為了做到這點，人工神經(jīng)網(wǎng)絡(luò)必須進行學(xué)習(xí)過程。把龐大數(shù)據(jù)庫里幾百萬筆例子輸入計算機，每筆例子都標示一般郵件或是詐騙信，然后計算機會擷取出一組可分離出垃圾郵件的辨識特征。

同樣地，人工神經(jīng)網(wǎng)絡(luò)也能檢視網(wǎng)絡(luò)上標示貓、狗或劍龍的影像，在每組影像中擷取共同特征，得以把貓和其他影像區(qū)隔開來。之后人工神經(jīng)網(wǎng)絡(luò)就能辨識貓的影像，即使那是從未見過的新影像。

其中一種由下而上的方法，稱為「無監(jiān)督學(xué)習(xí)」（unsupervised learning），雖然還在相對初期的發(fā)展階段，但可以從毫無標示的數(shù)據(jù)中找出模式。計算機會尋找影像中可辨識物體的整組特征，舉例來說，一張臉總是有鼻子和眼睛，而且與背景中的樹和山不同。這些先進的深度學(xué)習(xí)網(wǎng)絡(luò)透過逐層分析來辨識物體，而辨識任務(wù)在不同層中會轉(zhuǎn)換輸入。

2015年，發(fā)表在《自然》期刊的一篇論文，闡釋由下而上方法的進展。深度心智（DeepMind）是Google創(chuàng)立的一家公司，研究人員結(jié)合了兩種由下而上的技術(shù)：深度學(xué)習(xí)與「增強學(xué)習(xí)」（reinforcement learning），讓計算機精通一款名為雅達利（Atari）2600的電玩游戲。計算機一開始對游戲的運作方式一無所知，采取的策略是隨機猜測最佳玩法，同時不斷接收玩法結(jié)果的回饋。深度學(xué)習(xí)幫助計算機辨識屏幕上的特征，增強學(xué)習(xí)則因計算機獲得高分而獎勵它。計算機在好幾款游戲上都達到熟練程度，在某些游戲中的表現(xiàn)還贏過人類專業(yè)玩家。不過，對于人類輕易就能夠精通的一些游戲，計算機則完全沒輒。

我們讓AI透過龐大數(shù)據(jù)集學(xué)習(xí)，例如數(shù)以百萬的Instagram影像、電子郵件訊息或語音檔案，在過去幾度讓人氣餒的問題上獲得解決方案，例如影像或語音的辨識。然而，我的孫子奧吉沒有接收那么多的數(shù)據(jù)并進行訓(xùn)練，卻輕易就能認出動物或回應(yīng)別人的發(fā)問。五歲孩童能夠輕易解決的某些問題，對計算機來說依舊十分費解，難度也遠超過下棋。

計算機通常要接收幾百萬個范例，才能辨識滿是絡(luò)腮胡的臉孔影像，而人類只需要一些例子就能辦到。計算機經(jīng)過密集訓(xùn)練后，或許能辨識從未見過的貓的影像，但是辨識方法和人類的類化（generalization）很不一樣。因為計算機軟件采用不同的推論方式，有時會發(fā)生失誤。有些包含貓的影像卻沒標記貓，計算機也可能誤指某個影像是貓，不過那其實只是雜亂的模糊影像，人類則不會出這種洋相。

由上而下

另一種機器學(xué)習(xí)的方法，在近幾年改變了AI的發(fā)展，運作方式剛好相反：由上而下。我們假設(shè)人類可以從實際數(shù)據(jù)里獲得抽象知識，因為人類已經(jīng)知道很多事，更是因為大腦已經(jīng)了解基本的抽象概念。就像科學(xué)家一樣，我們可以藉由這些概念建構(gòu)關(guān)于這個世界的假設(shè)，如果假設(shè)正確，就能預(yù)測數(shù)據(jù)（事件）的樣貌；相較之下，實行由下而上方法的AI會設(shè)法從原始數(shù)據(jù)中擷取出模式，做法南轅北轍。

要說明這個概念，可討論上述泛濫成災(zāi)的詐騙信，這回談一件跟我有關(guān)的真實案例。我先前收到某期刊編輯寄來的電子郵件，那份期刊名稱奇怪。編輯明確提到我的一篇論文，并提議我寫篇論文發(fā)表在這本期刊。這封電子郵件中沒有提到尼日利亞、威而鋼和百萬美元獎金，沒有詐騙信共同的特征。但我依據(jù)已經(jīng)知道的信息，并且抽象思考詐騙信的產(chǎn)生方式，可以判定這封電子郵件很可疑。

首先，我知道詐騙信發(fā)送者騙取他人錢財?shù)氖址ㄊ腔谌祟惖呢澙?；學(xué)術(shù)圈人士對發(fā)表論文的渴望，可能跟一般人對百萬美元獎金或性能力的渴求一樣強烈。其次，我知道「開放取用」期刊已經(jīng)開始向作者收費來分擔(dān)成本，而非向訂閱者收費。另外，我的工作跟期刊名稱完全不相干。綜合以上因素，我提出合理假設(shè)：這類電子郵件想讓學(xué)術(shù)圈人士誤以為只要付費給「假」期刊就能「發(fā)表」論文。我從單一例子就得出這項結(jié)論，而且還能進一步測試自己的假設(shè)：透過搜索引擎查詢這位編輯是否真有其人。

信息科學(xué)家會說我的推論過程是「生成模型」（generativemodel），生成模型能描繪抽象概念，例如貪婪與欺騙。同樣的模型也可以描述提出假設(shè)的過程，這個推論過程得出這封郵件可能是詐騙信的結(jié)論。運用這個模型，我能假想這種類型的詐騙信如何運作，也能揣測其他類型，即使是我從未看過或聽過。當(dāng)我收到這個期刊寄來的電子郵件，便能反向運用這個模型，一步步追查這封郵件的真?zhèn)巍?/p>

1950~60年代第一波AI和認知科學(xué)的發(fā)展中，生成模型至關(guān)重要，但也有局限。首先，原則上我們可以用各種不同的假設(shè)來解釋大多數(shù)證據(jù)模式；就我的例子而言，即使那封郵件看似詐騙信，但也可能不是。于是，生成模型必須納入機率概念，而機率是這些方法近來最重大的進展之一。其次，我們通常不知道那些構(gòu)成生成模型的基本概念出自何處。笛卡兒與喬姆斯基（Noam Chomsky）這類學(xué)者指出，你天生就擁有這些概念，但你一誕生在世上時就知道他人如何憑借貪婪和謊言來詐騙？

貝氏模型是近來由上而下方法的絕佳范例，試圖處理這兩個問題。貝氏模型是以18世紀統(tǒng)計學(xué)家兼哲學(xué)家貝茲（Thomas Bayes）為名，利用一種稱為貝氏推論（Bayesian inference）的方法，結(jié)合生成模型與機率論。機率生成模型可以告訴你，如果某個假設(shè)為真，你看到特定模式數(shù)據(jù)的機率有多高。如果某封電子郵件是場騙局，可能就是基于收件者的貪婪。不過，基于貪婪的電子郵件不一定是詐騙信。貝氏模型結(jié)合你提出假設(shè)所依據(jù)的知識以及你手上的數(shù)據(jù)，讓你精準計算某封電子郵件是詐騙信的機率。

比起由下而上的方式，這種由上而下的方式更符合我們對孩童學(xué)習(xí)方式的認知，這就是為什么過去15年我和同事一直采用貝氏模型來研究他們的學(xué)習(xí)方式。我們與其他實驗室都使用這些技術(shù)來了解孩童學(xué)習(xí)的因果關(guān)系，預(yù)測他們?nèi)绾闻c何時會萌生出關(guān)于這個世界的新想法，以及何時會改變既有的想法。

貝氏方法也是教導(dǎo)機器像人一樣學(xué)習(xí)的絕妙方式。2015年，美國麻省理工學(xué)院（MIT）的特南鮑姆（Joshua B. Tenenbaum）和紐約大學(xué)的雷克（Breden M. Lake）等人在《科學(xué)》期刊發(fā)表研究，設(shè)計了一套可以辨識手寫字的AI系統(tǒng)；人類可以輕易辦到這件事，對機器來說卻非常棘手。

試想你的辨識能力，即使你從未看過日文滾動條上的字，大概也能分辨不同滾動條上的文字是否相同。搞不好你還可以寫出日文字，甚至設(shè)計出假的單字，并且知道日文與韓文或俄文大相徑庭。這正是特南鮑姆的團隊要讓AI做到的事。

如果采用由下而上的方法，計算機要接收成千上萬的范例，從這些范例中找到模式，藉由模式辨識新的字。相較之下，貝氏方法則給計算機一個如何寫字的通用模式，舉例來說，一畫可能是往左或往右。計算機在處理完一個字后，會接續(xù)下個字。

當(dāng)計算機看到一個字，會推論這個字的筆畫順序，接著產(chǎn)生一套類似的筆畫，這就像我推論那封疑似期刊詐騙的電子郵件所采取的一連串步驟。特南鮑姆的方式不是推論那封電子郵件是否可能來自詐騙管道，而是猜測特定的筆畫順序是否可能寫出相符的字。在同樣的數(shù)據(jù)上，采用由上而下方式的計算機會表現(xiàn)得比深度學(xué)習(xí)更好，也更接近人類表現(xiàn)。

巧妙結(jié)合兩種方法

這兩種主要的機器學(xué)習(xí)方法：由下而上與由上而下，優(yōu)缺點恰能彼此互補。利用由下而上的方法，計算機一開始不需要對貓有任何了解，但它需要大量的數(shù)據(jù)。

采用貝氏模型的計算機可以從少數(shù)范例中學(xué)習(xí)，而且能更廣泛推論。不過實行這種由上而下的方法，事先需要做很多功課，才能提出一套正確的假設(shè)。兩種系統(tǒng)的設(shè)計者可能會遇到類似的障礙：只能處理范圍相對較小、定義明確的問題，例如辨識手寫字、貓或玩雅達利的電玩游戲。

孩童面臨同樣的限制，卻游刃有余。發(fā)展心理學(xué)家已經(jīng)發(fā)現(xiàn)，不知為何，孩童會結(jié)合各種方法的最佳特色，并發(fā)展出新的方法。奧吉可以僅靠一兩個例子就學(xué)到知識，由上而下的系統(tǒng)也是如此。但不知為何，奧吉也會從數(shù)據(jù)本身擷取新的概念，就像由下而上的系統(tǒng)一樣，即使那些概念一開始并不存在。

事實上，奧吉不只能辦到這些事。他很快就認得貓與區(qū)別字母，但他也能做出有創(chuàng)意又令人驚喜的新推論，這些推論已經(jīng)超出他的經(jīng)驗或背景知識。他最近就解釋，如果大人想要再次變成小孩，應(yīng)該不要吃任何有益健康的蔬菜，因為蔬菜會讓小孩長成大人。這種創(chuàng)意推理是從哪里冒出來的，我們幾乎毫無頭緒。

當(dāng)我們聽到有人主張AI是一種「存在威脅」時，我們應(yīng)該想起人類大腦依然神秘的力量。AI和機器學(xué)習(xí)聽起來很嚇人，就某些方面來說確實如此。軍方正在研究使用這些系統(tǒng)來控制武器的方法；人類的愚蠢相較AI可能造成更多破壞，我們必須比以前更有智慧，才能適當(dāng)管理這些新科技。

摩爾定律是一大影響力：即使信息科技的進步是基于數(shù)據(jù)量和計算機處理能力的大幅增加，而不是我們對心智的了解有觀念上的突破，但這些進展日后依然會有重大成果。盡管如此，我們也不應(yīng)該認為新的科技泥人會有如脫韁野馬在世上橫沖直撞。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

人工智能

人工智能

+關(guān)注

關(guān)注
1821

文章
50455

瀏覽量
267515
機器學(xué)習(xí)

機器學(xué)習(xí)

+關(guān)注

關(guān)注
67

文章
8569

瀏覽量
137357

原文標題：機器學(xué)習(xí)舉一反三

文章出處：【微信號：易心Microbit編程，微信公眾號：易心Microbit編程】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

日B视频亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

搜索歷史

機器學(xué)習(xí)舉一反三

評論