九九热综合在线视频,情色日韩VA,婷婷成人亚洲综合在线

對于計算工業(yè)，其最基本的一個假設(shè)是：數(shù)字處理會變得越來越便宜。并且根據(jù)著名的摩爾定律，可以預(yù)測在給定尺寸的芯片其上面能集成的電路個數(shù)（差不多相當于算力）通常每兩年會翻一番。

斯坦福人工智能研究所副所長克里斯托弗·曼寧表示，對于許多相對簡單的AI應(yīng)用來言，上述假設(shè)意味著訓練成本的降低。但對于有些應(yīng)用現(xiàn)在卻不是這樣的，特別是因為不斷增加的研究復(fù)雜性和競爭性，使得最前沿模型的訓練成本還在不斷上升。

曼寧用BERT模型來舉例，BERT是谷歌在18年提出的AI語言模型，已被用在谷歌搜索中。該模型有超過3.5億個內(nèi)部參數(shù)，而且要大量數(shù)據(jù)來進行訓練，大概用了33億個大部分來自維基百科的單詞來訓練。接著曼寧說，現(xiàn)在看來維基百科都不是個多大的數(shù)據(jù)集了?！叭绻苡?00億個單詞訓練一個系統(tǒng)，那它的性能肯定比用30億個單詞訓練的系統(tǒng)要好?！钡嗟臄?shù)據(jù)也意味著要用更多算力進行支持。

總部位于加州的OpenAI表示，隨著對機器學習興趣的不斷增加，對算力的需求從12年開始也急劇增加了。到18年，用于訓練大型模型的計算機算力相比之前已增長了30萬倍，并且還每三個半月翻一番（見圖）。比如，為訓練能在DOTA 2中擊敗人類的“OpenAI Five”系統(tǒng)，就幾乎將機器學習訓練擴展到了“前所未有的水平”，差不多用數(shù)千塊芯片訓練了十多個月。

關(guān)于所有這些訓練成本的確切數(shù)字，馬薩諸塞州阿默斯特大學的研究人員在19年發(fā)表的一篇論文中進行了估計，例如訓練某個版本的Transformer模型可能就要花費300萬美金。同時Facebook的AI負責人杰羅姆·佩森蒂表示，針對當前最大的模型進行一輪訓練光是電費可能就好幾百萬美金。

云計算輔助

然而，對于Facebook這樣19年利潤就達185億美元的公司，這點錢不算什么。但對于那些現(xiàn)金并不充足的公司就有點壓力山大了。著名風險投資公司Andreessen Horowitz （a16z）指出，許多AI初創(chuàng)公司都是從云計算公司（如亞馬遜和微軟）來租用訓練所需的算力。而因此帶來的費用（有時占收入的25％或更多）也是AI初創(chuàng)公司投資吸引力低于老式軟件公司的原因之一。3月，曼寧博士在斯坦福大學的同事們，包括著名的李飛飛，一起呼吁創(chuàng)建美國國家研究云計算計劃，旨在幫助美國AI研究人員應(yīng)對不斷增長的訓練費用。

對算力日益增長的需求同時也推動了芯片設(shè)計和AI專用計算設(shè)備的蓬勃發(fā)展。專用芯片的第一波浪潮是GPU的出現(xiàn)，其在90年代設(shè)計出來就是為了用于增強視頻游戲圖形處理。而非常巧的是，GPU也非常適合現(xiàn)在AI應(yīng)用中的數(shù)學計算。

相比起GPU現(xiàn)在還有更專業(yè)的芯片，各個公司也正在致力于研究這些芯片。去年12月，英特爾就以20億美元的價格收購了以色列公司Habana Labs；而成立于16年的英國公司Graphcore在2019年的估值為20億美元；最大的GPU制造商Nvidia等公司已對其芯片進行了重新設(shè)計來適應(yīng)AI的計算需求；Google內(nèi)部設(shè)計了自己的“張量處理單元”（TPU）芯片；而中國科技巨頭百度也已用上了自己的“昆侖”芯片。畢馬威的阿方索·馬龍認為，專用AI芯片的市場價值已達約100億美元的規(guī)模，而到2025年預(yù)估能達到800億美元。

Graphcore的創(chuàng)始人之一奈杰爾·圖恩表示：“計算機體系結(jié)構(gòu)需要適應(yīng)現(xiàn)在訓練處理數(shù)據(jù)的方式?！?對于AI運算其最基礎(chǔ)的特征可以說就是“并行”，即將運算切分為很多小塊同時進行運算。例如，Graphcore的芯片有1，200多個單獨的數(shù)字運算核，能連接在一起提供更多的算力。而加州的創(chuàng)業(yè)公司Cerebras采取了更極端的方法，每個芯片占用了整張硅片，每張硅片上能放置40萬左右個核。

除了并行，其他優(yōu)化也很重要。Cerebras的創(chuàng)始人之一安德魯·費爾德曼指出，AI模型花費了大量時間來進行乘零操作。而因為這些計算結(jié)果總時零，所以其實很多都是不必要的，所以Cerebras的芯片就盡量避免執(zhí)行這些運算。同時，Graphcore的Toon先生說，與許多任務(wù)不同，現(xiàn)在AI并不需要超精確的計算。這也意味著芯片設(shè)計人員能通過減少運算所需的精度來節(jié)省能耗。（而計算精度到底能降到什么程度仍是個開放性問題。）

之后所有這些因素都能綜合起來獲得更大提升。Toon就認為Graphcore當前的芯片效率是GPU的10到50倍。

現(xiàn)在類似的創(chuàng)新變得越來越重要，因為對算力需求激增正趕上摩爾定律逐漸失效的時候?，F(xiàn)在縮小芯片變得越來越困難，而且?guī)淼氖找嬉苍絹碓叫?。去年，Nvidia的創(chuàng)始人黃仁勛直言不諱地說：“摩爾定律失效了”。

量子解決方案和神經(jīng)形態(tài)方案

因此，現(xiàn)在研究人員還在尋找更多的解決方法。其中一種是量子計算，利用量子力學的反直覺特性為某些類型的計算進行大幅提速。關(guān)于機器學習的一種思考角度是將它看作是一個優(yōu)化問題，而計算機試圖在數(shù)百萬個變量中進行權(quán)衡從而求出盡可能最小值。微軟量子系統(tǒng)部門負責人Krysta Svore說，一種稱為格羅弗算法的量子計算技術(shù)具有巨大的提速潛力。

另一種想法是從生物學中獲得啟發(fā)，認為當前的蠻力方法并不是唯一的方法。當Cerebras的芯片運行起來，功耗大約為15kw，足以為數(shù)十座房屋供電（相同數(shù)量GPU能耗更多）。而相比起來，人腦消耗能量就只有大概20w，只有前者的千分之一，而人腦在許多方面都比硅芯片更聰明。因此，英特爾和IBM等公司正在研究“神經(jīng)形態(tài)”芯片，希望設(shè)計出更能模仿生物大腦神經(jīng)元電行為的組件。

但到目前為止，這兩條路都還很遙遠。量子計算機在理論上相對容易理解些，但盡管有谷歌，微軟和IBM等技術(shù)巨頭投入數(shù)十億美元，實際搭建卻仍是個巨大挑戰(zhàn)。而神經(jīng)形態(tài)芯片雖然是用現(xiàn)有技術(shù)構(gòu)建的，但讓設(shè)計人員很氣餒的是，就連神經(jīng)科學家都還不怎么了解大腦究竟在做什么以及怎么做到的。

這意味著，在可預(yù)見的未來，AI研究人員將不得不繼續(xù)盡可能地壓榨現(xiàn)有計算技術(shù)性能。而Toon先生對此還是很樂觀的，他認為通過更專業(yè)硬件以及調(diào)整現(xiàn)有軟件讓訓練更快，也還是能帶來很大收益。為了說明這個新領(lǐng)域的發(fā)展，他用電子游戲打了個比方：“現(xiàn)在我們已超越了乓（Pong），可能到了吃豆人。”

沒有錢來進行訓練的窮煉丹師們理所當然地希望他說的是對的。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關(guān)注

關(guān)注
91

文章
41523

瀏覽量
302857
機器學習

機器學習

+關(guān)注

關(guān)注
67

文章
8569

瀏覽量
137312
算力

算力

+關(guān)注

關(guān)注
2

文章
1711

瀏覽量
16846

日B视频亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

搜索歷史

AI訓練算力需求昂貴，機器學習成本成問題

評論