日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

始于硬件卻也被硬件所限的深度學習

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚 ? 2022-12-05 01:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/周凱揚)深度學習硬件在AI時代已經(jīng)引領了不少設計創(chuàng)新,無論是簡單的邊緣推理,還是大規(guī)模自然語言模型的訓練,都有了性能上的突破。作為業(yè)內在深度學習上投入最多的公司之一,英偉達無疑是這類硬件的領軍者。

近日,在伯克利大學的電子工程與電腦科學學院研討會上,英偉達的首席科學家、研究部門高級副總裁同時兼任該校副教授的BillDally,分享了從他這個從業(yè)人士看來,發(fā)生在深度學習硬件上的一些趨勢。

硬件成為限制

AI的浪潮其實早在20世紀就被多次掀起過,但真正成為人們不可忽視的巨浪,還是這十幾年的事,因為這時候AI有了天時地利人和:算法與模型,大到足夠訓練這些模型的數(shù)據(jù)集,以及能在合理的時間內訓練出這些模型的硬件。

但從帶起第一波深度學習的AlexNet,到如今的GPT-3TuringNLG等,人們不斷在打造更大的數(shù)據(jù)集和更大的模型,加上大語言模型的興起,對訓練的要求也就越來越高??稍谀柖梢呀?jīng)放緩的當下,訓練時間也在被拉長。

poYBAGOM0tGAQZM8AAn0_Rgb1Iw971.png

基于Hopper架構的H100GPU/英偉達

以英偉達為例,到了帕斯卡這一代,他們才真正開始考慮單芯片的深度學習性能,并結合到GPU的設計中去,所以才有了Hopper這樣超高規(guī)格的AI硬件出現(xiàn)。但我們在訓練這些模型的時候,并沒有在硬件規(guī)模上有所減少,仍然需要用到集成了數(shù)塊HopperGPUDGX系統(tǒng),甚至打造一個超算。很明顯,單從硬件這一個方向出發(fā)已經(jīng)有些不夠了,至少不是一個“高性價比”的方案。

軟硬件全棧投入

硬件推出后,仍要針對特定的模型進行進一步的軟件優(yōu)化,因此即便是同樣的硬件,其AI性能也會在未來呈現(xiàn)數(shù)倍的飛躍。從上個月的MLPerf的測試結果就可以看出,在A100GPU推出的2.5年內,英偉達就靠軟件優(yōu)化實現(xiàn)了最高2.5倍的訓練性能提升,當然了最大的性能提升還是得靠H100這樣的新硬件來實現(xiàn)。

BillDally表示這就是英偉達的優(yōu)勢所在,雖然這幾年投入進深度學習硬件的資本不少,但隨著經(jīng)濟下行,不少投資者已經(jīng)喪失了信心,所以不少AI硬件初創(chuàng)公司都沒能撐下去,他自己也在這段時間看到了不少向英偉達投遞過來的簡歷。

他認為不少這些公司都已經(jīng)打造出了自己的矩陣乘法器,但他們并沒有在軟件上有足夠的投入,所以即便他們一開始給出的指標很好看,也經(jīng)常拿英偉達的產品作為對比,未來的性能甚至比不過英偉達的上一代硬件,更別說Hopper這類新產品了。

加速器

相較傳統(tǒng)的通用計算硬件,加速器在深度學習上明顯要高效多了,因為加速器往往都是作為一種專用單元存在的,比如針對特定的數(shù)據(jù)類型和運算。加速器可以在一個運算周期內就完成通常需要花上10秒或100秒才能完成的工作量,效率最高可提升1000倍。

pYYBAGOM0tuAc7h7AAFHR6jFQlY35.jpeg

A100H100MLPerf跑分/英偉達

當然了要追求純粹的性能提升,而不是效率提升的話,這些加速器也可以采用大規(guī)模并行設計,比如典型的32x32矩陣乘法單元,同時運行的運算有了千百倍的提升。加速器在內存設計上也更具有優(yōu)勢,比如針對特定的數(shù)據(jù)結構和運算,選擇優(yōu)化過的高帶寬低能耗內存,同時盡可能使用本地內存,減少數(shù)據(jù)搬運來控制開銷。

對于英偉達來說,他們在加速器上的研究更像是為GPU準備的試驗田,一旦有優(yōu)秀的成果出現(xiàn),這些加速器就會成為GPU上的新核心。

小結

BillDally的分享中,我們可以看出英偉達這樣的巨頭在深度學習上選擇的技術路線,以及他們?yōu)楹文茉诒姸喑鮿?chuàng)公司涌現(xiàn)、大廠入局的當下巋然不動的底氣。這并不是說深度學習硬件的道路只有這一條,類腦芯片等技術的出現(xiàn)也提供了新的破局機會,但有了前人經(jīng)驗的借鑒后,在兼顧性能、數(shù)值精度、模型的同時,還是得在軟件上下大功夫才行。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算
    +關注

    關注

    2

    文章

    460

    瀏覽量

    40134
  • AI
    AI
    +關注

    關注

    91

    文章

    41315

    瀏覽量

    302691
  • 深度學習
    +關注

    關注

    73

    文章

    5610

    瀏覽量

    124654
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Winbond W83781D/W83781G硬件監(jiān)控IC深度解析

    Winbond W83781D/W83781G硬件監(jiān)控IC深度解析 一、引言 在當今的計算機系統(tǒng)中,硬件監(jiān)控對于確保系統(tǒng)的穩(wěn)定運行至關重要。Winbond的W83781D/W83781G硬件
    的頭像 發(fā)表于 04-27 12:20 ?162次閱讀

    Microchip ATSHA204A:高安全性硬件認證設備的深度解析

    Microchip ATSHA204A:高安全性硬件認證設備的深度解析 在當今數(shù)字化時代,數(shù)據(jù)安全至關重要。Microchip的ATSHA204A作為CryptoAuthentication?家族
    的頭像 發(fā)表于 04-06 14:55 ?721次閱讀

    Microchip ATSHA204A:高安全硬件認證設備的深度剖析

    Microchip ATSHA204A:高安全硬件認證設備的深度剖析 引言 在當今數(shù)字化時代,數(shù)據(jù)安全和設備認證至關重要。Microchip的ATSHA204A作為
    的頭像 發(fā)表于 04-06 14:50 ?674次閱讀

    深度解析LM81:硬件監(jiān)控的得力助手

    深度解析LM81:硬件監(jiān)控的得力助手 在硬件設計的領域中,對服務器、個人計算機等微處理器系統(tǒng)進行硬件監(jiān)控是確保系統(tǒng)穩(wěn)定運行的關鍵環(huán)節(jié)。TI推出的LM81便是一款高度集成的數(shù)據(jù)采集系統(tǒng),
    的頭像 發(fā)表于 02-26 14:25 ?359次閱讀

    請問UART硬件FIFO深度是多少?如何避免數(shù)據(jù)溢出?

    UART 硬件 FIFO 深度是多少?如何避免數(shù)據(jù)溢出?
    發(fā)表于 11-21 06:59

    廣凌智慧教室建設內容:硬件與軟件介紹

    廣凌科技(廣凌股份)憑借“硬件+平臺+數(shù)據(jù)”的深度融合,推出智慧教室整體解決方案,全面覆蓋智慧教室建設的硬件配置、軟件平臺、數(shù)據(jù)驅動及場景適配需求,一起來看看廣凌智慧教室建設需要搭建什么硬件
    的頭像 發(fā)表于 11-11 16:17 ?1504次閱讀
    廣凌智慧教室建設內容:<b class='flag-5'>硬件</b>與軟件介紹

    深度剖析Nios II 處理器的硬件抽象層

    硬件抽象層(Hardware Abstraction Layer, HAL)是一個輕量級嵌入式運行時環(huán)境,它為用戶應用程序和底層硬件提供了一個簡單的設備驅動程序接口。HAL應用程序接口(API
    的頭像 發(fā)表于 10-31 15:25 ?5185次閱讀
    <b class='flag-5'>深度</b>剖析Nios II 處理器的<b class='flag-5'>硬件</b>抽象層

    貼片式SD卡如何在STM32硬件上實現(xiàn)高效日志記錄#貼片式sd卡 #貼片式tf卡 #stm32 #硬件

    硬件
    深圳市雷龍發(fā)展有限公司
    發(fā)布于 :2025年06月18日 17:10:22

    電子硬件工程師如何從零開始學習?(文末免費分享從零開始學習資料)

    經(jīng)常有用戶咨詢,如何學習和提升電子硬件能力,有沒有適合小白學習的資料等等;電子硬件工程師是一個結合理論、實踐和創(chuàng)新能力的職業(yè),需要掌握電路設計、元器件選型、PCB設計、嵌入式系統(tǒng)、測試
    的頭像 發(fā)表于 06-04 07:36 ?2803次閱讀
    電子<b class='flag-5'>硬件</b>工程師如何從零開始<b class='flag-5'>學習</b>?(文末免費分享從零開始<b class='flag-5'>學習</b>資料)

    硬件:我就說還得靠我

    硬件
    揚興科技
    發(fā)布于 :2025年05月26日 18:27:09
    仲巴县| 鄂伦春自治旗| 高雄县| 永新县| 喀喇沁旗| 盐山县| 依兰县| 桓台县| 蓬安县| 中超| 昌图县| 沧州市| 得荣县| 孟州市| 巫山县| 怀安县| 汶川县| 汾阳市| 清新县| 西贡区| 蒙自县| 房产| 温州市| 获嘉县| 望谟县| 沾益县| 蕉岭县| 临颍县| 巨鹿县| 宜黄县| 嘉荫县| 阿城市| 繁昌县| 苗栗市| 大名县| 甘肃省| 盐山县| 博野县| 静宁县| 句容市| 湾仔区|