日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Meta第二代自研AI芯片出世,性能提升三倍以上

E4Life ? 來源:電子發(fā)燒友網 ? 作者:周凱揚 ? 2024-04-15 09:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網報道(文/周凱揚)不久前,Meta宣布將花費150億美元,購置60多萬塊GPU,而這還沒算上系統(tǒng)成本。就當大家以為Meta打算All In GPU之際,Meta放出了下一代MTIA AI芯片,MTIA v2。

基于5nm打造,性能三倍以上

相較上一代MTIA v1,新的MTIA v2的工藝從臺積電的7nm換成了臺積電5nm,芯片主頻也從800MHz提升至1.35GHz。得益于芯片工藝的改進,即便晶體管數(shù)量大幅增加,其芯片面積僅增加了12%。

圖片

MTIA v2芯片 / Meta
MTIA v2的性能提升主要體現(xiàn)在算力上,根據(jù)Meta給出的數(shù)據(jù)其GEMM算力達到354TFLOPS/s(INT8),SIMD算力達到11.06TFLOPS/s(INT8),相較上一代均提升了3倍以上。在接口上,MTIA v2也從8xPCIe 4.0升級至8x PCIe 5.0,帶寬翻倍。
算力的提升除了歸功于工藝的升級外,很可能也不乏內核的升級。結合晶心科技和Meta合作開發(fā)數(shù)據(jù)中心AI處理器的新聞來看,MTIA v1很有可能采用了晶心科技打造的首個商用RISC-V矢量處理器內核NX27V,而MTIA v2則很可能用到了最新的AX45MPV內核,其三倍以上的性能提升幅度也符合MTIA的算力提升幅度,不過這也只是猜想而已。值得一提的是,與同樣在近期發(fā)布的英特爾Gaudi 3不一樣,MTIA v2在內存配置上依舊沒有選擇HBM,片上內存只有256MB,片外內存選擇了LPDDR5。雖然其片上內存擁有2.7TB/s的帶寬,但也注定了MTIA v2很難用于高效率的大模型應用。在硬件堆料下,MTIA v2的功耗也已經來到了90W,相比MTIA v1的25有著比較大幅度的增加。不過對比H100的能耗比,MTIA v2依然有著比較大的優(yōu)勢。但這也就意味著上一代的服務器方案可能已經不再適用于新的方案,Meta因此為新加速器打造了全新的機柜系統(tǒng)。該系統(tǒng)單個機架由三個底盤構成,每個底盤塞進了12塊板卡,每個板卡集成了2個加速器,也就意味著單個機架共有72個MTIA v2加速器,單機柜至少需要6000W的電源供應。如果想要實現(xiàn)多機架拓展的話,也可以選擇加入RDMA NIC。Meta表示實現(xiàn)這樣的成績,除了依靠硬件本身的性能提升之外,也離不開他們在優(yōu)化內核、編譯器、運行時上的努力。隨著后續(xù)開發(fā)生態(tài)進一步成熟,對模型針對性優(yōu)化的時間會進一步減少,而且未來還有不少空間可以繼續(xù)優(yōu)化芯片的效率。

軟件棧引入新的編譯器

隨著新硬件的發(fā)布,Meta也加大了他們在軟件棧上的開發(fā)力度。作為PyTorch的開發(fā)者,MTIA的軟件棧從設計之初就做到了PyTorch 2.0的完全集成,也支持TorchDynamo和TorchInductor等新特性。但與此同時,為了簡化應用開發(fā)者的工作,為MTIA v1開發(fā)的代碼,也能向下兼容新的MTIA v2硬件。而且Meta表示,因為已經將全部的軟件棧集成在新的MTIA芯片內,在發(fā)布之際,他們已經在自己的服務器上用MTIA v2跑了一段時間了。正因為有這種兼容的軟件棧方案,Meta可在九個月內就能讓商用模型運行在16個地區(qū)的服務器上。為了為全新的MTIA硬件生成更高性能的代碼,Meta還打造了一套新的Triton-MTIA編譯器。Triton是由OpenAI開發(fā)的一套開源語言和編譯器,用于編寫高效的ML計算內核。Triton極大地提高了開發(fā)者編寫GPU代碼的速度,但Meta發(fā)現(xiàn)Triton也很適合用于MTIA這樣非GPU的硬件架構。

寫在最后

從MTIA v2的性能來看,該加速器應該不會替代其購置的大量GPU用在LLM模型上,而是追求算力、內存帶寬和內存容量的平衡,用于排名和推薦的大模型上。這樣一來大容量的SRAM還是用在GPU上,而Meta最大收入來源的廣告業(yè)務,可以靠MTIA之類的加速器減少成本。Meta除了投資定制AI芯片和下一代GPU這樣的計算芯片外,Meta也強調他們會繼續(xù)投資內存帶寬、網絡、容量相關的下一代硬件系統(tǒng)。不僅如此,Meta也在探索增加MTIA的應用范圍,包括未來可能支持GenAI的負載。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Meta
    +關注

    關注

    0

    文章

    325

    瀏覽量

    12506
  • AI芯片
    +關注

    關注

    17

    文章

    2166

    瀏覽量

    36869
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    RZ/G 系列第二代產品:性能強勁的多功能芯片解決方案

    RZ/G 系列第二代產品:性能強勁的多功能芯片解決方案 在當今科技飛速發(fā)展的時代,電子設備對于高性能、多功能芯片的需求愈發(fā)迫切。Renesa
    的頭像 發(fā)表于 04-01 11:35 ?454次閱讀

    第二代AMD VERSAL AI EDGE系列全面賦能汽車ADAS系統(tǒng)

    選擇 AMD 自適應 SoC 和 FPGA 第二代 AMD Versal AI Edge 系列自適應 SoC 帶來一種高性能芯片解決方案,為自動駕駛賦能助力。該系列器件配備用于 IS
    的頭像 發(fā)表于 03-27 16:30 ?976次閱讀
    <b class='flag-5'>第二代</b>AMD VERSAL <b class='flag-5'>AI</b> EDGE系列全面賦能汽車ADAS系統(tǒng)

    比亞迪BMS AFE芯片護航第二代刀片電池

    近日,比亞迪“閃充中國 改變世界”發(fā)布會刷屏全網,“5分鐘充至70%、9分鐘充至97%”的全球量產最快閃充速度,徹底終結充電焦慮,讓“充電像加油一樣快”從口號變成現(xiàn)實。而在1500kW閃充樁、第二代
    的頭像 發(fā)表于 03-18 15:20 ?760次閱讀
    比亞迪<b class='flag-5'>自</b><b class='flag-5'>研</b>BMS AFE<b class='flag-5'>芯片</b>護航<b class='flag-5'>第二代</b>刀片電池

    加快進程!Meta計劃2027年底前推出四AI芯片

    電子發(fā)燒友網報道(文/李彎彎)近日,Meta對外宣布,計劃在2027年底前推出四人工智能芯片,旨在滿足自身快速增長的
    的頭像 發(fā)表于 03-16 08:57 ?1.2w次閱讀

    比亞迪正式發(fā)布第二代刀片電池及閃充技術

    發(fā)布會現(xiàn)場,王傳福還宣布:所有搭載第二代刀片電池的閃充車車主,均享有重磅“閃充權益”,交車之日起,在全國閃充站可享受1年的免費閃充權益,讓閃充體驗更暢快。并且,在閃充免費期結束后,也會同行業(yè)保持一致,不會額外收費。
    的頭像 發(fā)表于 03-06 14:04 ?691次閱讀

    AMD VEK385評估套件助力快速啟動第二代Versal AI Edge系列設計

    AMD VEK385 評估套件為評估第二代 AMD Versal AI Edge 系列 XC2VE3858 器件提供了一條快速、功能豐富且可擴展的途徑。借助異構計算、高性能 I/O、全面的內存帶寬、即用型工作負載以及穩(wěn)健的啟動工
    的頭像 發(fā)表于 03-06 09:09 ?698次閱讀

    新品 | CoolSiC? MOSFET 650V第二代產品,新增75m?型號

    新品CoolSiCMOSFET650V第二代產品,新增75m?型號CoolSiCMOSFET650V第二代器件基于性能卓越的第一溝槽SiCMOSFET技術打造,通過
    的頭像 發(fā)表于 01-12 17:03 ?525次閱讀
    新品 | CoolSiC? MOSFET 650V<b class='flag-5'>第二代</b>產品,新增75m?型號

    類比半導體全新第二代高邊開關芯片HD80152和SPI高邊HD708204量產

    致力于提供高品質汽車驅動芯片和高品質信號鏈芯片供應商上海類比半導體技術有限公司(下稱“類比半導體”或“類比”)宣布全新第二代高邊開關芯片HD80152和SPI高邊HD708204量產。
    的頭像 發(fā)表于 01-05 17:57 ?1305次閱讀
    類比半導體全新<b class='flag-5'>第二代</b>高邊開關<b class='flag-5'>芯片</b>HD80152和SPI高邊HD708204量產

    新品 | CoolSiC? MOSFET 400V與440V第二代器件

    新品CoolSiCMOSFET400V與440V第二代器件CoolSiCMOSFET400V與440V第二代器件兼具高魯棒性、超低開關損耗與低通態(tài)電阻等優(yōu)勢,同時有助于優(yōu)化系統(tǒng)成本。該系列400V
    的頭像 發(fā)表于 12-31 09:05 ?811次閱讀
    新品 | CoolSiC? MOSFET 400V與440V<b class='flag-5'>第二代</b>器件

    TeledyneLeCroy發(fā)布第二代DisplayPort 2.1 PHY合規(guī)測試與調試解決方案

    TeledyneLeCoy(Teledyne子公司)宣布第二代QualiPHY 2自動化合規(guī)測試框架現(xiàn)已支持DisplayPort 2.1物理層(PHY)合規(guī)性測試。
    的頭像 發(fā)表于 12-26 11:04 ?1835次閱讀

    新品 | 采用.XT擴散焊和第二代1200V SiC MOSFET的Easy C系列

    新品采用.XT擴散焊和第二代1200VSiCMOSFET的EasyC系列EasyPACK2C1200V8mΩ電平模塊、EasyPACK2C1200V8mΩ四單元模塊以及
    的頭像 發(fā)表于 11-24 17:05 ?1704次閱讀
    新品 | 采用.XT擴散焊和<b class='flag-5'>第二代</b>1200V SiC MOSFET的Easy C系列

    類比半導體推出全新第二代高邊開關芯片HD80012

    致力于提供高品質汽車驅動芯片和高品質工業(yè)模擬芯片供應商上海類比半導體技術有限公司(下稱“類比半導體”或“類比”)宣布推出全新第二代高邊開關芯片HD80012,單通道低內阻1.2mΩ產品
    的頭像 發(fā)表于 07-02 15:19 ?1566次閱讀
    類比半導體推出全新<b class='flag-5'>第二代</b>高邊開關<b class='flag-5'>芯片</b>HD80012

    AMD第二代Versal AI Edge和Versal Prime系列加速量產 為嵌入式系統(tǒng)實現(xiàn)單芯片智能

    我們推出了 AMD 第二代 Versal AI Edge 系列和第二代 Versal Prime 系列,這兩款產品是對 Versal 產品組合的擴展,可為嵌入式系統(tǒng)實現(xiàn)單芯片智能。
    的頭像 發(fā)表于 06-11 09:59 ?2113次閱讀

    恩智浦推出第二代OrangeBox車規(guī)級開發(fā)平臺

    第二代OrangeBox開發(fā)平臺集成AI功能、后量子加密技術及內置軟件定義網絡的能力,應對快速演變的信息安全威脅。
    的頭像 發(fā)表于 05-27 14:25 ?1690次閱讀

    類比半導體推出全新第二代高邊開關芯片HD8004

    致力于提供高品質汽車驅動芯片和高品質工業(yè)模擬芯片供應商上海類比半導體技術有限公司(下稱“類比半導體”或“類比”)宣布推出全新第二代高邊開關芯片HD8004,單通道低內阻4.3mΩ產品。
    的頭像 發(fā)表于 05-21 18:04 ?1515次閱讀
    類比半導體推出全新<b class='flag-5'>第二代</b>高邊開關<b class='flag-5'>芯片</b>HD8004
    鄂托克前旗| 黎川县| 潢川县| 扬中市| 武功县| 马公市| 新郑市| 神木县| 海阳市| 青河县| 双鸭山市| 沅陵县| 广宗县| 红河县| 建宁县| 呈贡县| 福州市| 万源市| 桃江县| 读书| 湛江市| 鄂伦春自治旗| 九龙县| 玛曲县| 南汇区| 敦煌市| 平江县| 宜州市| 武山县| 漳平市| 兴化市| 林州市| 蓝山县| 兖州市| 肥乡县| 临沭县| 五指山市| 鹤岗市| 隆子县| 道真| 冀州市|