日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ASIC和GPU,誰才是AI計(jì)算的最優(yōu)解?

時(shí)光流逝最終成了回憶 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2023-12-03 08:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))隨著AI計(jì)算開始有著風(fēng)頭蓋過通用計(jì)算開始,不少芯片廠商都將其視為下一輪技術(shù)革新。CPUGPU、FPGAASIC紛紛投入到這輪AI革命中來,但斬獲的戰(zhàn)果卻是有多有少。由于承載了絕大多數(shù)AI計(jì)算負(fù)載,GPU和ASIC成了市面上最炙手可熱的計(jì)算硬件。表面上來看,這是市場(chǎng)提供了兩種不同的靈活選擇,但面對(duì)利潤如此高的AI市場(chǎng),兩者總得爭(zhēng)一個(gè)高下。

根據(jù)GMInsight的統(tǒng)計(jì),2022年全球AI芯片市場(chǎng)規(guī)模超過150億美元,預(yù)計(jì)將在2032年超過4000億美元,年復(fù)合增長率高達(dá)35%。而在去年出貨量最大的依然是GPU,占比高達(dá)47%左右,第二名為占比34%的CPU,其次才是ASIC與FPGA,但ASIC已經(jīng)隱隱有迎頭趕超之勢(shì)。

選擇通用性還是專用性

從2016年左右,就一直流傳著這樣一個(gè)說法,那就是AI計(jì)算作為特定負(fù)載的高性能計(jì)算,其未來肯定是屬于ASIC這樣的“專用芯片”。這個(gè)說法似乎也沒錯(cuò),畢竟我們轉(zhuǎn)而看下目前排名前三的云巨頭們,亞馬遜、微軟和谷歌紛紛都選擇了自研ASIC,比如亞馬遜的Trainium和Inferentia、谷歌的TPU、英特爾的Gaudi以及微軟的Maia等。

Gaudi 2 /英特爾


要從通用性和專用性的角度來看,ASIC確實(shí)是最“?!钡哪莻€(gè)。即便是在GPU之外,CPU、FPGA的通用性也要遠(yuǎn)高于ASIC,但CPU并不適用于純AI負(fù)載,更多的是給AI計(jì)算起到輔助作用,其提供的算力占比并不算高,哪怕是英偉達(dá)的Grace這種宣稱為AI打造的CPU。而FPGA的應(yīng)用市場(chǎng)則比較固定,比如汽車、工業(yè)和金融科技等,難以在大規(guī)模的服務(wù)器端進(jìn)行部署。

由此看來,ASIC確實(shí)是上佳的硬件之選。尤其是目前LLM占據(jù)AI應(yīng)用的主流,算法逐漸固定,反倒是專用的ASIC在性能、能效上占了上風(fēng),不再需要像過去一樣,一代算法一代芯片地不斷迭代。且隨著云服務(wù)廠商開始擴(kuò)大AI服務(wù)器規(guī)模,ASIC顯然具備更強(qiáng)的擴(kuò)展性,大量出貨后也能控制好制造成本。

第一代TPU /谷歌


而且從谷歌的TPU設(shè)計(jì)來看,借助先進(jìn)的接口IP、Chiplet和EDA工具,在已有架構(gòu)上進(jìn)行迭代設(shè)計(jì)也開始變得簡單,更不用說谷歌在TensorFlow上有著深厚的積累。云服務(wù)廠商幾乎評(píng)估了市面上所有具備商用可行性的AI芯片,如果他們沒有這個(gè)底氣是斷然不會(huì)選擇大規(guī)模部署的,而他們對(duì)ASIC的看好恰好說明了這一點(diǎn)。英特爾這幾年開始分離各種業(yè)務(wù),而Habana Labs的ASIC AI芯片業(yè)務(wù)雖然沒有創(chuàng)造可觀的營收,英特爾卻依然看好這一業(yè)務(wù),也證明了ASIC的前景無限。

市場(chǎng)和開發(fā)者依然偏愛GPU

但從市場(chǎng)和開發(fā)者角度來看,GPU依舊是最吃香的,且牢牢占據(jù)主導(dǎo)地位,這又是為什么呢?前英特爾圖形部門負(fù)責(zé)人Raja Koduri也發(fā)表了一些自己的見解。首先,專用芯片的“專用”并不算穩(wěn)定,與絕大多數(shù)人認(rèn)知中不一樣的是,AI計(jì)算并非一成不變,也并不是簡單的一堆矩陣乘法運(yùn)算。

而反觀GPU這邊,其系統(tǒng)架構(gòu)已經(jīng)經(jīng)過了20多年的演進(jìn),比如頁表、內(nèi)存管理、中斷處理和調(diào)試等,這些已經(jīng)成了支持商用軟件棧落地的必要因素。而ASIC在這方面確實(shí)有所欠缺,反而將不少重?fù)?dān)甩給了軟件開發(fā)者。而Raja認(rèn)為,如今并沒有太多年輕的軟件開發(fā)者進(jìn)入行業(yè),所以絕大多數(shù)公司都還在爭(zhēng)搶為數(shù)不多的老將。

需要注意的是,Raja此處指的軟件開發(fā)者并非那些模型/算法開發(fā)者,在這類軟件開發(fā)者上依然新秀層出不窮,但反觀系統(tǒng)軟件工程師,比如底層驅(qū)動(dòng)開發(fā)者,就確實(shí)相對(duì)較少了。英偉達(dá)雖說也常有人員變動(dòng),但其在這類軟件的開發(fā)上,至少比初創(chuàng)企業(yè)領(lǐng)先10多年。

再拿常見的AI基準(zhǔn)測(cè)試MLPerf為例,這個(gè)對(duì)訓(xùn)練和推理性能提供公平評(píng)估的榜單,幾乎所有的MLPerf應(yīng)用都是原生基于CUDA開發(fā)。且原本GPU在AI計(jì)算效能上的劣勢(shì),也隨著英偉達(dá)這幾代不斷添加TensorCore而得到了改善。ASIC的AI加速器雖然理論性能占優(yōu),但始終沒法拉開較大差距。

對(duì)AI硬件的未來憧憬


即便目前AI硬件生態(tài)向好,但要想各類硬件都能活下去創(chuàng)造良性的競(jìng)爭(zhēng),我們也可以做一些“愿望清單”。首先,雖然各大AI芯片廠商都在宣揚(yáng)自己在大模型下的優(yōu)異表現(xiàn),然而對(duì)于那些沒法全塞進(jìn)內(nèi)存里的大模型的訓(xùn)練和推理來說,英偉達(dá)的GPU依然是唯一的可行方案,其他廠商明年還是應(yīng)該繼續(xù)努力。

第二則是軟件生態(tài)的兼容性,對(duì)于GPU廠商、云服務(wù)廠商之外的第三方AI芯片廠商,還是應(yīng)該加強(qiáng)對(duì)各類模型的兼容性,特別是要做到開箱即用。比如英特爾的Gaudi現(xiàn)在已經(jīng)投入云服務(wù)商的服務(wù)器中正式使用了,且從性能角度來看著實(shí)不賴,但對(duì)于PyTorch的支持并不像英偉達(dá)的CUDA和AMD的ROCm般順暢。連英特爾都受制于此,可想而知其他的ASIC AI芯片廠商要付出多大的成本和精力了。

另一個(gè)做法就是AI芯片廠商自己下場(chǎng)做大模型,如果廠商有這個(gè)軟件開發(fā)實(shí)力的話,自己根據(jù)自研芯片開發(fā)大模型是最好的,無論模型的架構(gòu)和芯片的架構(gòu)怎么演進(jìn),都在自己的把控范圍內(nèi)。畢竟像浪潮這樣的服務(wù)器廠商,都已經(jīng)下場(chǎng)開發(fā)大模型了,更為上游的谷歌也已經(jīng)投身其中。但這種方式也存在一個(gè)問題,那就是其模型和硬件往往都會(huì)選擇閉源,這也就意味著放棄了龐大的開源開發(fā)生態(tài),很難帶動(dòng)相關(guān)AI應(yīng)用的真正騰飛。

第三是性能優(yōu)化,在AI芯片廠商與軟件開發(fā)社區(qū)的不懈努力下,我們看到不同硬件之間的軟件兼容性已經(jīng)有了可觀的改善,但性能問題仍然擺在臺(tái)前,即便是英特爾、AMD和蘋果這樣的大廠也沒法徹底突破。所以在解決完兼容性的問題后,AI芯片廠商還是要持續(xù)投入硬件利用率的優(yōu)化中去。當(dāng)然了,如果GPU之外的ASIC真的能做到GPU三倍以上的性能,以力大磚飛之勢(shì)力壓GPU也不是不可能。

寫在最后

我們現(xiàn)在處于AI硬件的“寒武紀(jì)爆發(fā)期”,從EDA廠商和晶圓廠的業(yè)績就可以看出,AI芯片無論是新的設(shè)計(jì)還是制造都沒有止步,市面上公開提供的選擇就足以令人眼花繚亂了,還有不少初創(chuàng)企業(yè)處于“隱身階段”,或是在等待先進(jìn)封裝的產(chǎn)能。不管如何,2024年都應(yīng)該會(huì)有更多的產(chǎn)品面市。

AI應(yīng)用開發(fā)者固然沒法一個(gè)個(gè)買來測(cè)試,好在云服務(wù)廠商提供了AI服務(wù)器的租賃選項(xiàng),在上面跑一遍自己的AI任務(wù)就能對(duì)其性能和開發(fā)難易度有個(gè)大致了解,畢竟AI應(yīng)用的落地不在于跑矩陣乘法計(jì)算有多快,而在于開發(fā)者愿不愿意選擇這個(gè)開發(fā)平臺(tái)的硬件與軟件。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • asic
    +關(guān)注

    關(guān)注

    34

    文章

    1278

    瀏覽量

    124974
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5283

    瀏覽量

    136095
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    GPU不是AI的唯一:英偉達(dá)用Groq LPU證明,推理賽道需要“另一條腿”

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)過去十年,人工智能的爆發(fā)式增長與GPU需求緊密相連。憑借其卓越的并行計(jì)算能力,GPU成為AI算力的絕對(duì)代名詞。 ? 然而,英偉達(dá)給出顛覆性的新解。在最
    的頭像 發(fā)表于 03-24 11:27 ?6085次閱讀
    <b class='flag-5'>GPU</b>不是<b class='flag-5'>AI</b>的唯一<b class='flag-5'>解</b>:英偉達(dá)用Groq LPU證明,推理賽道需要“另一條腿”

    AI 驅(qū)動(dòng)的電力電子拓?fù)浼癝iC器件選型自動(dòng)優(yōu)化:跳出人類經(jīng)驗(yàn)的“最優(yōu)

    AI 驅(qū)動(dòng)的電力電子拓?fù)浼癝iC器件選型自動(dòng)優(yōu)化:跳出人類經(jīng)驗(yàn)的“最優(yōu)” 緒論:人工智能重塑電力電子設(shè)計(jì)范式 隨著生成式人工智能(Generative AI)、大型語言模型(LLMs
    的頭像 發(fā)表于 03-10 20:13 ?281次閱讀

    AI ASIC:博通份額將達(dá)60%,聯(lián)發(fā)科成長顯著,臺(tái)積電成最大贏家

    Counterpoint指出,AI芯片熱潮進(jìn)入第二階段,ASICGPU競(jìng)爭(zhēng)激烈,博通和臺(tái)積電有望成最大贏家。 ? Counterpoint預(yù)測(cè),AI
    的頭像 發(fā)表于 02-05 18:21 ?1.8w次閱讀
    <b class='flag-5'>AI</b> <b class='flag-5'>ASIC</b>:博通份額將達(dá)60%,聯(lián)發(fā)科成長顯著,臺(tái)積電成最大贏家

    為啥 AI 計(jì)算速度這么驚人?—— 聊聊 GPU、內(nèi)存與并行計(jì)算

    提到AI,大家常說它“算得快”,其實(shí)是指AI能在眨眼間處理海量數(shù)據(jù)??伤鼮樯队羞@本事?答案就藏在“GPU+高速內(nèi)存+并行計(jì)算”這trio(組合)里。咱們可以把
    的頭像 發(fā)表于 12-05 14:35 ?1155次閱讀
    為啥 <b class='flag-5'>AI</b> <b class='flag-5'>計(jì)算</b>速度這么驚人?—— 聊聊 <b class='flag-5'>GPU</b>、內(nèi)存與并行<b class='flag-5'>計(jì)算</b>

    從炫技到務(wù)實(shí),超節(jié)點(diǎn)的祛魅時(shí)刻

    規(guī)模與業(yè)務(wù)相適配,才是超節(jié)點(diǎn)的最優(yōu)
    的頭像 發(fā)表于 12-03 16:55 ?1.1w次閱讀
    從炫技到務(wù)實(shí),超節(jié)點(diǎn)的祛魅時(shí)刻

    PLC vs 嵌入式:才是工業(yè)場(chǎng)景的“最優(yōu)”?

    PLC和嵌入式作為工業(yè)控制領(lǐng)域的常用方案,應(yīng)該如何選擇?才是工業(yè)場(chǎng)景的“最優(yōu)”?前言清晨7點(diǎn)的智能車間里,流水線的機(jī)械臂正以0.1毫米的精度抓取發(fā)動(dòng)機(jī)零部件,傳感器實(shí)時(shí)反饋的溫度、
    的頭像 發(fā)表于 11-18 11:46 ?979次閱讀
    PLC vs 嵌入式:<b class='flag-5'>誰</b><b class='flag-5'>才是</b>工業(yè)場(chǎng)景的“<b class='flag-5'>最優(yōu)</b><b class='flag-5'>解</b>”?

    VLA和世界模型,才是自動(dòng)駕駛的最優(yōu)?

    Model)路線,這兩種路徑都為自動(dòng)駕駛快速落地提供了可能,那才是最優(yōu)? 什么是VLA模型? VLA模型,即視覺—語言—行動(dòng)模型,是將視覺感知、語言理解和動(dòng)作生成串聯(lián)起來的一套方
    的頭像 發(fā)表于 11-05 08:55 ?954次閱讀
    VLA和世界模型,<b class='flag-5'>誰</b><b class='flag-5'>才是</b>自動(dòng)駕駛的<b class='flag-5'>最優(yōu)</b><b class='flag-5'>解</b>?

    AI芯片市場(chǎng)鏖戰(zhàn),GPUASIC誰將占據(jù)主動(dòng)?

    本文轉(zhuǎn)自:TechSugar隨著人工智能技術(shù)在大模型訓(xùn)練、邊緣計(jì)算、自動(dòng)駕駛等領(lǐng)域的深度滲透,核心算力硬件的競(jìng)爭(zhēng)進(jìn)入白熱化階段。圖形處理單元(GPU)與專用集成電路(ASIC)作為兩大主流技術(shù)路線
    的頭像 發(fā)表于 10-30 12:06 ?962次閱讀
    <b class='flag-5'>AI</b>芯片市場(chǎng)鏖戰(zhàn),<b class='flag-5'>GPU</b>與<b class='flag-5'>ASIC</b>誰將占據(jù)主動(dòng)?

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    的工作嗎? 從書中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。 其他的還是知道的,F(xiàn)PGA屬于AI芯片這個(gè)
    發(fā)表于 09-12 16:07

    AI 芯片浪潮下,職場(chǎng)晉升新契機(jī)?

    職場(chǎng)、渴望在專業(yè)領(lǐng)域更進(jìn)一步的人來說,AI 芯片與職稱評(píng)審之間,實(shí)則有著千絲萬縷的聯(lián)系,為職業(yè)晉升開辟了新的路徑。 AI 芯片領(lǐng)域細(xì)分與職稱對(duì)應(yīng) 目前,AI 芯片從技術(shù)架構(gòu)上主要分為 GPU
    發(fā)表于 08-19 08:58

    國產(chǎn)替代最優(yōu) 易沖半導(dǎo)體推出12/16通道ADB大燈LED矩陣控制器

    國產(chǎn)替代最優(yōu) 易沖半導(dǎo)體推出12/16通道ADB大燈LED矩陣控制器
    的頭像 發(fā)表于 08-08 16:21 ?2.7w次閱讀
    國產(chǎn)替代<b class='flag-5'>最優(yōu)</b><b class='flag-5'>解</b> 易沖半導(dǎo)體推出12/16通道ADB大燈LED矩陣控制器

    AI芯片,需要ASIC

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎) 2025年,全球AI芯片市場(chǎng)正迎來一場(chǎng)結(jié)構(gòu)性變革。在英偉達(dá)GPU占據(jù)主導(dǎo)地位的大格局下,ASIC(專用集成電路)憑借針對(duì)AI任務(wù)的定制化設(shè)計(jì),成為推動(dòng)算
    的頭像 發(fā)表于 07-26 07:30 ?7548次閱讀

    智算加速卡是什么東西?它真能在AI戰(zhàn)場(chǎng)上干掉GPU和TPU!

    隨著AI技術(shù)火得一塌糊涂,大家都在談"大模型"、"AI加速"、"智能計(jì)算",可真到了落地環(huán)節(jié),算力才是硬通貨。你有沒有發(fā)現(xiàn),現(xiàn)在越來越多的AI
    的頭像 發(fā)表于 06-05 13:39 ?1930次閱讀
    智算加速卡是什么東西?它真能在<b class='flag-5'>AI</b>戰(zhàn)場(chǎng)上干掉<b class='flag-5'>GPU</b>和TPU!

    Imagination與澎峰科技攜手推動(dòng)GPU+AI解決方案,共拓計(jì)算生態(tài)

    近日, Imagination Technologies 與國內(nèi)領(lǐng)先的異構(gòu)計(jì)算軟件與智算混合云服務(wù)提供商 澎峰科技 ( PerfXLab )正式簽署合作備忘錄( MoU ),圍繞 GPUAI
    發(fā)表于 05-21 09:40 ?1299次閱讀

    Imagination與澎峰科技攜手推動(dòng)GPU+AI解決方案,共拓計(jì)算生態(tài)

    近日,ImaginationTechnologies與國內(nèi)領(lǐng)先的異構(gòu)計(jì)算軟件與智算混合云服務(wù)提供商澎峰科技(PerfXLab)正式簽署合作備忘錄(MoU),圍繞GPUAI的深度融合展開合作。雙方將
    的頭像 發(fā)表于 05-20 08:33 ?1043次閱讀
    Imagination與澎峰科技攜手推動(dòng)<b class='flag-5'>GPU+AI</b>解決方案,共拓<b class='flag-5'>計(jì)算</b>生態(tài)
    肥城市| 岑溪市| 新建县| 会理县| 突泉县| 凉城县| 佛山市| 安多县| 轮台县| 白水县| 怀仁县| 杭锦后旗| 濮阳市| 且末县| 泾源县| 双鸭山市| 崇明县| 绍兴县| 郧西县| 阳谷县| 新沂市| 嘉善县| 图木舒克市| 武夷山市| 甘肃省| 阳朔县| 和龙市| 威宁| 郧西县| 碌曲县| 泽州县| 三原县| 辽源市| 右玉县| 阿拉善右旗| 库车县| 庆云县| 赣榆县| 攀枝花市| 黄浦区| 陆丰市|