日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

大模型將會推動手機內(nèi)存和AI加速器革新?

jf_BPGiaoE5 ? 來源:半導體行業(yè)觀察 ? 2023-07-19 09:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能已經(jīng)成為半導體行業(yè)過去幾年最重要的新推動力。而去年以ChatGPT為代表的大模型更是進一步點燃了人工智能以及相關的芯片市場,ChatGPT背后的大模型正在成為下一代人工智能的代表并可望進一步推進新的應用誕生。

說起大模型,一般我們想到的往往是在云端服務器上運行模型。然而,事實上大模型已經(jīng)在走入終端設備。一方面,目前已經(jīng)有相當多的工作證明了大模型經(jīng)過適當處理事實上可以運行在終端設備上(而不局限于運行在云端服務器);另一方面,大模型運行在終端設備上也會給用戶帶來很大的價值。因此,我們認為在未來幾年內(nèi),大模型將會越來越多地運行在終端設備上,而這也會推動相關芯片技術和行業(yè)的進一步發(fā)展。

智能汽車是大模型運行在終端的第一個重要市場。從應用角度來看,大模型運行在智能汽車的首要推動力就是大模型確實能給智能駕駛相關的任務帶來客觀的性能提升。去年,以BEVformer為代表的端到端鳥瞰攝像頭大模型可以說是大模型在智能汽車領域的第一個里程碑,它把多個攝像頭的視頻流直接輸入使用transformer模塊的大模型做計算,最后的性能比之前使用傳統(tǒng)卷積神經(jīng)網(wǎng)絡(CNN)模型的結果好了接近10個點,這個可謂是革命性的變化。而在上個月召開的CVPR上,商湯科技發(fā)布的UniAD大模型更是使用單個視覺大模型在經(jīng)過統(tǒng)一訓練后去適配多個不同的下游任務,最后在多個任務中都大大超越了現(xiàn)有最好的模型:例如,多目標跟蹤準確率超越了20%,車道線預測準確率提升 30%,預測運動位移和規(guī)劃的誤差則分別降低了 38% 和 28%。

目前,汽車企業(yè)(尤其是造車新勢力)已經(jīng)在積極擁抱這些智能汽車的大模型,BEVformer(以及相關的模型)已經(jīng)被不少車企使用,我們預計下一代大模型也將會在未來幾年逐漸進入智能駕駛。如果從應用角度考慮,智能汽車上的大模型必須要在終端設備上運行,因為智能汽車對于模型運行的可靠性和延遲要求非常高,在云端運行大模型并且使用網(wǎng)絡把結果傳送到終端無法滿足智能汽車的需求。

wKgaomS3QkCAStKFAAOzw2nWy1w295.jpg

商湯科技提出的UniAD大模型架構,使用統(tǒng)一模型去適配多個任務

除了智能汽車之外,手機也是大模型進入終端的另一個重要市場。以ChatGPT為代表的語言類大模型事實上已經(jīng)成為了下一代用戶交互的重要組成部分,因此在手機上使用大語言模型將會能把這樣的新用戶交互體驗帶入手機操作系統(tǒng)中。而在手機設備終端直接運行大語言模型的主要好處在于能夠在保護用戶隱私的情況下給用戶帶來個性化的體驗(例如歸納和某個用戶的聊天記錄等等)。目前,開源社區(qū)已經(jīng)可以把Llama大語言模型能夠運行在安卓手機CPU,回答一個問題大約需要5-10秒的時間,我們認為未來的潛力巨大。

智能汽車芯片加速大模型:算力與功耗成為關鍵

目前,人工智能已經(jīng)在智能汽車的輔助駕駛應用中得到了廣泛應用,因此大多數(shù)智能汽車上使用的芯片也有對于人工智能的支持,例如加入人工智能加速器等。然而,這些人工智能加速器主要考慮的加速對象模型仍然是上一代以卷積神經(jīng)網(wǎng)絡為代表的模型,這些模型往往參數(shù)量比較小,對于算力的需求也比較低。

為了適配下一代大模型,智能汽車芯片會有相應的改動。下一代大模型對于智能汽車芯片的要求主要包括:

1 大算力:由于智能汽車上的相關感知和規(guī)劃任務都必須在實時完成,因此相關芯片必須能夠提供足夠的算力來支持這樣的計算
2 低功耗:智能汽車上的計算功耗仍然有限制,考慮到散熱等因素,芯片不可能做到像GPU一樣有幾百瓦的功耗
3 合理的成本:智能汽車上的芯片不能像GPU一樣成本高達數(shù)千美元。因此,智能汽車上的大模型加速芯片主要考慮的就是如何在功耗和成本的限制下,實現(xiàn)盡可能高的算力。

我們可以從目前最成功的大模型加速芯片(即GPU)出發(fā)去推測支持大模型智能汽車芯片的具體架構,考慮GPU上有哪些設計思路需要進一步發(fā)揚光大,另外有哪些應該考慮重新設計。

首先,GPU上有海量的矩陣計算單元,這些計算單元是GPU算力的核心支撐(與之相對的,CPU上缺乏這些海量的矩陣計算單元因此算力無論如何不可能高上去),這些計算單元在智能汽車芯片上同樣也是必須的;但是由于智能汽車芯片上的計算不用考慮GPU上對于數(shù)據(jù)流和算子通用性的支持,因此智能汽車芯片上無需做GPU上這樣的大量stream core,因此從控制邏輯的角度可以做簡化以減少芯片面積成本。

第二,GPU能成功運行大模型的另一個關鍵在于有超高速的內(nèi)存接口和海量的內(nèi)存,因為目前大模型的參數(shù)量動輒千億級,這些模型必須有相應的內(nèi)存支持。這一點在智能車芯片上同樣需要,只是智能汽車芯片未必能使用GPU上的HBM這樣的超高端(同時也是高成本)內(nèi)存,而是會考慮和架構協(xié)同設計來盡可能地利用LPDDR這樣的接口的帶寬。

第三,GPU有很好的規(guī)?;头植际接嬎隳芰?,當模型無法在一個GPU上裝下時,GPU可以方便地把模型分割成多個子模型在多個GPU上做計算。智能車芯片也可以考慮這樣的架構,從而確保汽車可以在使用周期內(nèi)滿足日新月異的模型的需求。

綜合上述考慮,我們推測針對大模型的智能車芯片架構中,可能會有多個人工智能加速器同時運行,每個加速器都有簡單的設計(例如一個簡單的控制核配合大量計算單元),搭配大內(nèi)存和高速內(nèi)存接口,并且加速器之間通過高速互聯(lián)互相通信從而可以以本地分布計算的方法來加速大模型。從這個角度,我們認為智能駕駛芯片中的內(nèi)存和內(nèi)存接口將會扮演決定性的角色,而另一方面,這樣的架構也非常適合使用chiplet的方式來實現(xiàn)每個加速器并且使用高級封裝技術(包括2.5D和3D封裝)來完成多個加速器的整合,換句話說大模型在智能汽車的應用將會進一步推動下一代內(nèi)存接口和高級封裝技術的普及和演進。

大模型將會推動手機內(nèi)存和AI加速器革新

如前所述,大模型進入手機將會把下一代用戶交互范式帶入手機。我們認為,大模型進入手機將會是一個漸進的過程:例如,目前的大語言模型,即使是小版本的Llama 70億參數(shù)的模型,也沒法完全裝入手機的內(nèi)存中,而必須部分放在手機的閃存中運行,這就導致了運行速度比較慢。在未來的幾年中,我們認為手機上面的大語言模型會首先從更小的版本(例如10億參數(shù)以下的模型)開始進入應用,然后再逐漸增大參數(shù)量。

從這個角度來看,手機上運行大模型仍然會加速推動手機芯片在相關領域的發(fā)展,尤其是內(nèi)存和AI加速器領域——畢竟目前主流運行在手機上的模型參數(shù)量都小于10M,大語言模型的參數(shù)量大了兩個數(shù)量級,而且未來模型參數(shù)量會快速增大。這一方面將會推動手機內(nèi)存以及接口技術以更快的速度進化——為了滿足大模型的需求,未來我們可望會看到手機內(nèi)存芯片容量增長更快,而且手機內(nèi)存接口帶寬也會加快發(fā)展速度,因為目前來看內(nèi)存實際上是大模型的瓶頸。

除了內(nèi)存之外,手機芯片上的人工智能加速器也會為了大模型而做出相關的改變。目前手機芯片上的人工智能加速器(例如各種NPU IP)幾乎已經(jīng)是標配,但是這些加速器的設計基本上是針對上一代卷積神經(jīng)網(wǎng)絡設計,因此在設計上并不完全針對大模型。為了適配大模型,人工智能加速器首先必須能有更大的內(nèi)存訪問帶寬并減少內(nèi)存訪問延遲,這一方面需要人工智能加速器的接口上做出一些改變(例如分配更多的pin給內(nèi)存接口),另一方面需要片上數(shù)據(jù)互聯(lián)做出相應的改變來滿足人工智能加速器訪存的需求。

除此之外,在加速器內(nèi)部邏輯設計上,我們認為可能會更加激進地推進低精度量化計算(例如4bit甚至2bit)和稀疏計算,目前的學術界研究表明大語言模型有較大的機會可以做這樣的低精度量化/稀疏化,而如果能量化到例如4bit的話,就會大大減小相關計算單元需要的芯片面積,同時也能減小模型在內(nèi)存中需要的空間(例如4bit量化精度相對于之前的標準8bit精度就會內(nèi)存需求減半),這預計也會是未來針對手機端人工智能加速器的設計方向。

根據(jù)上述分析,我們預計從市場角度手機內(nèi)存芯片將會借著手機大模型的東風變得更重要,預計會在未來看到相比之前更快的發(fā)展,包括大容量內(nèi)存以及高速內(nèi)存接口。另一方面,手機端人工智能加速器IP也會迎來新的需求和發(fā)展,我們預計相關市場會變得更加熱鬧一些。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 半導體
    +關注

    關注

    339

    文章

    31316

    瀏覽量

    266964
  • 人工智能
    +關注

    關注

    1821

    文章

    50396

    瀏覽量

    267212
  • 智能汽車
    +關注

    關注

    30

    文章

    3345

    瀏覽量

    109703
  • 卷積神經(jīng)網(wǎng)絡

    關注

    4

    文章

    375

    瀏覽量

    12938
  • ChatGPT
    +關注

    關注

    31

    文章

    1604

    瀏覽量

    10404

原文標題:大模型走向終端,芯片怎么辦?

文章出處:【微信號:光刻人的世界,微信公眾號:光刻人的世界】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何使用 powerquad 加速器中的一些功能以及 CMSIS 原始實現(xiàn)中的一些功能?

    )。 如何使用 powerquad 加速器中的一些功能以及 CMSIS 原始實現(xiàn)中的一些功能。 Example: I do not want to call arm_mat_trans_q15 powerquad
    發(fā)表于 04-03 06:37

    技嘉與趨境科技聯(lián)合部署AMaaS平臺 推動本地大模型應用加速落地

    在生成式AI加速走向實際應用的當下,大模型部署正從“可體驗”邁向“可落地、可管理、可應用”。作為技嘉面向本地AI場景打造的重要產(chǎn)品,AI T
    的頭像 發(fā)表于 03-12 15:11 ?219次閱讀
    技嘉與趨境科技聯(lián)合部署AMaaS平臺 <b class='flag-5'>推動</b>本地大<b class='flag-5'>模型</b>應用<b class='flag-5'>加速</b>落地

    后摩智能M50芯片亮相聯(lián)想集團首屆創(chuàng)新加速器開放日

    2月5日,聯(lián)想集團在京舉辦首屆創(chuàng)新加速器開放日暨“新商業(yè)創(chuàng)新生態(tài)路演”,本次活動聚焦于AI算力、核心部件及軟硬件應用等領域的技術及產(chǎn)品。作為聯(lián)想創(chuàng)投旗下企業(yè),后摩智能集中展示了如何通過端邊大模型
    的頭像 發(fā)表于 02-09 15:59 ?693次閱讀

    使用NORDIC AI的好處

    ; 自定義 Neuton 模型博客] Axon NPU :集成在 nRF54LM20B 等高端 SoC 中的專用 AI 加速器,對 TensorFlow Lite 模型可實現(xiàn)最高約 1
    發(fā)表于 01-31 23:16

    邊緣計算中的AI加速器類型與應用

    人工智能正在推動對更快速、更智能、更高效計算的需求。然而,隨著每秒產(chǎn)生海量數(shù)據(jù),將所有數(shù)據(jù)發(fā)送至云端處理已變得不切實際。這正是邊緣計算中AI加速器變得不可或缺的原因。這種專用硬件能夠直接在邊緣設備上
    的頭像 發(fā)表于 11-06 13:42 ?1054次閱讀
    邊緣計算中的<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>類型與應用

    亞馬遜云科技第三期創(chuàng)業(yè)加速器圓滿收官 助力初創(chuàng)釋放Agentic AI潛力 加速全球化進程

    北京——2025年10月28日 ,亞馬遜云科技第三期創(chuàng)業(yè)加速器項目圓滿收官。35家入營企業(yè)齊聚一堂,分享了各自的業(yè)務發(fā)展情況,以及參與本期加速器的收獲及體驗。第三期創(chuàng)業(yè)加速器持續(xù)聚焦AI
    的頭像 發(fā)表于 10-29 15:18 ?1093次閱讀

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    航裕電源以大電流技術為國內(nèi)外超導加速器項目提供優(yōu)質(zhì)方案

    航裕電源:以大電流技術,護航尖端科技 大科學裝置建設熱潮中,超導加速器作為探索微觀世界、推動前沿科研的 “國之重”,對供電系統(tǒng)的穩(wěn)定性、精度及功率提出極致要求。航裕電源以31.5kA、80kA萬安
    的頭像 發(fā)表于 10-12 15:02 ?1793次閱讀

    vivo攜手Google Cloud推動智能手機邁入AI新時代

    在人們期待更智能、更前瞻手機的時代,vivo 攜手 Google Cloud,迅速推出更安全、更前沿的 AI 功能,共同加速創(chuàng)新,推動智能手機
    的頭像 發(fā)表于 09-23 16:54 ?1768次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學習AI芯片的創(chuàng)新方法與架構

    兩方面的問題:①Transformer 模型需要向NVM器件寫入大量數(shù)據(jù)。②傳統(tǒng)內(nèi)存加速器的時序單指令多數(shù)據(jù)流通通道實現(xiàn)這些操作的成本很高。 因此設計一種既能有效存儲模型參數(shù),又能讓動
    發(fā)表于 09-12 17:30

    英特爾Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持

    英特爾? Gaudi 2EAI加速器現(xiàn)已為DeepSeek-V3.1提供深度優(yōu)化支持。憑借出色的性能和成本效益,英特爾Gaudi 2E以更低的投入、更高的效率,實現(xiàn)從模型訓練的深度突破到推理部署的實時響應,為大模型
    的頭像 發(fā)表于 08-26 19:18 ?3379次閱讀
    英特爾Gaudi 2E <b class='flag-5'>AI</b><b class='flag-5'>加速器</b>為DeepSeek-V3.1提供<b class='flag-5'>加速</b>支持

    創(chuàng)客總部加入MathWorks加速器計劃

    全球領先的數(shù)學計算軟件開發(fā)商 MathWorks 日前宣布,創(chuàng)客總部已加入 MathWorks 加速器計劃。作為中關村科創(chuàng)孵化,創(chuàng)客總部致力于為人工智能創(chuàng)業(yè)企業(yè)、高校院所技術精英搭建推動與實體經(jīng)濟
    的頭像 發(fā)表于 08-22 10:00 ?1399次閱讀

    Andes晶心科技推出新一代深度學習加速器

    高效能、低功耗 32/64 位 RISC-V 處理核與 AI 加速解決方案的領導供貨商—Andes晶心科技(Andes Technology)今日正式發(fā)表最新深度學習加速器 Ande
    的頭像 發(fā)表于 08-20 17:43 ?3162次閱讀

    粒子加速器?——?科技前沿的核心裝置

    粒子加速器全稱“荷電粒子加速器”,是一種利用電磁場在高真空環(huán)境中對帶電粒子(如電子、質(zhì)子、離子)進行加速和控制,使其獲得高能量的特種裝置。粒子加速器技術現(xiàn)已發(fā)展成為集高能物理、核物理、
    的頭像 發(fā)表于 06-19 12:05 ?4238次閱讀
    粒子<b class='flag-5'>加速器</b>?——?科技前沿的核心裝置

    基于雙向塊浮點量化的大語言模型高效加速器設計

    本文提出雙向塊浮點(BBFP)量化格式及基于其的LLMs加速器BBAL,通過雙向移位與重疊位設計顯著降低量化誤差,提升非線性計算效率,實現(xiàn)精度、吞吐量和能效的顯著優(yōu)化,相關成果被國際頂級會議 DAC 2025 接收。
    的頭像 發(fā)表于 05-14 13:40 ?2541次閱讀
    基于雙向塊浮點量化的大語言<b class='flag-5'>模型</b>高效<b class='flag-5'>加速器</b>設計
    陵水| 股票| 长白| 阜新市| 乐安县| 思茅市| 当阳市| 巴林左旗| 定兴县| 东莞市| 定襄县| 蒙自县| 比如县| 神农架林区| 阿尔山市| 郧西县| 图们市| 望谟县| 隆子县| 亚东县| 冀州市| 开封市| 杭州市| 南澳县| 阿荣旗| 特克斯县| 泾源县| 鹤峰县| 贵港市| 陵水| 长子县| 九寨沟县| 丰城市| 武清区| 璧山县| 大名县| 泸溪县| 稻城县| 广东省| 九台市| 延安市|