日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達重磅出手!AI 推理存儲全面覺醒

晶芯觀察 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:黃晶晶 ? 2025-12-26 08:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/黃晶晶)近日,有消息稱,英偉達將以大約200億美元收購人工智能芯片初創(chuàng)公司Groq,這將是英偉達迄今為止規(guī)模最大的一筆收購。但英偉達回應表示,并未計劃收購Groq,僅達成技術許可合作,將采用Groq的推理技術。

隨后,Groq公司宣布已與英偉達就其推理技術達成非獨家許可協(xié)議。根據(jù)協(xié)議條款,Groq創(chuàng)始人喬納森·羅斯(Jonathan Ross)、總裁桑尼·馬達拉(Sunny Madra)及其他核心團隊成員將加入英偉達,共同推進授權技術的升級與規(guī)?;瘧谩4送?,Groq將繼續(xù)作為獨立公司運營,西蒙·愛德華茲(Simon Edwards)將接任首席執(zhí)行官職務;Groq云服務將保持正常運行,不受此次合作影響。

Groq成立于2016年,總部位于美國加利福尼亞州山景城,是一家AI推理芯片廠商。該公司核心團隊源自谷歌最初的張量處理單元(TPU)工程團隊,創(chuàng)始人兼前CEO喬納森·羅斯(Jonathan Ross)是谷歌TPU項目的核心研發(fā)人員。

2024年8月,Groq在最新一輪融資中籌集6.4億美元,由貝萊德集團(BlackRock Inc.)基金領投,并獲得思科和三星投資部門的支持。2024年12月,Groq在沙特阿拉伯達曼建成中東地區(qū)最大的推理集群,該集群包含19000個Groq LPU,僅用8天便完成上線。

2025年2月,Groq從沙特阿拉伯成功籌集15億美元融資,用于擴建其在當?shù)氐腁I基礎設施;9月,完成7.5億美元融資,投后估值達69億美元,累計融資額超30億美元。

Groq LPU近存計算芯片

AI推理的廣泛應用是AI普惠大眾的關鍵,業(yè)內(nèi)巨頭與初創(chuàng)公司均洞察到其發(fā)展前景并提前布局,Groq便是其中的佼佼者。其AI推理芯片采用SRAM替代DRAM,從而實現(xiàn)更快的訪問速度、更低的刷新延遲等優(yōu)勢。

Groq公司研發(fā)的語言處理單元(Language Processing Unit,簡稱LPU),憑借獨特架構展現(xiàn)出極高的推理性能,是一款典型的近存計算芯片。

該芯片采用14nm制程,搭載230MB SRAM以保障內(nèi)存帶寬,片上內(nèi)存帶寬達80TB/s。SRAM的訪問速度遠快于DRAM,使其在計算密集型應用中表現(xiàn)突出;而大容量SRAM的配置,有助于提升機器學習、人工智能等計算密集型工作負載的處理效率。

靜態(tài)隨機存取存儲器(Static Random-Access Memory,簡稱SRAM)是隨機存取存儲器的一種,只要保持通電,存儲的數(shù)據(jù)就能持續(xù)保留;相比之下,動態(tài)隨機存取存儲器(DRAM)存儲的數(shù)據(jù)需周期性刷新。但需注意,SRAM仍屬于易失性存儲器,斷電后數(shù)據(jù)會丟失,這與斷電后仍能保存數(shù)據(jù)的ROM(只讀存儲器)或閃存存在本質(zhì)區(qū)別。

SRAM雖性能優(yōu)越,但也存在明顯短板:集成度較低、功耗高于DRAM,且單位容量占用硅片面積更大。同等面積的硅片可制造更大容量的DRAM,因此SRAM成本更高?;谄涓咚夙憫奶匦裕琒RAM常被用作CPU與主存之間的高速緩存,無需定期刷新,可適配CPU一級緩存、二級緩存等場景。

當前,全球AI產(chǎn)業(yè)隨著模型訓練逐步收斂,正邁向大規(guī)模推理應用落地階段。英偉達通過“技術授權+核心人才引進”的模式,可快速補強AI推理領域的布局,鞏固其全棧AI優(yōu)勢。這一合作有望帶動AI產(chǎn)業(yè)進入下一發(fā)展階段,掀起AI推理熱潮。

國內(nèi)外AI推理存儲布局

結(jié)合AI推理應用場景的特性,基于多種存儲類型的AI推理芯片、存算一體芯片在存儲與計算產(chǎn)業(yè)界備受關注、活躍度極高。筆者在先前撰寫的《AI推理的存儲,看好SRAM?》一文中曾提及,除Groq LPU近存計算芯片外,國內(nèi)外多家企業(yè)也推出了同類相關產(chǎn)品。

Axelera的AIPU芯片采用創(chuàng)新的內(nèi)存計算技術。與傳統(tǒng)磁盤存儲相比,內(nèi)存計算將數(shù)據(jù)直接存儲在主內(nèi)存(RAM)中,大幅提升數(shù)據(jù)處理速度。該芯片融合SRAM(靜態(tài)隨機訪問存儲器)與數(shù)字計算技術,使每個存儲單元可直接作為計算單元,從根本上增加了每個計算機周期的操作數(shù)(每個存儲單元每周期可完成一次乘法和一次累加),且不受噪聲干擾或精度降低等問題影響。

這一技術讓Axelera芯片在提供高計算性能的同時,能夠以更低成本、更低能耗完成邊緣AI計算任務。此外,該芯片采用開源的RISC-V指令集架構(ISA),其低成本、高效能、高靈活性的特性,可支持根據(jù)特定應用需求進行定制化設計,為Axelera帶來極大的設計自由度與創(chuàng)新空間。

2024年,Axelera獲得三星電子風險投資部門三星催化劑基金(Samsung Catalyst)的大力支持,成功籌集6800萬美元融資,至此總?cè)谫Y額達到1.2億美元。

AI芯片初創(chuàng)公司EnCharge AI研發(fā)出一種新型內(nèi)存計算架構,專為AI推理場景設計。其核心技術是基于模擬存內(nèi)計算的AI芯片,該創(chuàng)新設計采用“基于電荷的存儲器”,通過讀取存儲平面上的電流而非單個比特單元處理數(shù)據(jù),并使用更精確的電容器替代傳統(tǒng)半導體器件。

此外,d-Matrix采用數(shù)字內(nèi)存計算(DIMC)引擎架構,將計算單元遷移至RAM(內(nèi)存)附近;該數(shù)字存算一體技術通過合并存儲器與計算單元中的乘法累加器(MAC),顯著提升計算帶寬與效率,同時降低延遲、減少能耗。
在國內(nèi),知存科技、昕原半導體、九天睿芯、恒爍股份等企業(yè)均在積極布局存儲與計算融合的AI存算一體芯片領域。

昕原半導體的ATOM(AI Thruster Optimized Memory)產(chǎn)品系列,利用ReRAM(阻變存儲器)兼容先進工藝的特性,將存儲單元與計算單元融為一體,相比傳統(tǒng)方案實現(xiàn)數(shù)十倍的帶寬、性能及能效比提升。ATOM的存儲容量與算力均支持靈活配置,是端側(cè)、邊緣側(cè)及云端大模型加速的理想解決方案。

知存科技作為全球最早布局存算一體技術的企業(yè)之一,已實現(xiàn)技術量產(chǎn)商用,并積累了豐富的客戶服務經(jīng)驗。知存科技CEO王紹迪表示,AI技術從云端向端邊側(cè)滲透是明確趨勢,但帶寬、成本等痛點亟待解決,這推動半導體行業(yè)向“高帶寬、低成本、高能效”的技術方向創(chuàng)新,而存算一體技術正是契合這一需求的關鍵路徑。

知存科技早早就洞察到存算一體技術在端側(cè)AI場景的優(yōu)勢,2024年啟動“天才博士計劃”吸納全球頂尖人才,并與北京大學、清華大學等高校共建聯(lián)合實驗室,持續(xù)深耕技術突破。近兩年來,知存科技營收平均增速超50%,2025年市場表現(xiàn)亮眼,預計2026年將實現(xiàn)更高增長;累計服務客戶超30家,存算一體芯片的市場應用規(guī)模持續(xù)擴大,成功響應AI眼鏡、AI相機等細分領域的高能效計算需求,技術認可度與商業(yè)落地能力得到行業(yè)進一步驗證。

九天睿芯專注于多層級存算融合的技術路徑,通過整合存算一體與近存計算技術,實現(xiàn)前沿技術研發(fā)與商業(yè)化落地,為AI計算提供超高性能、更大容量、更低功耗的新一代硬件解決方案。目前,其芯片產(chǎn)品已在多家客戶實現(xiàn)量產(chǎn),并獲得多個國際一線智能眼鏡、智能耳機及助聽器品牌的訂單。2025年9月,九天睿芯宣布完成超億元B輪融資。

九天睿芯創(chuàng)始人、董事長兼CEO劉洪杰表示,公司計劃未來3年內(nèi)加速后續(xù)兩代大容量大算力存算一體芯片的研發(fā)進程:第二代芯片期間版本將支持1~3B級別的輕量化大模型,目前已流片成功;第三代芯片將支持100B(千億)級別參數(shù)量大模型的推理部署,成本僅為當前方案的十分之一,相當于現(xiàn)有支持5~10B(百億)級別參數(shù)量模型推理芯片的成本水平。

恒爍股份表示,公司研發(fā)的低功耗存算一體推理技術,可高效完成AI核心計算任務——向量矩陣乘法。借助存算一體技術,芯片能夠規(guī)避計算過程中模型數(shù)據(jù)訪存帶來的“存儲墻”問題,提升計算能效與計算面效,進而降低計算功耗與芯片面積。目前,公司已具備基于Nor Flash和SRAM兩種介質(zhì)的存算一體技術,覆蓋模擬存內(nèi)計算和數(shù)字存內(nèi)計算兩種技術路徑,可根據(jù)應用場景需求選擇適配的計算介質(zhì)與路徑。

此外,恒爍股份在音頻應用領域研發(fā)了與存算技術配套的低功耗預處理技術,包括低功耗ADC模數(shù)轉(zhuǎn)換器)設計、低功耗人聲活動檢測(VAD)及低功耗FFT(快速傅里葉變換)等。該預處理技術與存算一體計算核心搭配,可從系統(tǒng)層面優(yōu)化智能語音芯片的實際功耗,推動存算一體技術從單一模塊的技術優(yōu)勢,轉(zhuǎn)化為可落地、具備性價比與競爭力的芯片產(chǎn)品。

小結(jié)

綜上可見,存算一體方案能夠有效提升推理效率、降低推理成本,推動AI推理進入規(guī)?;涞仉A段。更低成本的推理方案將讓更多企業(yè)具備接入大模型的能力,進一步加速AI在內(nèi)容生成、數(shù)據(jù)分析、端側(cè)智能等領域的普及應用。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    41305

    瀏覽量

    302685
  • 英偉達
    +關注

    關注

    23

    文章

    4116

    瀏覽量

    99649
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    高通挑戰(zhàn)英偉,發(fā)布768GB內(nèi)存AI推理芯片,“出征”AI數(shù)據(jù)中心

    億美元的數(shù)據(jù)中心市場中搶占一席之地。 就在10月28日,高通面向數(shù)據(jù)中心連發(fā)兩款AI芯片,AI200 和 AI250 芯片,打造下一代 AI 推理
    的頭像 發(fā)表于 10-29 10:36 ?3970次閱讀
    高通挑戰(zhàn)<b class='flag-5'>英偉</b><b class='flag-5'>達</b>,發(fā)布768GB內(nèi)存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>數(shù)據(jù)中心

    高通挑戰(zhàn)英偉!發(fā)布768GB內(nèi)存AI推理芯片,“出征”AI數(shù)據(jù)中心

    億美元的數(shù)據(jù)中心市場中搶占一席之地。 ? 就在10月28日,高通面向數(shù)據(jù)中心連發(fā)兩款AI芯片,AI200 和 AI250 芯片,打造下一代 AI
    的頭像 發(fā)表于 10-29 09:14 ?6762次閱讀
    高通挑戰(zhàn)<b class='flag-5'>英偉</b><b class='flag-5'>達</b>!發(fā)布768GB內(nèi)存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>數(shù)據(jù)中心

    堪稱史上最強推理芯片!英偉發(fā)布 Rubin CPX,實現(xiàn)50倍ROI

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)近日,英偉AI infra峰會上發(fā)布了專為大規(guī)模上下文推理設計的全新GPU系列Rubin CPX,性能堪稱炸裂! ?
    的頭像 發(fā)表于 09-11 08:25 ?1.1w次閱讀
    堪稱史上最強<b class='flag-5'>推理</b>芯片!<b class='flag-5'>英偉</b><b class='flag-5'>達</b>發(fā)布 Rubin CPX,實現(xiàn)50倍ROI

    AI推理需求井噴!英偉Q1營收大漲,H20禁售難擋增長步伐

    電子發(fā)燒友原創(chuàng) 章鷹 在中美科技企業(yè)爭奪人工智能高地的競爭中,處于第一方陣的美國AI芯片公司英偉公司最新交出了讓市場滿意的答卷。 5月28日,英偉
    的頭像 發(fā)表于 05-31 01:13 ?8431次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>需求井噴!<b class='flag-5'>英偉</b><b class='flag-5'>達</b>Q1營收大漲,H20禁售難擋增長步伐

    硅光成AI勝負手?英偉20億美元戰(zhàn)略投資Marvell

    納入英偉 AI 生態(tài)體系,并在硅光子技術領域展開深度合作,旨在幫助客戶更高效地搭建 AI 算力基礎設施。 ? 構建 “異構計算” 新范式 根據(jù)雙方簽署的戰(zhàn)略協(xié)議,此次合作的核心圍繞N
    的頭像 發(fā)表于 04-06 07:02 ?1.2w次閱讀

    大為創(chuàng)芯進軍AI眼鏡存儲,端側(cè)AI存儲全面布局

    當前大模型應用持續(xù)滲透,AI 產(chǎn)業(yè)正迎來一輪關鍵的架構遷移,AI 存儲正從以云端集中處理為主,逐步向終端與邊緣側(cè)下沉延伸。這一趨勢讓端側(cè)存儲從傳統(tǒng)的數(shù)據(jù)載體,升級為支撐本地
    的頭像 發(fā)表于 04-03 10:20 ?4148次閱讀
    大為創(chuàng)芯進軍<b class='flag-5'>AI</b>眼鏡<b class='flag-5'>存儲</b>,端側(cè)<b class='flag-5'>AI</b><b class='flag-5'>存儲</b><b class='flag-5'>全面</b>布局

    GPU不是AI的唯一解:英偉用Groq LPU證明,推理賽道需要“另一條腿”

    ? 電子發(fā)燒友網(wǎng)報道(文/莫婷婷)過去十年,人工智能的爆發(fā)式增長與GPU需求緊密相連。憑借其卓越的并行計算能力,GPU成為AI算力的絕對代名詞。 ? 然而,英偉給出顛覆性的新解。在最新的GTC
    的頭像 發(fā)表于 03-24 11:27 ?6084次閱讀
    GPU不是<b class='flag-5'>AI</b>的唯一解:<b class='flag-5'>英偉</b><b class='flag-5'>達</b>用Groq LPU證明,<b class='flag-5'>推理</b>賽道需要“另一條腿”

    企業(yè)級AI Agent王炸! 英偉GTC將開源 NemoClaw

    消息人士透露,英偉計劃在下周在美國圣荷西舉行的年度開發(fā)者大會前后正式公布 NemoClaw。據(jù)知情人士向 WIRED 透露,該平臺允許企業(yè)部署 AI 代理為內(nèi)部團隊執(zhí)行任務,且不限于使用英偉
    的頭像 發(fā)表于 03-10 11:35 ?9401次閱讀
    企業(yè)級<b class='flag-5'>AI</b> Agent王炸! <b class='flag-5'>英偉</b><b class='flag-5'>達</b>GTC將開源 NemoClaw

    英偉電話會看Agentic AI推理與FPGA價值

    2026年2月,英偉發(fā)布2026財年Q4財報:營收681億美元,同比增長73%,數(shù)據(jù)中心業(yè)務增長75%——預期中的超預期。更值得關注的,是電話會中反復出現(xiàn)的幾個關鍵詞:Agentic AI、
    的頭像 發(fā)表于 03-04 17:07 ?1316次閱讀
    從<b class='flag-5'>英偉</b><b class='flag-5'>達</b>電話會看Agentic <b class='flag-5'>AI</b><b class='flag-5'>推理</b>與FPGA價值

    AI推理芯片需求爆發(fā),OpenAI欲尋求新合作伙伴

    電子發(fā)燒友網(wǎng)綜合報道,在人工智能迅猛發(fā)展的當下,AI推理芯片需求正呈爆發(fā)式增長。 ? AI推理,即支撐如ChatGPT這類AI模型響應用戶問
    的頭像 發(fā)表于 02-03 17:15 ?3297次閱讀

    第四次工業(yè)革命AI將實現(xiàn)十億倍增長 | 中國AI芯片與英偉的角色

    內(nèi)容提要:黃仁勛BG2專訪:英偉、OpenAI、算力未來與美國夢AI規(guī)模定律與推理的革命:在傳統(tǒng)的AI規(guī)模定律(預訓練、后訓練)之上,引入
    的頭像 發(fā)表于 09-29 07:20 ?1364次閱讀
    第四次工業(yè)革命<b class='flag-5'>AI</b>將實現(xiàn)十億倍增長 | 中國<b class='flag-5'>AI</b>芯片與<b class='flag-5'>英偉</b><b class='flag-5'>達</b>的角色

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡智能診斷邁向 “自愈”時代

    DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎技術研究有限公司開發(fā)的新一代AI大模型。其核心優(yōu)勢在于強大的推理引擎能力,融合了自然語言處理(
    發(fā)表于 07-16 15:29

    中科創(chuàng)重磅發(fā)布ThunderSoft AI Box

    近日,在行業(yè)矚目的軒轅汽車藍皮書論壇上,中科創(chuàng)重磅發(fā)布ThunderSoft AI Box!這款革命性的AI算力平臺以 “即插即用、靈活配置、全棧軟件” 三大創(chuàng)新特性,開辟 “
    的頭像 發(fā)表于 06-20 11:40 ?2165次閱讀

    英偉AI人才,去了華為

    電子發(fā)燒友網(wǎng)綜合報道 近日,英偉首席科學家比爾·戴利(Bill Dally)表示,美國對中國實施的人工智能出口管制禁令,讓中國獲得很大的發(fā)展空間,過去替英偉撰寫程序的中國人工智能研
    的頭像 發(fā)表于 06-06 00:05 ?7572次閱讀
    定远县| 彭泽县| 三明市| 宁海县| 黄浦区| 华安县| 乐山市| 和顺县| 辽中县| 石台县| 合肥市| 萍乡市| 新巴尔虎左旗| 房产| 白玉县| 辽阳县| 兴安盟| 云浮市| 琼海市| 天长市| 德昌县| 平利县| 昌都县| 昭苏县| 象山县| 海南省| 徐闻县| 仁化县| 嘉黎县| 兴山县| 新绛县| 奈曼旗| 大洼县| 修水县| 休宁县| 遂平县| 即墨市| 宁化县| 新乐市| 龙陵县| 滦南县|