日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌發(fā)布第八代TPU,訓練推理分離,搭載自研CPU

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2026-04-24 09:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/李彎彎)在2026年4月22日舉行的谷歌云Next大會上,谷歌正式發(fā)布了第八代張量處理單元(TPU)。此次發(fā)布的產(chǎn)品包含兩款獨立的芯片:TPU 8t和TPU 8i。這是谷歌首次將訓練與推理任務拆分至獨立芯片,標志著其AI硬件路線的重大轉(zhuǎn)向。

谷歌高級副總裁兼AI與基礎(chǔ)設施首席技術(shù)專家Amin Vahdat表示,隨著AI智能體(AI Agents)的興起,訓練與服務場景對硬件的需求已經(jīng)出現(xiàn)明顯分化。為了最大化效率,需要分別為這兩類場景打造專用芯片。

這一變化反映了當前AI基礎(chǔ)設施建設的核心趨勢:從單純的模型參數(shù)規(guī)模競爭,轉(zhuǎn)向了對算力成本、能效比以及推理延遲的綜合考量。

TPU 8t與8i的技術(shù)亮點

谷歌此次推出的TPU 8t與TPU 8i兩款芯片,在設計目標、集群規(guī)模、內(nèi)存配置及互聯(lián)架構(gòu)上有明顯差異。TPU 8t聚焦于大規(guī)模模型訓練,而TPU 8i則致力于實現(xiàn)高并發(fā)、低延遲的推理任務。


TPU 8t的設計核心在于構(gòu)建一個無阻塞的超大規(guī)模計算集群,以應對當前日益復雜的萬億參數(shù)模型訓練挑戰(zhàn)。在集群擴展能力方面,單個超級計算單元(Supercomputer Pod)可容納多達9600枚芯片,而通過JAX與Pathways框架,分布式訓練規(guī)模更可擴展至單一集群超過100萬枚TPU芯片。這種前所未有的規(guī)模,使得最復雜的模型能夠調(diào)用一個統(tǒng)一的超大規(guī)模內(nèi)存池進行計算,從而大幅減少了跨集群通信的開銷,提升了訓練效率。

為了解決大規(guī)模集群中的通信瓶頸,TPU 8t采用了全新的Virgo網(wǎng)絡架構(gòu)。在互聯(lián)架構(gòu)與帶寬方面,芯片間互聯(lián)(ICI)帶寬是上一代的兩倍,而數(shù)據(jù)中心骨干網(wǎng)帶寬則較上一代提升了最高4倍。這種兩層無阻塞網(wǎng)絡設計,確保了即使在數(shù)萬枚芯片協(xié)同工作時,數(shù)據(jù)傳輸也不會成為計算的限制因素,為超大規(guī)模訓練提供了堅實的網(wǎng)絡支撐。

在計算性能與可靠性方面,TPU 8t計算性能較上一代Ironwood提升了近3倍。此外,該芯片還引入了一套完善的可靠性、可用性與可維護性(RAS)設計,包括覆蓋數(shù)萬枚芯片的實時遙測監(jiān)控,以及在不中斷任務運行的情況下自動檢測并繞過故障鏈路的機制。光路電路交換(OCS)技術(shù)的運用,更是使得硬件拓撲結(jié)構(gòu)能夠在無需人工干預的前提下,圍繞故障點自動重構(gòu),進一步提升了系統(tǒng)的穩(wěn)定性和可靠性。

與TPU 8t追求吞吐量不同,TPU 8i的設計核心在于解決推理過程中的“內(nèi)存墻”問題和降低響應延遲,特別是針對混合專家模型(MoE)和復雜的智能體工作流。為了實現(xiàn)這一目標,TPU 8i在片上SRAM方面進行了大幅擴容。

推理任務通常涉及頻繁的內(nèi)存讀寫,尤其是在處理長上下文窗口時。TPU 8i配備了384MB的片上靜態(tài)隨機存取存儲器(SRAM),容量是上一代的三倍。這意味著模型的活躍工作集(如KV Cache)可以完全保留在芯片內(nèi)部運行,從而大幅減少了處理器等待數(shù)據(jù)從外部高帶寬內(nèi)存(HBM)傳輸?shù)臅r間,顯著降低了推理延遲。

在互聯(lián)架構(gòu)方面,TPU 8i放棄了傳統(tǒng)的3D Torus互聯(lián)結(jié)構(gòu),轉(zhuǎn)而采用分層式的Boardfly網(wǎng)絡拓撲。這種架構(gòu)由基礎(chǔ)單元(4枚完全互聯(lián)的芯片)組成,進一步擴展為本地化組,最后通過OCS互聯(lián)成集群。在這種架構(gòu)下,任意兩枚芯片之間的通信最多只需經(jīng)過7次跳轉(zhuǎn)(上一代為16跳),全對全通信延遲改善了最高50%。這對于MoE模型中頻繁跨芯片路由令牌(Token)的操作至關(guān)重要,有效提升了推理效率。

此外,TPU 8i還新增了片上集合加速引擎(CAE),該引擎可以卸載全局操作,將片上集合操作的延遲降低至多5倍。這對于自回歸解碼和思維鏈處理等需要多芯片緊密協(xié)作的任務來說,無疑是一個巨大的提升,有效增強了集群的并發(fā)效率。

谷歌針對不同芯片的特性選擇了不同的設計合作伙伴。TPU 8t由博通共同設計,借助博通在高性能ASIC設計領(lǐng)域的經(jīng)驗,實現(xiàn)了極致的計算密度和互聯(lián)性能。而TPU 8i則由聯(lián)發(fā)科參與設計,旨在通過聯(lián)發(fā)科的工程能力打造高性價比的推理加速器。兩款芯片均運行在谷歌自研的Axion ARM架構(gòu)CPU平臺上,并由谷歌第四代液冷技術(shù)提供散熱支持,這種全棧自研與定制合作相結(jié)合的模式,有助于谷歌在保證性能的同時,控制數(shù)據(jù)中心的總體擁有成本(TCO)。

全棧生態(tài):從芯片到智能體平臺

硬件的迭代升級,本質(zhì)是為軟件生態(tài)的蓬勃發(fā)展提供支撐。在此次大會上,谷歌同步推出多項針對 AI 智能體的軟件與平臺更新,全力打通從底層算力到頂層應用的完整鏈路。

在 Gemini 企業(yè)代理平臺領(lǐng)域,谷歌推出專為 AI 代理打造的一站式平臺——Gemini Enterprise。該平臺集模型選擇、構(gòu)建及代理開發(fā)功能于一身,功能強大且全面。其中的 Agent Studio 獨具特色,企業(yè)可借此構(gòu)建具備長期記憶、能執(zhí)行多步驟流程的智能體,極大拓展了智能體的應用邊界。同時,谷歌推出“知識目錄”(Knowledge Catalog)和跨云湖倉(Cross - Cloud Lakehouse),打破數(shù)據(jù)壁壘。AI 智能體得以無縫訪問 AWS、Azure 等外部云服務商的數(shù)據(jù),有效解決數(shù)據(jù)孤島問題,讓 AI 能夠精準回答涉及復雜業(yè)務關(guān)系的深度問題。

谷歌 Workspace 套件也迎來智能化升級。通過全新的 Workspace Intelligence 層,Gemini 能夠跨 Gmail、Docs 和 Drive 深度理解上下文?;诖?,智能體可自動安排會議、生成契合品牌形象的 PPT,甚至在 Gmail 中提供智能收件箱助手,全方位提升辦公效率。為加速企業(yè)向谷歌 Workspace 的遷移,谷歌還推出“快速企業(yè)遷移”功能,將遷移速度提升至原來的 5 倍,降低企業(yè)遷移成本。

谷歌第八代 TPU 的發(fā)布對行業(yè)的影響,可能遠不止硬件規(guī)格的迭代這么簡單,它也對 AI 基礎(chǔ)設施發(fā)展方向提供了參考價值。

在能效與成本平衡方面,面對電力供應成為數(shù)據(jù)中心主要制約因素的現(xiàn)狀,TPU 8t 和 8i 均將能效作為核心考量指標。與上一代 Ironwood 相比,TPU 8t 每瓦性能提升 124%,TPU 8i 提升 117%。能效的顯著提升,使企業(yè)能在相同電力預算下提供更多算力服務,有效控制成本。

光互聯(lián)市場也迎來新機遇。TPU 8 系列對高帶寬和低延遲的極致追求,有力推動光模塊和光路交換機(OCS)市場增長。尤其是 TPU 8i 在推理集群中全面采用 OCS 全互聯(lián)技術(shù),預示光交換技術(shù)將從訓練集群向推理集群廣泛滲透,相關(guān)產(chǎn)業(yè)鏈市場空間有望進一步拓展。

寫在最后

目前,亞馬遜、微軟和Meta等科技巨頭也在積極布局自研AI芯片。谷歌通過“訓練+推理”的雙芯策略,結(jié)合自研CPU和液冷技術(shù),構(gòu)建了垂直整合的競爭優(yōu)勢。雖然英偉達在通用GPU市場仍占據(jù)主導地位,但谷歌通過定制化的ASIC路線,正在為企業(yè)級AI應用提供一種高性價比的替代方案。

總體而言,谷歌TPU 8t和8i的推出,旨在以更具成本效益的方式提供大規(guī)模吞吐量和低延遲能力,從而支撐起AI智能體時代的算力需求。這兩款芯片預計將于2026年晚些時候正式面向市場推出。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • asic
    +關(guān)注

    關(guān)注

    34

    文章

    1278

    瀏覽量

    124974
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6259

    瀏覽量

    111996
  • TPU
    TPU
    +關(guān)注

    關(guān)注

    0

    文章

    173

    瀏覽量

    21720
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    小米3nm旗艦SoC、4G基帶亮相!雷軍回顧11年造芯路

    XRING O1旗艦芯片。除了大芯片之外,還有此前未有曝光的,搭載小米4G基帶的玄戒T1手表芯片,以及小米首款豪華高性能SUV小米YU7。下面我們來回顧一下發(fā)布會上的亮點,以及小米
    的頭像 發(fā)表于 05-23 09:07 ?7826次閱讀
    小米<b class='flag-5'>自</b><b class='flag-5'>研</b>3nm旗艦SoC、4G基帶亮相!雷軍回顧11年造芯路

    谷歌推出TPU 8t / 8i,分別面向訓練推理

    行業(yè)芯事行業(yè)資訊
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2026年04月23日 13:40:46

    谷歌將新一TPU,專用于推理

    行業(yè)芯事行業(yè)資訊
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2026年04月21日 11:19:52

    實錘!比亞迪首次披露激光雷達進度,已量產(chǎn)上車?。▽⑷衿占埃?/a>

    ,比亞迪發(fā)布2025年度報告,尤其讓我們關(guān)注的是,在年度【研發(fā)投入】中,比亞迪披露了“第二刀片電池及閃充技術(shù)”等26個年度重大研發(fā)項目,其中就包括“激光雷達”項目——這是比亞迪首次曝光
    的頭像 發(fā)表于 04-01 20:07 ?3041次閱讀
    實錘!比亞迪首次披露<b class='flag-5'>自</b><b class='flag-5'>研</b>激光雷達進度,已量產(chǎn)上車?。▽⑷衿占埃? />    </a>
</div>                              <div   id=

    加快進程!Meta計劃2027年底前推出四AI芯片

    用于支持公司內(nèi)部的AI訓練推理任務。 ? AI 芯片的推進進程 ? 目前,MTIA 300已進入量產(chǎn)階段,主要應用于內(nèi)容排序和推薦系統(tǒng)的模型
    的頭像 發(fā)表于 03-16 08:57 ?1.2w次閱讀

    國內(nèi)首個國產(chǎn)AI推理千卡集群落地,采用云天勵飛全AI推理芯片

    3 月 12 日,云天勵飛中標湛江市AI滲透支撐新質(zhì)生產(chǎn)力基礎(chǔ)設施建設項目,中標金額4.2億元。項目將基于云天勵飛的國產(chǎn)AI推理加速卡,建設國產(chǎn)AI推理千卡集群。 該集群將
    發(fā)表于 03-12 11:10 ?1333次閱讀

    曦望發(fā)布新一推理GPU芯片,單位Token推理成本降低90%

    電子發(fā)燒友網(wǎng)報道 1月27日,國產(chǎn)GPU廠商曦望(Sunrise)重磅發(fā)布新一推理GPU芯片——啟望S3。這是曦望在近一年累計完成約30億元戰(zhàn)略融資后的首次集中公開亮相。2025年,曦望芯片交付量
    的頭像 發(fā)表于 01-28 17:38 ?9760次閱讀

    微軟發(fā)布AI芯片Maia 200,性能超越谷歌TPU和亞馬遜Trainium

    電子發(fā)燒友網(wǎng)綜合報道 美東時間1月26日,微軟重磅發(fā)布第二人工智能芯片Maia 200,這一舉措成為微軟減少對英偉達芯片依賴、高效驅(qū)動自身服務的關(guān)鍵一步,也標志著其在
    的頭像 發(fā)表于 01-27 16:46 ?7536次閱讀
    微軟<b class='flag-5'>發(fā)布</b>AI芯片Maia 200,性能超越<b class='flag-5'>谷歌</b><b class='flag-5'>TPU</b>和亞馬遜Trainium

    AI硬件全景解析:CPU、GPU、NPU、TPU的差異化之路,一文看懂!?

    CPU作為“通用基石”,支撐所有設備的基礎(chǔ)運行;GPU憑借并行算力,成為AI訓練與圖形處理的“主力”;TPU在Google生態(tài)中深耕云端大模型訓練;NPU則讓AI從“云端”走向“身邊”
    的頭像 發(fā)表于 12-17 17:13 ?2355次閱讀
    AI硬件全景解析:<b class='flag-5'>CPU</b>、GPU、NPU、<b class='flag-5'>TPU</b>的差異化之路,一文看懂!?

    英偉達遇最強對手,谷歌加速推廣TPU

    行業(yè)芯事行業(yè)資訊
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2025年11月26日 13:54:07

    谷歌發(fā)布最強TPU,性能比前代提升4倍

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)近日,谷歌云在官方博客上正式宣布,公司成功推出第七TPU(張量處理器)“Ironwood”,該芯片預計在未來幾周內(nèi)正式上市。 ? “Ironwood”由谷歌
    的頭像 發(fā)表于 11-13 07:49 ?9052次閱讀
    <b class='flag-5'>谷歌</b>云<b class='flag-5'>發(fā)布</b>最強<b class='flag-5'>自</b><b class='flag-5'>研</b><b class='flag-5'>TPU</b>,性能比前代提升4倍

    安波福推出第八雷達系列

    致力于更安全、更綠色、更互聯(lián)未來的全球科技公司安波福(紐約證券交易所代碼:APTV)今日宣布,正式推出其目前為止最先進的第八雷達系列。該技術(shù)專為滿足未來高級駕駛輔助系統(tǒng)(ADAS)的發(fā)展需求而設
    的頭像 發(fā)表于 10-22 11:49 ?748次閱讀

    德賽西威榮獲第八屆廣東省政府質(zhì)量獎

    近日,《廣東省人民政府關(guān)于表彰第八屆廣東省政府質(zhì)量獎獲獎組織的通報》發(fā)布,德賽西威榮獲“第八屆廣東省政府質(zhì)量獎”。
    的頭像 發(fā)表于 09-29 13:56 ?890次閱讀

    東風風神L8搭載馬赫動力電池

    近日,東風新旗艦東風風神L8正式開啟預售,聚焦家庭用車核心需求,該車搭載東風“馬赫動力電池”打造主流家庭的“質(zhì)價比之王”。
    的頭像 發(fā)表于 08-15 09:55 ?1779次閱讀

    高端芯片,服務器芯片傳來好消息!

    的研發(fā)又有了一些動向,例如海光信息、龍芯中科等都在加強這一力度。 ? 海光 C86-5G ? 海光CPU從初基于AMD Zen架構(gòu)開發(fā),再到
    的頭像 發(fā)表于 05-18 09:25 ?8590次閱讀
    高端芯片<b class='flag-5'>自</b><b class='flag-5'>研</b>,服務器芯片傳來好消息!
    聊城市| 兖州市| 辽宁省| 贵德县| 渭南市| 长治市| 乌审旗| 玉屏| 罗城| 来凤县| 双城市| 台湾省| 当雄县| 余江县| 淮安市| 德兴市| 宁陵县| 雷山县| 汤原县| 贺州市| 邛崃市| 中江县| 长丰县| 兴和县| 天全县| 永清县| 林州市| 德安县| 思茅市| 山东| 龙游县| 渝北区| 当雄县| 房产| 汉阴县| 揭东县| 余姚市| 普格县| 福安市| 昆山市| 陕西省|