日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

Carol Li ? 來(lái)源:電子發(fā)燒友 ? 作者:李彎彎 ? 2025-04-12 00:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會(huì)上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據(jù)悉,該芯片預(yù)計(jì)于今年晚些時(shí)候面向 Google Cloud 客戶(hù)開(kāi)放,將提供 256 芯片集群以及 9,216 芯片集群兩種配置選項(xiàng)。


在核心亮點(diǎn)層面,Ironwood 堪稱(chēng)谷歌首款專(zhuān)門(mén)為 AI 推理精心設(shè)計(jì)的 TPU 芯片,能夠有力支持大規(guī)模思考與推理 AI 模型。谷歌方面表示,它代表著 AI 發(fā)展從 “響應(yīng)式” 向 “主動(dòng)式” 的范式轉(zhuǎn)變,未來(lái) AI 代理將能夠主動(dòng)檢索并生成數(shù)據(jù),進(jìn)而提供深度見(jiàn)解,而非僅僅輸出原始數(shù)據(jù)。

在性能與能效表現(xiàn)上,Ironwood 取得了重大突破。其每瓦性能達(dá)到上一代 TPU Trillium 的兩倍,能效近乎首款云 TPU 的 30 倍。單芯片配備 192GB 高帶寬內(nèi)存(HBM),容量為 Trillium 的 6 倍;HBM 帶寬高達(dá) 7.2TB/s,是 Trillium 的 4.5 倍。芯片間互連(ICI)帶寬提升至 1.2TB/s,為 Trillium 的 1.5 倍,這一提升有力地支持了大規(guī)模分布式訓(xùn)練與推理任務(wù)。

此外,Ironwood 還是谷歌首款支持 FP8 浮點(diǎn)格式的 TPU 芯片。在此之前,TPU 僅支持 INT8(用于推理)和 BF16(用于訓(xùn)練)。采用 FP8 計(jì)算可使 AI 訓(xùn)練吞吐量翻倍,性能相較于 BF16 提升 10 倍。

Ironwood 還配備了增強(qiáng)版 SparseCore 專(zhuān)用加速器,可用于處理高級(jí)排名和推薦任務(wù)中常見(jiàn)的超大嵌入。憑借這一增強(qiáng)版 SparseCore,其能夠加速更多領(lǐng)域的任務(wù),應(yīng)用范圍從傳統(tǒng)的 AI 任務(wù)拓展至金融和科學(xué)等領(lǐng)域。

在系統(tǒng)架構(gòu)與擴(kuò)展性方面,Ironwood 可擴(kuò)展至 9216 個(gè)液冷芯片,借助突破性的 ICI 網(wǎng)絡(luò)進(jìn)行連接,功率接近 10 兆瓦。它提供 256 芯片和 9216 芯片兩種 Pod 配置,其中 9216 芯片的 Pod 配置整體 AI 算力可達(dá) 42.5 Exaflops。谷歌先進(jìn)的液冷解決方案能夠確保芯片在持續(xù)繁重的 AI 工作負(fù)載下依然保持高性能。

谷歌的 TPU 作為專(zhuān)為機(jī)器學(xué)習(xí)設(shè)計(jì)的定制化加速芯片,自 2015 年首次亮相以來(lái),已成為 AI 硬件領(lǐng)域的重要力量。TPU 主要應(yīng)用于訓(xùn)練和推理大規(guī)模 AI 模型(如 AlphaGo、PaLM、Gemini 等),并深度融入 Google Cloud 以及谷歌內(nèi)部 AI 服務(wù)之中。

截至目前,TPU 已歷經(jīng)多次版本迭代:TPU v1 支持 INT8 精度,主要用于谷歌內(nèi)部項(xiàng)目(如 AlphaGo、RankBrain);TPU v2/v3 面向訓(xùn)練與推理場(chǎng)景,支持浮點(diǎn)運(yùn)算,v3 進(jìn)一步增加了內(nèi)存和互連帶寬;TPU v4 的算力達(dá)到 TPU v3 的 2.7 倍,采用液冷技術(shù),支持 4096 芯片互聯(lián)的 Pod 集群,適用于超大規(guī)模模型(如 PaLM)。

由此可見(jiàn),谷歌 TPU 憑借其專(zhuān)用化設(shè)計(jì)、高能效比以及與 TensorFlow 的深度集成等優(yōu)勢(shì),成為大規(guī)模 AI 模型訓(xùn)練與推理的核心硬件支撐。如今,Ironwood 的推出不僅將進(jìn)一步鞏固谷歌在 AI 硬件領(lǐng)域的領(lǐng)先地位,也勢(shì)必為生成式 AI 的下一階段發(fā)展提供強(qiáng)大的計(jì)算動(dòng)力。?

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6259

    瀏覽量

    112000
  • TPU
    TPU
    +關(guān)注

    關(guān)注

    0

    文章

    173

    瀏覽量

    21721
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    谷歌發(fā)布第八TPU,訓(xùn)練推理分離,搭載自研CPU

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)在2026年4月22日舉行的谷歌云Next大會(huì)上,谷歌正式發(fā)布了第八張量處理單元(TPU)。此次發(fā)布的產(chǎn)品包含兩款獨(dú)立的
    的頭像 發(fā)表于 04-24 09:03 ?6138次閱讀
    <b class='flag-5'>谷歌</b>發(fā)布第八<b class='flag-5'>代</b><b class='flag-5'>TPU</b>,訓(xùn)練<b class='flag-5'>推理</b>分離,搭載自研CPU

    直擊英偉達(dá)腹地?谷歌TPU v7開(kāi)放部署,催生OCS產(chǎn)業(yè)鏈紅利

    Processing Unit, TPU)構(gòu)建了套完整的AI算力基礎(chǔ)設(shè)施體系。 ? 11月,谷歌宣布第七
    的頭像 發(fā)表于 11-27 08:53 ?9773次閱讀
    直擊英偉達(dá)腹地?<b class='flag-5'>谷歌</b><b class='flag-5'>TPU</b> v7開(kāi)放部署,催生OCS產(chǎn)業(yè)鏈紅利

    黑馬-Java+AI新版V16零基礎(chǔ)就業(yè)班百度云網(wǎng)盤(pán)下載+Java+AI全棧開(kāi)發(fā)工程師

    差異。 二、Java 推理引擎選型與性能優(yōu)化 將 AI 模型跑在 JVM 內(nèi),最大的技術(shù)挑戰(zhàn)是性能。傳統(tǒng) Python 生態(tài)依靠原生 C++ 后端與高效內(nèi)存管理獲得
    發(fā)表于 05-01 11:29

    谷歌新一代TPU,專(zhuān)用于推理

    行業(yè)芯事行業(yè)資訊
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2026年04月21日 11:19:52

    AI推理芯片需求爆發(fā),OpenAI欲尋求新合作伙伴

    領(lǐng)域占據(jù)主導(dǎo),其GPU憑借強(qiáng)大的海量數(shù)據(jù)處理能力,成為全球AI爆炸式增長(zhǎng)的重要基石。但隨著AI不斷演進(jìn),重點(diǎn)正從大規(guī)模訓(xùn)練轉(zhuǎn)向?qū)σ延?xùn)練模型推理
    的頭像 發(fā)表于 02-03 17:15 ?3302次閱讀

    曦望發(fā)布新一代推理GPU芯片,單位Token推理成本降低90%

    電子發(fā)燒友網(wǎng)報(bào)道 1月27日,國(guó)產(chǎn)GPU廠商曦望(Sunrise)重磅發(fā)布新一代推理GPU芯片——啟望S3。這是曦望在近年累計(jì)完成約30億元戰(zhàn)略融資后的首次集中公開(kāi)亮相。2025年,
    的頭像 發(fā)表于 01-28 17:38 ?9771次閱讀

    今日看點(diǎn):消息稱(chēng) AMD、高通考慮導(dǎo)入 SOCAMM 內(nèi)存;曦望發(fā)布新一代推理GPU芯片啟望S3

    曦望發(fā)布新一代推理GPU芯片啟望S3 近日,浙江杭州GPU創(chuàng)企曦望(Sunrise)發(fā)布新一代推理GPU
    發(fā)表于 01-28 11:09 ?1363次閱讀

    云巨頭算力戰(zhàn)升級(jí)!微軟新一代3nm AI推理芯片性能提升30%,落地?cái)?shù)據(jù)中心

    據(jù)外媒報(bào)道,微軟發(fā)布新一代人工智能芯片Maia 200,這款芯片有望成為英偉達(dá)旗艦處理器以及云服務(wù)競(jìng)爭(zhēng)對(duì)手亞馬遜、谷歌同類(lèi)產(chǎn)品的替代選擇。微軟稱(chēng),這款
    的頭像 發(fā)表于 01-27 12:29 ?1w次閱讀
    云巨頭算力戰(zhàn)升級(jí)!微軟<b class='flag-5'>新一代</b>3nm <b class='flag-5'>AI</b><b class='flag-5'>推理</b><b class='flag-5'>芯片</b>性能提升30%,落地?cái)?shù)據(jù)中心

    谷歌云發(fā)布最強(qiáng)自研TPU,性能比前代提升4倍

    精心設(shè)計(jì),能夠輕松處理從大型模型訓(xùn)練到實(shí)時(shí)聊天機(jī)器人運(yùn)行以及AI智能體操作等各類(lèi)復(fù)雜任務(wù)。 ? 谷歌在新聞稿中著重強(qiáng)調(diào),“Ironwood”是專(zhuān)為應(yīng)對(duì)最嚴(yán)苛的工作負(fù)載而打造的。無(wú)論是
    的頭像 發(fā)表于 11-13 07:49 ?9056次閱讀
    <b class='flag-5'>谷歌</b>云發(fā)布最強(qiáng)自研<b class='flag-5'>TPU</b>,性能比前代提升4倍

    【內(nèi)測(cè)活動(dòng)同步開(kāi)啟】這么???這么強(qiáng)?新一代模型MCP開(kāi)發(fā)板來(lái)啦!

    【內(nèi)測(cè)活動(dòng)同步開(kāi)啟】這么???這么強(qiáng)?新一代模型MCP開(kāi)發(fā)板來(lái)啦! 聆思全新一代六合芯片「LS26系列」,搭載WIFI / BLE &a
    發(fā)表于 09-25 11:47

    新一代超大模型訓(xùn)練引擎XTuner V1開(kāi)源

    9月8日,上海人工智能實(shí)驗(yàn)室(上海AI實(shí)驗(yàn)室)開(kāi)源書(shū)生大模型新一代訓(xùn)練引擎XTuner V1。
    的頭像 發(fā)表于 09-10 10:55 ?1373次閱讀

    大規(guī)模專(zhuān)家并行模型在TensorRT-LLM的設(shè)計(jì)

    DeepSeek-V3 / R1 等模型采用大規(guī)模細(xì)粒度混合專(zhuān)家模型 (MoE) 架構(gòu),大幅提升了開(kāi)源模型的質(zhì)量。Llama 4 和 Qwen3 等新發(fā)布的開(kāi)源
    的頭像 發(fā)表于 09-06 15:21 ?1461次閱讀
    <b class='flag-5'>大規(guī)模</b>專(zhuān)家并行<b class='flag-5'>模型</b>在TensorRT-LLM的設(shè)計(jì)

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    DeepSeek-R1:強(qiáng)大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開(kāi)發(fā)的新一代AI
    發(fā)表于 07-16 15:29

    谷歌新一代生成式AI媒體模型登陸Vertex AI平臺(tái)

    我們?cè)?Vertex AI 上推出新一代生成式 AI 媒體模型: Imagen 4、Veo 3 和 Lyria 2。
    的頭像 發(fā)表于 06-18 09:56 ?1328次閱讀

    廣和通發(fā)布新一代AI語(yǔ)音智能體FiboVista

    近日,2025火山引擎Force原動(dòng)力大會(huì)正式開(kāi)幕。廣和通發(fā)布新一代AI語(yǔ)音智能體FiboVista,并已率先應(yīng)用于車(chē)聯(lián)網(wǎng),成為智能駕駛的“用車(chē)伙伴”和“出行伴侶”。通過(guò)創(chuàng)新AI
    的頭像 發(fā)表于 06-17 09:22 ?1445次閱讀
    普安县| 四川省| 林州市| 井冈山市| 青岛市| 马尔康县| 交城县| 金寨县| 巴彦县| 房产| 台北市| 蒙自县| 江都市| 马龙县| 桐梓县| 旬阳县| 根河市| 宜昌市| 西贡区| 兴义市| 虎林市| 济南市| 那曲县| 景洪市| 当阳市| 嵊州市| 玉龙| 尼木县| 南昌县| 唐海县| 额敏县| 东台市| 湘乡市| 綦江县| 普兰县| 巨鹿县| 福海县| 三门县| 城固县| 凤城市| 古浪县|