日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

欲把AI計算成本打下來,谷歌高效益TPU正式開放

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2023-11-14 00:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/周凱揚(yáng))對于每個想要自己開發(fā)和部署AI模型的應(yīng)用開發(fā)者來說,硬件和服務(wù)器支出都是一筆不小的費(fèi)用。就以英偉達(dá)GPU為例,即便是消費(fèi)級的GPU,最近也迎來了一波漲價潮,更不用爆火的A100/H100等型號了。

即便是租賃服務(wù)器,基于這些熱門硬件的服務(wù)器也遠(yuǎn)算不上便宜,因此不少云服務(wù)廠商為了進(jìn)一步拉攏更多AI應(yīng)用開發(fā)者,紛紛推出了性價比更高的選項。這些選項有的是基于CPU的AI計算服務(wù)器,有的是基于第三方AI加速器打造的服務(wù)器,還有的則是由云服務(wù)廠商基于自研加速器打造且獨(dú)家提供的服務(wù)器。

谷歌高性價比TPU面世

谷歌在今年8月底發(fā)布了第五代的自研TPU,TPU v5e。谷歌稱該加速器實(shí)現(xiàn)了性能與成本效益的平衡。相比上一代TPU v4,TPU V5e提供了同成本下兩倍的訓(xùn)練性能,以及針對LLM和生成式AI模型2.5倍的推理性能。

wKgaomVR-HqAJvSzAABXKc7C2hk445.png
TPU v5e架構(gòu)


單個TPU v5e Pod由256個芯片互聯(lián),總帶寬超過400Tb/s,INT8總算力達(dá)100petaOps。而且谷歌為TPU v5e采用了更靈活的配置選項,其支持8個不同的虛擬機(jī)配置,單個切片支持單芯片到250多個芯片,如此一來客戶就可以根據(jù)自己的模型大小來選擇合適的配置。

而且過去借助谷歌TPU進(jìn)行的訓(xùn)練負(fù)載只局限于單個切片中,谷歌為此開發(fā)了Multislice技術(shù),可通過芯片間互聯(lián)以及數(shù)據(jù)中心網(wǎng)絡(luò)中的多個TPU Pod相連,從而將訓(xùn)練工作擴(kuò)展到數(shù)萬個芯片上。

為了進(jìn)一步擴(kuò)大對開發(fā)生態(tài)的支持,TPU v5e還內(nèi)置了對JAX、Pytorch和Tensorflow等領(lǐng)先AI框架,以及 Hugging Face 的 TransformersAccelerate、PyTorch Lightning 和 Ray等一系列常用開源工具的支持。

開放使用與自用

近日,谷歌終于宣布TPU v5e進(jìn)入公用階段,且在最新的MLPerf訓(xùn)練3.1測試中,TPUv5e獲得了更好的表現(xiàn)。在該測試中,谷歌改進(jìn)了創(chuàng)新的混合精度訓(xùn)練算法,除了原生支持的BF16外,還用到了INT8精度格式。這意味著客戶在提高了模型準(zhǔn)確性的同時,將花費(fèi)更少的成本。

wKgZomVR-IOANSMPAAIyMIzn61I221.png
從谷歌云對于TPU v5e的定價表來看,v5e在成本效益上確實(shí)有著極大的優(yōu)勢。不過需要注意的是,v5e與v2、v3 Pod類似,每個芯片中只有一個TensorCore,而v4 Pod的每個芯片中有兩個TensorCore。這也是為何v5e的單芯片峰值算力為197TFLOPS,而v4的單芯片峰值算力為275TFLOPS,可即便如此,在按芯片小時的定價下,其所需成本依然低于v4。

在如此高的性價比下,谷歌不僅將TPU提供給外部開發(fā)者使用,其內(nèi)部一些開發(fā)項目也開始用上TPU v5e。比如其PaLM模型的創(chuàng)建,就用到了上文提到的Multislice技術(shù),谷歌的Bard團(tuán)隊同樣在用TPU v5e訓(xùn)練這一生成式AI聊天機(jī)器人。

寫在最后

其實(shí)在TPUv5e開放使用之前,谷歌也正式開放了A3 VM這類GPU加速虛擬機(jī)的使用。這也是多數(shù)云服務(wù)廠商采用的多方案供應(yīng)策略,其自研加速器只需要為客戶提供一個高性價比的方案,而追求更高性能的客戶,依然可以選擇基于H100 GPU打造的服務(wù)器。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41326

    瀏覽量

    302703
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    谷歌發(fā)布第八代TPU,訓(xùn)練推理分離,搭載自研CPU

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)在2026年4月22日舉行的谷歌云Next大會上,谷歌正式發(fā)布了第八代張量處理單元(TPU)。此次發(fā)布的產(chǎn)品包含兩款獨(dú)立的芯片:TPU 8t和
    的頭像 發(fā)表于 04-24 09:03 ?6158次閱讀
    <b class='flag-5'>谷歌</b>發(fā)布第八代<b class='flag-5'>TPU</b>,訓(xùn)練推理分離,搭載自研CPU

    直擊英偉達(dá)腹地?谷歌TPU v7開放部署,催生OCS產(chǎn)業(yè)鏈紅利

    Processing Unit, TPU)構(gòu)建了一套完整的AI算力基礎(chǔ)設(shè)施體系。 ? 11月,谷歌宣布第七代 TPU v7(代號 Ironwood)將在后續(xù)幾周大規(guī)模上市。與此消息同
    的頭像 發(fā)表于 11-27 08:53 ?9776次閱讀
    直擊英偉達(dá)腹地?<b class='flag-5'>谷歌</b><b class='flag-5'>TPU</b> v7<b class='flag-5'>開放</b>部署,催生OCS產(chǎn)業(yè)鏈紅利

    DDR狂漲不慌!啟明智顯Model3/Model3C HMI芯片攜大容量PSRAM,幫你硬件成本打下來

    2026年全年。對于智能家電、PC周邊副屏、桌搭設(shè)備以及各類HMI產(chǎn)品的制造商來說,DDR漲價直接轉(zhuǎn)化為硬件成本的飆升,成為搶占市場的核心瓶頸。然而,危機(jī)中往往隱藏著
    的頭像 發(fā)表于 03-18 18:05 ?763次閱讀
    DDR狂漲不慌!啟明智顯Model3/Model3C HMI芯片攜大容量PSRAM,幫你<b class='flag-5'>把</b>硬件<b class='flag-5'>成本</b><b class='flag-5'>打下來</b>

    什么是TPU?萬協(xié)通帶你看懂AI算力的“變形金剛”

    ”——TPU(Tensor Processing Unit)。 今天,作為國產(chǎn)可重構(gòu)TPU芯片的先行者,萬協(xié)通將帶你剝開晦澀的技術(shù)外殼,看懂這塊決定AI未來的核心硬件,以及中國芯片如何換道超車,上演一場精彩的“變形記”。
    的頭像 發(fā)表于 01-13 13:22 ?478次閱讀
    什么是<b class='flag-5'>TPU</b>?萬協(xié)通帶你看懂<b class='flag-5'>AI</b>算力的“變形金剛”

    AI芯片大單!Anthropic從博通采購100萬顆TPU v7p芯片

    Anthropic供應(yīng)基于TPU v7p的機(jī)架級 AI 系統(tǒng),繞過TPU芯片的另一開發(fā)參與方谷歌。不過谷歌預(yù)計仍可從 Anthropic
    的頭像 發(fā)表于 01-06 08:38 ?1.1w次閱讀

    2025年中科曙光聯(lián)合多家企業(yè)共同推出AI計算開放架構(gòu)

    2025年,人工智能產(chǎn)業(yè)步入規(guī)?;瘧?yīng)用深水區(qū),大模型技術(shù)迭代加速,對算力規(guī)模與效率提出更高要求。在這一背景下,9月,中科曙光依托國家先進(jìn)計算產(chǎn)業(yè)創(chuàng)新中心,聯(lián)合產(chǎn)業(yè)鏈上下游20多家企業(yè)共同推出AI計算
    的頭像 發(fā)表于 12-30 15:43 ?703次閱讀

    3年10億,攜手攻堅:“AI計算開放架構(gòu)聯(lián)合實(shí)驗室”協(xié)同創(chuàng)新計劃正式啟動

    在剛剛結(jié)束的光合組織2025人工智能創(chuàng)新大會(HAIC2025)上,一項項助力中國AI產(chǎn)業(yè)發(fā)展、推動產(chǎn)業(yè)底層協(xié)同等的關(guān)鍵舉措逐一發(fā)布,包括30余家生態(tài)企業(yè)聯(lián)合發(fā)起的“AI計算開放架構(gòu)聯(lián)
    發(fā)表于 12-21 16:15 ?2478次閱讀
    3年10億,攜手攻堅:“<b class='flag-5'>AI</b><b class='flag-5'>計算</b><b class='flag-5'>開放</b>架構(gòu)聯(lián)合實(shí)驗室”協(xié)同創(chuàng)新計劃正式啟動

    谷歌云發(fā)布最強(qiáng)自研TPU,性能比前代提升4倍

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)近日,谷歌云在官方博客上正式宣布,公司成功推出第七代TPU(張量處理器)“Ironwood”,該芯片預(yù)計在未來幾周內(nèi)正式上市。 ? “Ironwood”由谷歌自主
    的頭像 發(fā)表于 11-13 07:49 ?9058次閱讀
    <b class='flag-5'>谷歌</b>云發(fā)布最強(qiáng)自研<b class='flag-5'>TPU</b>,性能比前代提升4倍

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    計算成本。 核心: MoE模型利用稀疏性驅(qū)動結(jié)構(gòu),通過包含多個專家網(wǎng)絡(luò)的稀疏MoE層替換密集層,其中每個專家致力于特定的訓(xùn)練數(shù)據(jù)或任務(wù)的子集,并且一個可訓(xùn)練的門控機(jī)制動態(tài)地將輸入標(biāo)記分配給這些專家,從而
    發(fā)表于 09-18 15:31

    中科曙光發(fā)布國內(nèi)首個開放架構(gòu)AI超集群系統(tǒng)

    9月5日,在2025重慶世界智能產(chǎn)業(yè)博覽會上,中科曙光發(fā)布了國內(nèi)首個基于AI計算開放架構(gòu)設(shè)計的產(chǎn)品——曙光AI超集群系統(tǒng)。該系統(tǒng)以GPU為核心,實(shí)現(xiàn)了“算、存、網(wǎng)、電、冷、管、軟”一體
    的頭像 發(fā)表于 09-06 09:11 ?1649次閱讀

    電動機(jī)噪聲、振動和聲振粗糙度開發(fā):使用低計算成本的系統(tǒng)級模型預(yù)測早期噪聲、振動和聲振粗糙度

    優(yōu)勢使用計算成本低的系統(tǒng)級模型在動態(tài)運(yùn)行條件下對電驅(qū)動裝置執(zhí)行早期噪聲、振動和聲振粗糙度評估優(yōu)化電機(jī)控制策略并做出更好的設(shè)計選擇,以提高電動汽車的噪聲、振動和聲振粗糙度使用Simcenter節(jié)省時間
    的頭像 發(fā)表于 08-13 11:46 ?862次閱讀
    電動機(jī)噪聲、振動和聲振粗糙度開發(fā):使用低<b class='flag-5'>計算成本</b>的系統(tǒng)級模型預(yù)測早期噪聲、振動和聲振粗糙度

    AI 邊緣計算網(wǎng)關(guān):開啟智能新時代的鑰匙?—龍興物聯(lián)

    順暢地通向云端,實(shí)現(xiàn)設(shè)備與云端之間高效的數(shù)據(jù)傳輸與交互。通過融合先進(jìn)的邊緣計算和人工智能技術(shù),AI 邊緣計算網(wǎng)關(guān)能夠在靠近數(shù)據(jù)源的網(wǎng)絡(luò)邊緣,對數(shù)據(jù)進(jìn)行實(shí)時處理和精準(zhǔn)分析,進(jìn)而實(shí)現(xiàn)智能化
    發(fā)表于 08-09 16:40

    AI芯片:加速人工智能計算的專用硬件引擎

    人工智能(AI)的快速發(fā)展離不開高性能計算硬件的支持,而傳統(tǒng)CPU由于架構(gòu)限制,難以高效處理AI任務(wù)中的大規(guī)模并行計算需求。因此,專為
    的頭像 發(fā)表于 07-09 15:59 ?1988次閱讀

    AlphaEvolve有望革新AI玩具芯片設(shè)計,算法進(jìn)化驅(qū)動能效與成本雙突破

    電子發(fā)燒友網(wǎng)綜合報道,近期,谷歌?DeepMind發(fā)布了一款A(yù)lphaEvolve,是一款通用科學(xué)AI代理,基于大語言模型Gemini系列與進(jìn)化計算框架,專注于算法發(fā)現(xiàn)與優(yōu)化??梢灾С?jǐn)?shù)百行代碼
    的頭像 發(fā)表于 06-18 00:09 ?4005次閱讀

    智算加速卡是什么東西?它真能在AI戰(zhàn)場上干掉GPU和TPU!

    隨著AI技術(shù)火得一塌糊涂,大家都在談"大模型"、"AI加速"、"智能計算",可真到了落地環(huán)節(jié),算力才是硬通貨。你有沒有發(fā)現(xiàn),現(xiàn)在越來越多的AI企業(yè)不光用GPU,也不怎么迷信
    的頭像 發(fā)表于 06-05 13:39 ?1938次閱讀
    智算加速卡是什么東西?它真能在<b class='flag-5'>AI</b>戰(zhàn)場上干掉GPU和<b class='flag-5'>TPU</b>!
    当雄县| 女性| 镇康县| 凤山市| 织金县| 汉川市| 蒙自县| 洪雅县| 涟水县| 张家港市| 景泰县| 南安市| 奉贤区| 郑州市| 都江堰市| 吴川市| 友谊县| 灵丘县| 西藏| 洪泽县| 忻城县| 福泉市| 天津市| 乾安县| 阿拉善左旗| 大关县| 长顺县| 筠连县| 即墨市| 博白县| 东光县| 嘉善县| 泰州市| 陕西省| 商丘市| 佛坪县| 吉隆县| 祁阳县| 油尖旺区| 玛沁县| 和平县|