在 2020 年度的 re:Invent 大會(huì)上,亞馬遜云服務(wù)(AWS)推出了全新的機(jī)器學(xué)習(xí)定制訓(xùn)練芯片 Trainium 。通過對 TensorFlow、PyTorch 和 MXNet 提供支持,該公司希望帶來比任何競爭對手都更高的性能表現(xiàn)。此外 Trainium 還可作為一個(gè) EC2 實(shí)例,在 AWS 的 SageMaker 機(jī)器學(xué)習(xí)平臺(tái)上使用,基于這些定制芯片的新實(shí)例將于 2021 上半年推出。
Trainium 具有相當(dāng)顯著的速度和成本優(yōu)勢,與標(biāo)準(zhǔn)的 AWS GPU 實(shí)例相比,AWS 承諾可帶來 30% 的吞吐量提升、以及降低 45% 的單次引用成本。
此外 AWS 正與英特爾合作啟動(dòng)基于 Habana Gaudi 的 EC2 機(jī)器學(xué)習(xí)訓(xùn)練實(shí)例。與定于 2021 年推出的版本相比,未來版本有望帶來高達(dá) 40% 的性價(jià)比提升。
需要指出的是,兩款新產(chǎn)品都是去年 re:Invent 大會(huì)上推出的 AWS Inferentia 定制芯片方案的補(bǔ)充,且 Trainium 使用了與 Inferentia 相同的軟件開發(fā)套件(SDK)。
據(jù)悉,在機(jī)器學(xué)習(xí)基礎(chǔ)架構(gòu)中,90% 的開銷都用于解決推理成本。盡管 Inferentia 有著成本方面的優(yōu)勢,但開發(fā)團(tuán)隊(duì)也受到了固定 ML 訓(xùn)練的預(yù)算限制。
為了突破訓(xùn)練范圍和頻度的限制,AWS Trainium 通過以云為中心的 ML 訓(xùn)練,帶來了最高性能和最低成本。結(jié)合兩者,客戶能夠切實(shí)擴(kuò)展 ML 訓(xùn)練的工作量、同時(shí)加速端到端的部署。
責(zé)編AJX
-
芯片
+關(guān)注
關(guān)注
463文章
54463瀏覽量
469724 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
67文章
8567瀏覽量
137262 -
AWS
+關(guān)注
關(guān)注
0文章
444瀏覽量
26645
發(fā)布評論請先 登錄
Edge Impulse 喚醒詞模型訓(xùn)練 | 技術(shù)集結(jié)
強(qiáng)化學(xué)習(xí)會(huì)讓自動(dòng)駕駛模型學(xué)習(xí)更快嗎?
今日看點(diǎn):微軟發(fā)布新定制 AI 芯片 Maia 200;國芯科技累計(jì)出貨2500萬顆創(chuàng)新高
NVIDIA在CES 2026發(fā)布全新物理AI模型
機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個(gè)常見錯(cuò)誤與局限性
深度解析48V系統(tǒng)如何革新機(jī)器人技術(shù)
穿孔機(jī)頂頭檢測儀 機(jī)器視覺深度學(xué)習(xí)
NVIDIA和AWS擴(kuò)展全棧合作伙伴關(guān)系
亞馬遜發(fā)布新一代AI芯片Trainium3,性能提升4倍
NVIDIA Isaac Lab推動(dòng)機(jī)器人技術(shù)突破
蘋果發(fā)布4款芯片為新機(jī)賦能
超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應(yīng)用.
【Sipeed MaixCAM Pro開發(fā)板試用體驗(yàn)】 + 04 + 機(jī)器學(xué)習(xí)YOLO體驗(yàn)
NVIDIA Isaac Lab可用環(huán)境與強(qiáng)化學(xué)習(xí)腳本使用指南
NVIDIA推出適用于機(jī)器人的OpenUSD資產(chǎn)結(jié)構(gòu)管線
AWS推全新機(jī)器學(xué)習(xí)定制訓(xùn)練芯片Trainium
評論