日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD和Intel叫板英偉達(dá),先后發(fā)布新芯片

智能計(jì)算芯世界 ? 來(lái)源:半導(dǎo)體行業(yè)觀(guān)察 ? 作者:半導(dǎo)體行業(yè)觀(guān)察 ? 2022-11-15 10:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編者按:因?yàn)閾碛袕?qiáng)悍的GPU英偉達(dá)在多個(gè)領(lǐng)域擁有強(qiáng)悍的競(jìng)爭(zhēng)力,這就吸引了更多的廠(chǎng)商進(jìn)去其專(zhuān)注的市場(chǎng),英特爾AMD就虎視眈眈。

我們知道,Nvidia 并不是唯一一家創(chuàng)建了專(zhuān)門(mén)計(jì)算單元的公司,這些計(jì)算單元擅長(zhǎng)支持 AI 訓(xùn)練的矩陣數(shù)學(xué)和張量處理,并且可以重新用于運(yùn)行 AI 推理。英特爾已經(jīng)收購(gòu)了兩家這樣的公司——Nervana Systems,緊隨其后的是 Habana Labs,這都是他們叫板Nvidia 的 “武器”。

英特爾是一家優(yōu)秀的公司,正在追逐該公司認(rèn)為在未來(lái)五年內(nèi)將產(chǎn)生 500 億美元的人工智能計(jì)算機(jī)會(huì)(用于訓(xùn)練和推理),從現(xiàn)在到 2027 年以 25% 的復(fù)合年增長(zhǎng)率增長(zhǎng),以達(dá)到這一水平。鑒于“Ponte Vecchio”Xe HPC GPU 加速器中的大量矩陣和矢量數(shù)學(xué),以及即將推出的“Sapphire Rapids”Xeon SP CPU 中的 AMX 矩陣數(shù)學(xué)單元中很可能有足夠的推理能力,有理由想知道有多少英特爾預(yù)計(jì)出售的Gaudi訓(xùn)練和Goya 推理芯片。

我們知道,英特爾在 2016 年 8 月完成 3.5 億美元的 Nervana Systems 交易和 2019 年 12 月以 20 億美元收購(gòu) Habana Labs時(shí),是在追求知識(shí)產(chǎn)權(quán)和人才,當(dāng)然,因?yàn)檫@就是這場(chǎng) IT 戰(zhàn)爭(zhēng)的打法,但我們一直想知道如果這些設(shè)備以及來(lái)自競(jìng)爭(zhēng)對(duì)手 GraphCore、Cerebras、SambaNova Systems 和 Groq 的非常優(yōu)雅和有趣的設(shè)計(jì)能夠部署在類(lèi)似于主流的東西中。私募股權(quán)投資者一直渴望搭上這輛 AI 芯汁列車(chē),并進(jìn)行了大量投資,上述四家公司迄今共籌集了 28.7 億美元。

陪審團(tuán)仍未出局,所有這些產(chǎn)品都剛剛起步,這就是為什么英特爾在 Nervana 和 Habana 上對(duì)沖它的賭注,就像它對(duì)數(shù)據(jù)中心中的 FPGA 感到害怕(主要?dú)w功于 Microsoft Azure)并于2015 年 6 月斥資 167 億美元收購(gòu) Altera。在 2015 年到 2020 年間,當(dāng)英特爾在數(shù)據(jù)中心計(jì)算領(lǐng)域占據(jù)主導(dǎo)地位時(shí),它試圖通過(guò) Xeon CPU 計(jì)算來(lái)消除對(duì)其霸權(quán)地位的所有可能威脅,并且它有能力購(gòu)買(mǎi)一些競(jìng)爭(zhēng)對(duì)手。

現(xiàn)在,既然它想起了自己需要再次成為代工廠(chǎng),它就不能再做出如此昂貴的進(jìn)攻演習(xí)了,這些進(jìn)攻實(shí)際上既是防守又是進(jìn)攻。現(xiàn)在是時(shí)候嘗試將其支付給 Nervana 和 Habana 的部分錢(qián)賺回來(lái)了。目前尚不清楚英特爾是否能夠收回所有資金,即使它做出了 23.5 億美元的投資,但正如我們所說(shuō),也許這不是重點(diǎn)。也許關(guān)鍵是要對(duì) GraphCore、Cerebras、SambaNova Systems 和 Groq 進(jìn)行反駁,因?yàn)橛⑻貭栐谄?Xeon SP CPU 中添加了 AI 功能,并在今年推出了其獨(dú)立 GPU。(Wave Computing 籌集了 2.033 億美元用于開(kāi)發(fā)其 AI 芯片,于 2020 年 4 月破產(chǎn),一年后成為 MIPS 芯片技術(shù)的供應(yīng)商,因此我們不再將其視為 AI 芯片的競(jìng)爭(zhēng)者。)

在本周舉行的 Intel Vision 2022 大會(huì)上,Gaudi2 AI 訓(xùn)練芯片是這家芯片制造商推出的新的大型計(jì)算引擎,順便說(shuō)一下,它并不是英特爾實(shí)際制造的芯片,而是與其前身Gaudi1一樣,由競(jìng)爭(zhēng)對(duì)手臺(tái)積電制造。

與 Nervana Systems 一樣,Habana Labs 非常認(rèn)真地創(chuàng)建了一組芯片,為 AI 工作負(fù)載提供最佳性?xún)r(jià)比和最佳性能。Habana Goya HL-1000 推理芯片于 2019 年初發(fā)布Gaudi1 AI 訓(xùn)練芯片,也稱(chēng)為 HL-2000,于當(dāng)年夏天晚些時(shí)候首次亮相。

Gaudi1 架構(gòu)有一個(gè)通用矩陣乘法 (GEMM) 前端,后端有 10 個(gè)張量處理器內(nèi)核或 TPC,該芯片僅向用戶(hù)公開(kāi)了其中的 8 個(gè),以幫助提高封裝的良率。(顯然,在英特爾收購(gòu) Habana Labs 后的某個(gè)時(shí)候,額外的兩個(gè)張量核心暴露出來(lái)了。)

Gaudi1 使用了第二代 TPC,而 Goya HL-1000 AI 推理芯片使用了不那么強(qiáng)大和不那么復(fù)雜的原始 TPC 設(shè)計(jì)。Gadui1 芯片中的 TPC 可使用 C 編程語(yǔ)言直接尋址,具有張量尋址,并支持 BF16 和 FP32 浮點(diǎn)以及 INT8、INT16 和 INT32 整數(shù)格式。TPC 指令集具有加速 Sigmoid、GeLU、Tanh 和其他特殊功能的電路。

Gaudi1 采用 TSMC 的 16 納米工藝實(shí)現(xiàn),具有 24 MB 片上 SRAM、四組 HBM2 內(nèi)存,容量為 32 GB,帶寬為 1 TB/秒。Gaudi1 插入 PCI-Express 4.0 x16 插槽并消耗 350 瓦的電量,并將幾乎所有的電量都轉(zhuǎn)化為熱量,就像芯片一樣。(少量能量用于操作和存儲(chǔ)信息。)

一個(gè)由 8 個(gè) Gaudi2 服務(wù)器組成的集群,每個(gè)服務(wù)器有 8 個(gè) Gaudi2 卡。

英特爾尚未透露對(duì) Gaudi2 架構(gòu)的深入了解,但這就是我們所知道的。

借助 Gaudi2,英特爾正在轉(zhuǎn)向臺(tái)積電的 7 納米工藝,隨著這種微縮,它能夠?qū)⑿酒系?TPC 數(shù)量從 10 個(gè)增加到 24 個(gè),并增加了對(duì) Nvidia 新的 8 位 FP8 數(shù)據(jù)格式的支持。使用 FP8 格式,開(kāi)發(fā)者現(xiàn)在可以擁有相同格式的低分辨率推理數(shù)據(jù)和高分辨率訓(xùn)練數(shù)據(jù),并且在從訓(xùn)練轉(zhuǎn)移到推理時(shí)不必在浮點(diǎn)和整數(shù)之間轉(zhuǎn)換模型。這對(duì) AI 來(lái)說(shuō)是一個(gè)真正的福音,盡管較低精度的整數(shù)格式可能會(huì)在矩陣和矢量計(jì)算引擎中保留多年,以支持遺留代碼和其他類(lèi)型的應(yīng)用程序。

Gaudi2 芯片有 48 MB 的 SRAM——如果它與 TPC 數(shù)量成線(xiàn)性比例,您會(huì)期望 2.4 倍而不是 2 倍的 SRAM,或 57.6 MB。

掛在 Gaudi2 芯片上的是 HBM2e 內(nèi)存組,它提供 2.45 TB/秒的帶寬,是 Gaudi1 芯片的 2.45 倍。HBM2e 內(nèi)存組的數(shù)量沒(méi)有透露,但 Gaudi2 有 6 個(gè) 16 GB HBM2e 組,而 Gaudi1 有 4 個(gè) 8 GB HBM2 組。僅增加兩個(gè) HBM2e 內(nèi)存控制器就可以將帶寬提高 1.33 倍,而剩余的帶寬增加來(lái)自于提高內(nèi)存速度。

Gaudi1 芯片有十個(gè)支持 RoCE 直接內(nèi)存訪(fǎng)問(wèn)協(xié)議的 100 Gb/秒以太網(wǎng)端口——事實(shí)證明,每個(gè) TPC 一個(gè),但我們當(dāng)時(shí)并不知道,因?yàn)橹伙@示了八個(gè)。但 Gaudi2 有 24 個(gè)以太網(wǎng)端口,以 100 Gb/秒的速度運(yùn)行,每個(gè) TPC 也有一個(gè)。它的功率為 650 瓦。我們假設(shè)該設(shè)備插入 PCI-Express 5.0 插槽,但英特爾尚未證實(shí)這一點(diǎn)。

假設(shè)沒(méi)有重大的架構(gòu)變化和工藝從 16 納米縮小到 7 納米并沒(méi)有帶來(lái)時(shí)鐘速度適度提升,我們預(yù)計(jì) Gaudi2 芯片將提供大約 2.5 倍的 Gaudi2 性能。(還假設(shè)任何給定應(yīng)用程序的處理精度相同。)但英特爾實(shí)際上并沒(méi)有說(shuō)明是否有任何架構(gòu)變化(除了添加了一些媒體處理功能)以及時(shí)鐘速度如何變化,所以我們有來(lái)推斷。

我們通過(guò)查看這張關(guān)于 ResNet-50 機(jī)器視覺(jué)訓(xùn)練操作的圖表來(lái)做到這一點(diǎn),該圖表將 Gaudi1 和 Gaudi2 與過(guò)去兩代 Nvidia GPU 加速器進(jìn)行對(duì)比:

fd4026b6-6437-11ed-8abf-dac502259ad0.jpg

根據(jù)這個(gè) ResNet-50 比較,Gaudi2 的性能是 Gaudi1 的 3.2 倍,但很難估計(jì)性能有多少是由于芯片容量的增加。這個(gè)特定的測(cè)試運(yùn)行 TensorFlow 框架來(lái)進(jìn)行圖像識(shí)別訓(xùn)練,顯示的數(shù)據(jù)是每秒處理的圖像數(shù)量。

沒(méi)有顯示但很重要的一件事是 Gaudi2 加速器將如何疊加到 Hopper GPU,但 Nvidia 尚未透露任何特定測(cè)試的性能結(jié)果。但由于 H100 中的 HBM3 內(nèi)存運(yùn)行速度比 A100 加速器中使用的 HBM2e 內(nèi)存快 1.5 倍,而 FP16、TF32 和 FP64 在新張量核心上提供 3 倍的性能,因此可以合理地預(yù)期 H100 將提供介于在 ResNet-50 視覺(jué)訓(xùn)練工作負(fù)載上的性能是 1.5 倍和 3 倍,因此 H100 在 ResNet-50 測(cè)試中每秒可提供 4,395 到 8,790 張圖像的性能。我們的猜測(cè)是,它將比前者更接近后者,并且比英特爾可以通過(guò) Gaudi2 提供的優(yōu)勢(shì)有相當(dāng)大的優(yōu)勢(shì)。

與使用 BERT 模型的自然語(yǔ)言處理相比,圖像識(shí)別和視頻處理相對(duì)容易。以下是 Gaudi2 與 Nvidia V100 和 A100 的對(duì)比,請(qǐng)注意 Gaudi1 的缺失:

fd5b6c82-6437-11ed-8abf-dac502259ad0.jpg

BERT 模型也在 TensorFlow 框架之上運(yùn)行,該數(shù)據(jù)顯示了在兩個(gè)不同的訓(xùn)練階段中每秒吞吐量的序列數(shù)。Habana Labs 部門(mén)的首席商務(wù)官 Eitan Medina 在一次簡(jiǎn)報(bào)中表示,Gaudi2 的性能幾乎是 A100 的 2 倍。但 H100 擁有自己的 FP8 格式和 Transformer 引擎,可以動(dòng)態(tài)地改變 AI 訓(xùn)練工作流程不同部分的數(shù)據(jù)和處理精度,可以做得更好。我們不知道多少,但我們強(qiáng)烈懷疑 Nvidia 至少可以縮小與 Gaudi2 的差距,并且很有可能超越它。

為了讓事情變得有趣,英特爾在 Amazon Web Services 上啟動(dòng)了 DL1 Gaudi1 實(shí)例,然后分別基于 A100 和 V100 GPU 啟動(dòng)了 p4d 和 p3 實(shí)例,并進(jìn)行了一些性?xún)r(jià)比分析以計(jì)算在 ResNet 中識(shí)別的每張圖像的成本-50 基準(zhǔn)??纯催@個(gè):

fd79c632-6437-11ed-8abf-dac502259ad0.jpg

這張圖表的意思是,Gaudi1 的性能略好于 V100——使用英特爾在上圖中針對(duì) ResNet-50 的性能數(shù)據(jù)顯示了 27.3%——而且性?xún)r(jià)比高了大約 60%,這意味著 DL1 實(shí)例的成本大大低于使用 V100 的 p3 實(shí)例。隨著遷移到具有 40 GB HBM2e 內(nèi)存的基于 A100 的 p4d 實(shí)例,Nvidia 設(shè)備在 ResNet-50 上的吞吐量比 Gaudi1 高 58.6%,但 Gaudi1 處理每個(gè)圖像的成本降低了 46%。這意味著 A100 實(shí)例確實(shí)要貴一些。如果我們對(duì) Hopper GPU 加速器定價(jià)的猜測(cè)是正確的,而 Nvidia 對(duì)大約 3 倍的性能收取大約 2 倍的費(fèi)用,英特爾將不得不將出售給 AWS 的 Gaudi2 芯片的價(jià)格保持在 AWS 仍然可以顯示出比運(yùn)行 AI 訓(xùn)練的 H100 實(shí)例更好的性?xún)r(jià)比的地方。

而在這一切中,Trainium 在哪里?

無(wú)論如何,英特爾在其實(shí)驗(yàn)室中運(yùn)行了超過(guò) 1,000 個(gè) Gaudi2,因此它可以調(diào)整 SynapseAI 軟件堆棧,其中包括在 Habana 的圖形編譯器、內(nèi)核庫(kù)和通信庫(kù)上運(yùn)行的 PyTorch 和 TensorFlow 框架。值得一提的是,Gaudi2 芯片現(xiàn)已發(fā)貨。

除了 Gaudi2 芯片,英特爾還在預(yù)覽其 Goya 后續(xù)的 Greco 推理引擎,該引擎也在臺(tái)積電制造。

fd8e111e-6437-11ed-8abf-dac502259ad0.jpg

Greco 推理卡具有 16 GB 的 LPDDR5 主內(nèi)存,提供 204 GB/秒的內(nèi)存帶寬,而之前的 Goya 推理引擎使用 16 GB 的 DDR4 內(nèi)存塊提供 40 GB/秒的內(nèi)存帶寬。Habana 架構(gòu)的這種 Greco 變體支持 INT4、BF16 和 FP16 格式,功耗為 75 瓦,大大低于 2019 年初宣布的 HL-1000 設(shè)備的 200 瓦。如上圖所示,它被壓縮到更緊湊的半高、半長(zhǎng) PCI-Express 卡。目前還沒(méi)有關(guān)于這款產(chǎn)品的性能或價(jià)格的消息。

除了英特爾以外,AMD也更新了GPU產(chǎn)品線(xiàn),以挑戰(zhàn)英偉達(dá)。

AMD 發(fā)布 Radeon RX 6950 XT、6750 XT 和 6650 XT

AMD 今天早上揭開(kāi)了三款新的 Radeon RX 6000 系列顯卡的面紗,以完善其產(chǎn)品堆棧。新的產(chǎn)品涵蓋了從中端到旗艦市場(chǎng)的所有市場(chǎng),其中, Radeon RX 6950 XT、RX 6750 XT 和 RX 6650 XT 將作為 Radeon 系列的中代產(chǎn)品發(fā)布,為 AMD 最重要的顯卡提供最后的性能提升. 利用更新的 18Gbps GDDR6 內(nèi)存以及略微改進(jìn)的時(shí)鐘速度,今天發(fā)布的新卡承諾適度的性能提升,同時(shí)讓 AMD 有機(jī)會(huì)展示他們的 RDNA2 GPU 架構(gòu)在經(jīng)過(guò)近 18 個(gè)月的改進(jìn)后可以做什么。

從高層次上看,這三款新卡都是對(duì) AMD 現(xiàn)有 Radeon RX 6900 XT、RX 6700 XT 和 RX 6600 XT 部件的小更新。為了利用 18Gbps GDDR6 不斷增加的可用性,AMD 選擇將其配備到 RX 6000 系列中的三款最重要的卡上,以便為它們提供適度的內(nèi)存帶寬提升。與此同時(shí),AMD 也在利用這個(gè)機(jī)會(huì)來(lái)提高性能——無(wú)論是形象上還是字面上——稍微提高顯卡的 TDP 以允許稍微更高的 GPU 時(shí)鐘速度。

如前所述,整體變化很小,無(wú)論是在性能還是卡片構(gòu)造方面。除了換成 18Gbps GDDR6 內(nèi)存外,這些更新的規(guī)格都可以通過(guò)當(dāng)前的卡設(shè)計(jì)來(lái)實(shí)現(xiàn),并且沒(méi)有其他硬件變化。與此同時(shí),AMD 自己對(duì)新卡性能提升的估計(jì)約為 5% 到 6%——內(nèi)存帶寬的增加受到 GPU 時(shí)鐘速度的小幅提升的影響。

盡管如此,對(duì)于 AMD 來(lái)說(shuō),這是一個(gè)進(jìn)一步提高他們?cè)谝恍┳钪匾囊曨l卡上的競(jìng)爭(zhēng)定位的機(jī)會(huì)。在當(dāng)前這一代顯卡的最后六個(gè)月左右,領(lǐng)先于 NVIDIA。NVIDIA 早就展示了他們自己的中代產(chǎn)品,如 3080Ti/3070TI 和 3080 12GB,因此 AMD 獲得了可能成為最后一步的優(yōu)勢(shì)(至少在性能上層) 。

更新的 Radeon RX 6000 產(chǎn)品堆棧:擴(kuò)展和退役

這一切發(fā)生的時(shí)機(jī)確實(shí)讓 AMD 無(wú)意中抓住了一把落下的刀,然而,在經(jīng)歷了 18 個(gè)月的挫折之后,顯卡市場(chǎng)終于回歸常態(tài)。由于加密貨幣挖礦盈利能力大幅下降且供應(yīng)情況有所改善,零售視頻卡價(jià)格正在接近其最初的建議零售價(jià)。這對(duì)于游戲玩家、計(jì)算機(jī)科學(xué)家和其他任何想要以(更)合理的價(jià)格購(gòu)買(mǎi)顯卡的人來(lái)說(shuō)都是個(gè)好消息,但對(duì)于 AMD 在嘗試定價(jià)和定位他們的新部件時(shí)會(huì)遇到更多問(wèn)題。AMD 甚至在推出新卡之前就已經(jīng)需要重新定價(jià)一次,而現(xiàn)在這些被設(shè)計(jì)為優(yōu)質(zhì)、高價(jià)產(chǎn)品的卡將面臨更大的市場(chǎng)壓力。

除了將 RX 6950 XT、RX 6750 XT 和 RX 6650 XT 添加到 AMD 龐大的 Radeon RX 6000 系列產(chǎn)品堆棧之外,AMD 還利用這個(gè)機(jī)會(huì)淘汰了顯卡Radeon RX 6600 XT——原本最快的 Navi 23 卡,以及 AMD 中端顯卡努力的基石,最終將不復(fù)存在。該卡在市場(chǎng)上的地位正在被最快的 RX 6650 XT 所取代。

fda7c2d0-6437-11ed-8abf-dac502259ad0.png

除此之外,RX 6900 XT 和 RX 6700 XT 將繼續(xù)生產(chǎn)。盡管最便宜的 6900XT 已經(jīng)達(dá)到 950 美元,但 AMD 及其合作伙伴可能很快就會(huì)發(fā)現(xiàn)自己不得不讓他們的新卡與其他產(chǎn)品堆棧一起降價(jià)。

順便說(shuō)一句,我很高興看到 AMD 對(duì)這些新部件使用了合理的命名系統(tǒng)。將所有新卡指定為 xx50 可以很容易地判斷它們與現(xiàn)有卡有明顯的不同,并且可以很容易地判斷它們?cè)诟蟮漠a(chǎn)品堆棧中的位置。AMD 有 4 位數(shù)字,很高興看到 AMD 至少使用了 3 個(gè)數(shù)字,而不是添加更多的后綴或完全用多種變體重載產(chǎn)品名稱(chēng)。

Radeon RX 6950 XT、RX 9750 XT 和 RX 6650 XT

深入了解規(guī)格,讓我們開(kāi)始研究新卡。

fdbde7d6-6437-11ed-8abf-dac502259ad0.png

從頂部開(kāi)始,我們擁有 AMD 的新旗艦 Radeon RX 6950 XT。這是原始 RX 6900 XT 的增強(qiáng)版,現(xiàn)在是 AMD 產(chǎn)品堆棧中功能最強(qiáng)大的顯卡,也是最昂貴的顯卡。

fdd18994-6437-11ed-8abf-dac502259ad0.png

鑒于最初的 RX 6900 XT 已經(jīng)基于具有 40 個(gè) CU 和 128MB 無(wú)限緩存的完全啟用的 Navi 21 GPU,AMD 除了提高 GPU 和內(nèi)存時(shí)鐘速度之外,幾乎沒(méi)有其他途徑來(lái)提高性能,所以這正是他們的目標(biāo),且已經(jīng)完成了。

除了將顯卡與 16GB 最新的 18Gbps GDDR6 內(nèi)存配對(duì)外,顯卡的 GPU 時(shí)鐘速度也得到了提升;官方游戲時(shí)鐘現(xiàn)在是 2100MHz (+10%),最大加速時(shí)鐘是 2310MHz (+3%)。這使 RX 6950 XT 的內(nèi)存帶寬增加了 12.5%,并且整個(gè) GPU 本身的吞吐量平均提高了幾個(gè)百分點(diǎn)。

為了為這種改進(jìn)的性能買(mǎi)單,AMD 還提高了 TBP。最初的 RX 6900 XT 是 300W 卡,而 RX 6950 XT 在參考規(guī)格下是 335W 卡,董事會(huì)合作伙伴可以隨時(shí)進(jìn)一步提高。AMD 在這一點(diǎn)上處于電壓/頻率曲線(xiàn)的遠(yuǎn)端,雖然提高 TBP 確實(shí)可以通過(guò)讓卡更頻繁地接近其最大 GPU 時(shí)鐘速度來(lái)提高性能,但它們正在逐漸減少此時(shí)返回。所有這些都進(jìn)一步反映在 AMD 的官方性能數(shù)據(jù)中,RX 6950 XT 的著陸速度比原始的 RX 6900 快了約 4%。

關(guān)于這一點(diǎn),值得指出的是,新的 18Gbps GDDR6 也可能是這些新卡 TBP 增加的一個(gè)因素。雖然最新 GDDR6 的電壓保持在 1.35v,但由于支持如此高的信號(hào)速率的電力成本,總體功耗仍會(huì)上升。AMD 沒(méi)有正式公布其顯卡的 GPU 和 DRAM 功耗,但如果在所有其他條件相同的情況下,RX 6950 XT 的 DRAM 功耗比 RX 更高,我一點(diǎn)也不感到驚訝6900 XT。在這一點(diǎn)上,如果 AMD 無(wú)論如何都需要增加 TBP(以保持時(shí)鐘速度恒定),為什么不增加一點(diǎn)以從 GPU 本身中擠出一些額外的空間。

fdeb8498-6437-11ed-8abf-dac502259ad0.png

同時(shí),在 AMD Radeon 產(chǎn)品堆棧的中間位置,我們有 RX 6750 XT 和 RX 6650 XT。與 RX 6950 XT 一樣,這些卡的前身已經(jīng)基于完全啟用的 Navi GPU——分別為 Navi 22 和 Navi 23——因此 AMD 正在轉(zhuǎn)向提高時(shí)鐘速度以提高性能。

fe1a55e8-6437-11ed-8abf-dac502259ad0.png

對(duì)于 RX 6750 XT,與最初的 RX 6700 XT 相比,其最大時(shí)鐘速度已提升至 2600MHz (+

同時(shí),RX 6650 XT 完全取代了原始的 RX 6600 XT,最大時(shí)鐘速度為 2635MHz,游戲時(shí)鐘為 2410MHz,兩者都比原始卡快 2% 左右。而且,盡管 TBP 增加了,內(nèi)存帶寬增加了 12.5%,但它在 AMD 的官方數(shù)據(jù)中顯示出最小的增益,只有 2% 的性能提升。在這種情況下,AMD 不保留原始的 RX 6600 XT 是可以理解的,因?yàn)?RX 6650 XT 的速度不夠快,無(wú)法將自己與舊卡有意義地分開(kāi)。

一旦這些卡開(kāi)始出貨,我們將看到第三方基準(zhǔn)測(cè)試如何發(fā)揮作用,但假設(shè) AMD 的數(shù)據(jù)在這里是準(zhǔn)確的,這證明了他們的片上 Infinity Cache 的價(jià)值。雖然內(nèi)存帶寬幾乎不會(huì)隨著 1 對(duì) 1 性能的提高而增加,但值得注意的是,額外帶寬所增加的性能是多么少 - 或者相反,Navi 23 GPU 已經(jīng)被 16Gbps GDDR6 在 128位內(nèi)存總線(xiàn)。即使只有 32MB 的緩存也在做大量工作來(lái)限制 1080p 的 DRAM 帶寬需求。

最后,與 RX 6950 XT 一樣,這兩張卡的 TBP 也在增加。RX 6750 XT 將搭載 250W 參考 TBP,比原始 RX 6700 XT 高 20W。同時(shí),RX 6650 XT 將調(diào)整為 180W,這也比其前身 RX 6600 XT 高 20W。

驅(qū)動(dòng)程序新聞:隱私視圖和 AMD 超級(jí)分辨率 1.1

在今天的產(chǎn)品公告中,還有一個(gè)關(guān)于 AMD 產(chǎn)品生態(tài)系統(tǒng)驅(qū)動(dòng)程序方面的簡(jiǎn)短更新。

fe45a32e-6437-11ed-8abf-dac502259ad0.jpg

AMD 的 GPU 加速隱私視圖功能,原定于第一季度推出,終于接近發(fā)布,應(yīng)該在本月的驅(qū)動(dòng)程序下降中。同時(shí),根據(jù) AMD 的說(shuō)法,他們基于驅(qū)動(dòng)程序的 AMD 超分辨率技術(shù)的更新版本正在開(kāi)發(fā)中。盡管此時(shí)他們沒(méi)有透露將針對(duì) Super Resolution 1.1 調(diào)整或添加哪些功能。

合作伙伴卡和產(chǎn)品定位

鑒于今天的發(fā)布是對(duì)一些 AMD 現(xiàn)有卡的相對(duì)較小的更新,AMD 及其董事會(huì)合作伙伴正在開(kāi)始使用新卡。除了合作伙伴自己的工作外,AMD 還發(fā)布了 RX 6950 XT 和 RX 6750 XT 參考卡的更新版本。因此,喜歡 AMD 參考設(shè)計(jì)的游戲玩家——甚至只是直接從 AMD 購(gòu)買(mǎi)——將能夠這樣做。

fe56807c-6437-11ed-8abf-dac502259ad0.jpg

與此同時(shí),董事會(huì)合伙人將一如既往地做自己的事情。期望看到庫(kù)存時(shí)鐘和工廠(chǎng)超頻卡的通常組合,董事會(huì)合作伙伴希望從 AMD 的最新硬件中榨取更多。

除了今天發(fā)布的信息之外,AMD 并沒(méi)有向我們提供太多關(guān)于可用性的信息。但考慮到底層 GPU 的生產(chǎn)時(shí)間——以及最近幾周 6900XT/6700XT/6600XT 的可用性——這不應(yīng)該是一個(gè)特別瘋狂或供應(yīng)受限的發(fā)布。在過(guò)去的 18 個(gè)月之后,所有這些都是一個(gè)不錯(cuò)的變化。

盡管當(dāng)原始顯卡最終降到更合理的價(jià)格時(shí),整個(gè)顯卡市場(chǎng)對(duì)新的高價(jià) Radeon 顯卡有多大的胃口還有待觀(guān)察。由于 RX 6800 或 RX 6600 以外的任何產(chǎn)品的供應(yīng)在這一點(diǎn)上基本上不受限制,因此新卡的大部分價(jià)值來(lái)自其略高的性能,這意味著生態(tài)系統(tǒng)沒(méi)有太多回旋余地來(lái)提供更高的性能和價(jià)格?;蛟S AMD 已經(jīng)在采取進(jìn)一步措施來(lái)支撐視頻卡價(jià)格也就不足為奇了,包括即將推出的游戲捆綁優(yōu)惠,盡管它實(shí)際上還沒(méi)有上線(xiàn),但它今天就開(kāi)始了。

值得慶幸的是 ,AMD的競(jìng)爭(zhēng)對(duì)手不是他們自己,而是市場(chǎng)領(lǐng)導(dǎo)者 NVIDIA。盡管 GeForce 卡的價(jià)格也有所下降,但對(duì)挖礦更友好的卡的降價(jià)速度較慢,因此其中許多卡的售價(jià)仍然比原來(lái)的建議零售價(jià)高出不少。因此,AMD 擁有龐大且現(xiàn)在甚至更大的產(chǎn)品堆棧,可以與 NVIDIA 堆棧中的所有產(chǎn)品相媲美——而且就目前而言,它通常具有顯著的價(jià)格優(yōu)勢(shì)。

AMD 認(rèn)為它們也具有性能優(yōu)勢(shì),雖然我非常懷疑 RX 6950 XT 是否會(huì)始終勝過(guò) RTX 3090(AMD 選擇的競(jìng)爭(zhēng)對(duì)手),但 RX 6750 XT 和 RX 6650 XT 相對(duì)于 NVIDIA 的基線(xiàn)表現(xiàn)更好分別是 RTX 3070 和 3060 卡。這次發(fā)布的重點(diǎn)之一是讓事情更上一層樓:讓 AMD 全力以赴,提供新的硬件素材來(lái)展示他們與 NVIDIA 的對(duì)比。

fe65b510-6437-11ed-8abf-dac502259ad0.jpg

總結(jié)一下,期待今天早上在零售貨架上看到新的 Radeon 卡——如果不是更早的話(huà)。

fe790b06-6437-11ed-8abf-dac502259ad0.png

編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1664

    文章

    22513

    瀏覽量

    639619
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5711

    瀏覽量

    140462
  • intel
    +關(guān)注

    關(guān)注

    19

    文章

    3511

    瀏覽量

    191683
  • 機(jī)器視覺(jué)
    +關(guān)注

    關(guān)注

    166

    文章

    4832

    瀏覽量

    126553
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4116

    瀏覽量

    99666

原文標(biāo)題:AMD和Intel發(fā)新芯片,再次挑戰(zhàn)英偉達(dá)

文章出處:【微信號(hào):AI_Architect,微信公眾號(hào):智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    H200之后,美國(guó)AI芯片管制再出“幺蛾子”,英偉達(dá)AMD慌嗎?

    。這意味著英偉達(dá)、AMD 等美國(guó)芯片廠(chǎng)商向全球任何目的地出口 AI 加速器,均需事先獲得美國(guó)政府許可。 ? 美國(guó)政府正在考慮的這項(xiàng)新規(guī),將從根本上改變其在 AI
    的頭像 發(fā)表于 03-07 06:08 ?1.4w次閱讀

    堪稱(chēng)史上最強(qiáng)推理芯片!英偉達(dá)發(fā)布 Rubin CPX,實(shí)現(xiàn)50倍ROI

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)近日,英偉達(dá)在AI infra峰會(huì)上發(fā)布了專(zhuān)為大規(guī)模上下文推理設(shè)計(jì)的全新GPU系列Rubin CPX,性能堪稱(chēng)炸裂! ? 英偉
    的頭像 發(fā)表于 09-11 08:25 ?1.1w次閱讀
    堪稱(chēng)史上最強(qiáng)推理<b class='flag-5'>芯片</b>!<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b><b class='flag-5'>發(fā)布</b> Rubin CPX,實(shí)現(xiàn)50倍ROI

    性能狂飆!AMD新品叫板英偉達(dá)GB200,角逐5000億AI加速器賽道

    AMD線(xiàn)上會(huì)議截圖 本次大會(huì)上,蘇姿豐重點(diǎn)宣布了MI350 系列和 MI400 系列 AI 芯片的強(qiáng)大性能,她表示這些芯片將與英偉達(dá)(Nvi
    的頭像 發(fā)表于 06-14 00:44 ?6631次閱讀
    性能狂飆!<b class='flag-5'>AMD</b>新品<b class='flag-5'>叫板</b><b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>GB200,角逐5000億AI加速器賽道

    鎖定未來(lái)三年合作!“Meta+博通”2nm ASIC芯片開(kāi)造,劍指“英偉達(dá)+AMD”?

    至?2029?年。根據(jù)協(xié)議,Meta?初步承諾將部署高達(dá)?1GW?采用博通技術(shù)的訓(xùn)練與推理專(zhuān)用的?MTIA?芯片,未來(lái)更將把部署規(guī)模擴(kuò)展至數(shù)個(gè)GW。這一長(zhǎng)期綁定,是Meta作為AI巨頭試圖探索更多降低AI領(lǐng)域投入成本,擺脫對(duì)英偉達(dá)
    的頭像 發(fā)表于 04-16 09:06 ?4321次閱讀
    鎖定未來(lái)三年合作!“Meta+博通”2nm ASIC<b class='flag-5'>芯片</b>開(kāi)造,劍指“<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>+<b class='flag-5'>AMD</b>”?

    馬斯克宣布: A15完成設(shè)計(jì),未來(lái)芯片迭代快過(guò)AMD英偉達(dá)

    1 月 18 日,特斯拉首席執(zhí)行長(zhǎng)伊隆·馬斯克(Elon Musk)宣布一項(xiàng)雄心勃勃的人工智能(AI)芯片路線(xiàn)圖,計(jì)劃每九個(gè)月推出新一代 AI 處理器,這個(gè)速度將超越競(jìng)爭(zhēng)對(duì)手英偉達(dá)AMD
    的頭像 發(fā)表于 01-19 10:21 ?1.8w次閱讀
    馬斯克宣布: A15完成設(shè)計(jì),未來(lái)<b class='flag-5'>芯片</b>迭代快過(guò)<b class='flag-5'>AMD</b>和<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>

    英偉達(dá)重磅出手!AI 推理存儲(chǔ)全面覺(jué)醒

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)近日,有消息稱(chēng),英偉達(dá)將以大約200億美元收購(gòu)人工智能芯片初創(chuàng)公司Groq,這將是英偉達(dá)迄今為止規(guī)模最大的一筆
    的頭像 發(fā)表于 12-26 08:44 ?1.2w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>重磅出手!AI 推理存儲(chǔ)全面覺(jué)醒

    黃仁勛:英偉達(dá)AI芯片訂單排到2026年 英偉達(dá)上季營(yíng)收加速增長(zhǎng)62%再超預(yù)期

    AI芯片總龍頭英偉達(dá)的財(cái)報(bào)終于帶來(lái)了驚喜;英偉達(dá)公司發(fā)布財(cái)報(bào)數(shù)據(jù)顯示,上季營(yíng)收加速增長(zhǎng)62%;再
    的頭像 發(fā)表于 11-20 11:36 ?1494次閱讀

    英偉達(dá)發(fā)布 NVQLink 開(kāi)放系統(tǒng)架構(gòu);國(guó)內(nèi)首個(gè)汽車(chē)芯片標(biāo)準(zhǔn)驗(yàn)證平臺(tái)投入使用

    英偉達(dá)發(fā)布 NVQLink 開(kāi)放系統(tǒng)架構(gòu) 在華盛頓特區(qū)舉行的英偉達(dá)全球技術(shù)大會(huì)上,英偉
    發(fā)表于 10-29 10:33 ?1354次閱讀

    英偉達(dá)下一代Rubin芯片已流片

    繼8月底英偉達(dá)透露Rubin架構(gòu)芯片計(jì)劃明年量產(chǎn)后,當(dāng)?shù)貢r(shí)間9月8日的高盛技術(shù)會(huì)議上,英偉達(dá)又談到Rubin的進(jìn)展。
    的頭像 發(fā)表于 09-12 17:15 ?2058次閱讀

    英偉達(dá)最新B30A芯片曝光:算力角逐中的新變數(shù)

    目前允許在中國(guó)銷(xiāo)售的H20型號(hào)。這一消息瞬間點(diǎn)燃了行業(yè)內(nèi)外的關(guān)注熱情,為本就競(jìng)爭(zhēng)激烈的AI芯片領(lǐng)域增添了新的變數(shù)。 ? 架構(gòu)升級(jí):站在巨人肩膀上的革新 B30A芯片將基于英偉達(dá)去年GT
    的頭像 發(fā)表于 08-22 16:41 ?1806次閱讀

    英偉達(dá)被傳暫停生產(chǎn)H20芯片 外交部回應(yīng)

    據(jù)外媒《the Information》在當(dāng)?shù)貢r(shí)間的8月21日下午爆料稱(chēng),英偉達(dá)可能已經(jīng)暫停生產(chǎn)H20芯片。據(jù)稱(chēng),英偉達(dá)已正式下達(dá)指示給到供
    的頭像 發(fā)表于 08-22 15:58 ?3080次閱讀

    今日看點(diǎn)丨消息稱(chēng)智駕基礎(chǔ)芯片配套8GB小容量存儲(chǔ)芯片價(jià)格開(kāi)始暴漲;英偉達(dá)推出具身智能推理模型Cosmos Re

    ? ? 英媒:為拿對(duì)華出口許可證,英偉達(dá)、AMD同意向美國(guó)政府“上貢”15%的收入 據(jù)《金融時(shí)報(bào)》今天(8月11日)披露,為了獲得芯片出口許可證,美國(guó)
    發(fā)表于 08-12 09:41 ?2592次閱讀

    英偉達(dá)被約談!“后門(mén)”風(fēng)險(xiǎn)陰影下,人臉識(shí)別終端為何選國(guó)產(chǎn)芯片

    7月31日消息,為維護(hù)中國(guó)用戶(hù)網(wǎng)絡(luò)安全、數(shù)據(jù)安全,國(guó)家互聯(lián)網(wǎng)信息辦公室已約談英偉達(dá),要求英偉達(dá)公司就對(duì)華銷(xiāo)售的H20算力芯片漏洞后門(mén)安全風(fēng)險(xiǎn)
    的頭像 發(fā)表于 08-08 09:43 ?1034次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>被約談!“后門(mén)”風(fēng)險(xiǎn)陰影下,人臉識(shí)別終端為何選國(guó)產(chǎn)<b class='flag-5'>芯片</b>

    國(guó)家網(wǎng)信辦約談英偉達(dá)

    近日,英偉達(dá)算力芯片被曝出存在嚴(yán)重安全問(wèn)題。此前,美議員呼吁要求美出口的先進(jìn)芯片必須配備“追蹤定位”功能。美人工智能領(lǐng)域?qū)<彝嘎叮?b class='flag-5'>英偉
    的頭像 發(fā)表于 07-31 13:56 ?2874次閱讀
    國(guó)家網(wǎng)信辦約談<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>
    宜昌市| 大理市| 光泽县| 衡东县| 如东县| 布尔津县| 登封市| 武宣县| 旬阳县| 新源县| 大邑县| 万源市| 兴山县| 潞西市| 遂平县| 额济纳旗| 噶尔县| 镶黄旗| 桐乡市| 鲁山县| 广河县| 西丰县| 新化县| 石阡县| 木兰县| 山东| 农安县| 丹江口市| 新蔡县| 康乐县| 大港区| 米脂县| 册亨县| 安西县| 宁化县| 法库县| 祁连县| 瑞安市| 凉城县| 西贡区| 弥渡县|