日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾? AMX助金山云為用戶提供更高效經(jīng)濟(jì)的AI服務(wù),Stable-Di?usion模型推理性能提升近5倍

英特爾中國 ? 來源:未知 ? 2023-08-04 20:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能已經(jīng)成為推動數(shù)字化創(chuàng)新的重要動力,伴隨著 AIGC 等應(yīng)用的快速落地,深度學(xué)習(xí)模型規(guī)模與復(fù)雜度不斷提升,數(shù)據(jù)量也持續(xù)增長,人工智能算力供給與需求之間的矛盾正在日趨凸顯。用戶希望優(yōu)化硬件、軟件和算法,在保證模型精度和時延等指標(biāo)的前提下,提升人工智能端到端流程的性能表現(xiàn),從而充分釋放硬件的潛能,并降低系統(tǒng)總體擁有成本 (TCO),加速人工智能技術(shù)的創(chuàng)新。

生成式人工智能(AIGC) 等創(chuàng)新浪潮驅(qū)動了人工智能的新一輪增長,模型訓(xùn)練和模型推理成為云服務(wù)器的重要負(fù)載。要滿足人工智能領(lǐng)域的市場需求,云服務(wù)提供商需要解決以下挑戰(zhàn):如何加速數(shù)據(jù)清理、模型推理等人工智能端到端工作流程中的多種工作負(fù)載,加快平臺的一站式性能。如何高效使用CPU等現(xiàn)有的硬件資源,并且利用客戶公有云、私有云和混合云中的服務(wù)器資源,以降低硬件成本。如何增強(qiáng)云服務(wù)器的靈活性,使其能夠在復(fù)雜場景中敏捷擴(kuò)展,支撐傳統(tǒng)負(fù)載與人工智能等新型工作負(fù)載高效運行的需求。

為了幫助用戶加速人工智能端到端流程,特別是提升人工智能推理性能,基于第四代英特爾 至強(qiáng) 可擴(kuò)展處理器的金山云第七代性能保障型云服務(wù)器X7進(jìn)行了針對性優(yōu)化。服務(wù)器采用了處理器內(nèi)置的英特爾 高級矩陣擴(kuò)展(英特爾 AMX)加速器,并融合了金山云自主創(chuàng)新的加速技術(shù),能夠有效提高人工智能模型的推理性能,同時發(fā)揮云服務(wù)器在敏捷性、擴(kuò)展性等方面的優(yōu)勢,助力客戶挖掘人工智能時代的價值。

第四代英特爾 至強(qiáng) 及英特爾 AMX使金山云服務(wù)器模型推理性能提升3.97倍 - 4.96倍

金山云第七代性能保障型云服務(wù)器 X7 搭載英特爾 至強(qiáng) 鉑金 8458P 處理器,網(wǎng)絡(luò)帶寬升級至100G,同時支持掛載極速云盤 ESSD ,整體機(jī)型在計算、網(wǎng)絡(luò)、存儲多維度進(jìn)行了深度優(yōu)化,可為用戶提供計算速度更快、網(wǎng)絡(luò)吞吐更大以及存儲更加高效的云服務(wù)。

第四代英特爾 至強(qiáng) 可擴(kuò)展處理器通過創(chuàng)新架構(gòu)增加了每個時鐘周期的指令,每個插槽多達(dá) 60個核心,支持 8 通道DDR5內(nèi)存,有效提升了內(nèi)存帶寬與速度,并通過PCIe 5.0 (80個通道)實現(xiàn)了更高的PCIe帶寬提升。第四代英特爾 至強(qiáng) 可擴(kuò)展處理器提供了出色性能和安全性,可根據(jù)用戶的業(yè)務(wù)需求進(jìn)行擴(kuò)展。借助內(nèi)置的加速器,用戶可以在人工智 能、分析、云和微服務(wù)、網(wǎng)絡(luò)、數(shù)據(jù)庫、存儲等類型的工作負(fù)載中獲得優(yōu)化的性能。通過與強(qiáng)大的生態(tài)系統(tǒng)相結(jié)合,第四代英特爾 至強(qiáng) 可擴(kuò)展處理器能夠幫助用戶構(gòu)建更加高效、安全的基礎(chǔ)設(shè)施。

wKgaomToPQOAVK3pAAKLtfLF2KM098.png

圖:第四代英特爾 至強(qiáng) 可擴(kuò)展處理器

第四代英特爾至強(qiáng)可擴(kuò)展處理器在人工智能性能上更進(jìn)一步,內(nèi)置了創(chuàng)新的英特爾 AMX 加速引擎。英特爾 AMX 針對廣泛的硬件和軟件優(yōu)化,進(jìn)一步增強(qiáng)了前代技術(shù)——矢量神經(jīng)網(wǎng)絡(luò)指令 (VNNI) 和 BF16,從一維向量發(fā)展為二維矩陣,能夠有效利用計算資源,提高高速緩存利用率,以及避免潛在的帶寬瓶頸,從而可顯著增加人工智能應(yīng)用程序的每時鐘指令數(shù) (IPC),為人工智能工作負(fù)載 中的訓(xùn)練和推理帶來顯著的性能提升。

在計算方面,通過采用最新的第四代英特爾至強(qiáng) 可擴(kuò)展處理器,金山云新一代云服務(wù)器X7計算性能較上一代最大提升60%5 ,同時借助內(nèi)置的英特爾AMX 原生人工智能加速能力,大幅提高了云服務(wù)器的整體性能,更加適用于計算密集型、深度學(xué)習(xí)等業(yè)務(wù)場景。 在內(nèi)存方面,金山云新一代云服務(wù)器 X7 支持八通道 DDR5 內(nèi)存,單條內(nèi)存帶寬高達(dá) 4800MT/s,對比上一代實例性能提升50%6 ,更加適用于內(nèi)存計算等數(shù)據(jù)密集型業(yè)務(wù)場景,服務(wù)深度學(xué)習(xí)以及人工智能相關(guān)領(lǐng)域。 在網(wǎng)絡(luò)方面,金山云新一代云服務(wù)器 X7 的物理網(wǎng)絡(luò)升級至 2x 100G,單虛機(jī)內(nèi)網(wǎng)吞吐最高提升至 100G,PPS 提升至最高 2400 萬,連接數(shù)最高支持 400 萬,網(wǎng)絡(luò)性能大幅提升7 在存儲方面,金山云新一代云服務(wù)器 X7 支持掛載極速云盤 ESSD,單盤吞吐最高提升至 4GB/s,IOPS 提升至最高 100 萬,訪問延時降低至 0.2ms ,存儲能力顯著優(yōu)化8

得益于第四代英特爾至強(qiáng) 可擴(kuò)展處理器內(nèi)置的英特爾AMX 技術(shù),金山云新一代云服務(wù)器 X7 加速了人工智能推理性能,并在AIGC等負(fù)載中有著卓越的表現(xiàn)。

金山云測試了金山云新一代云服務(wù)器 X7在Stable-Di?usion模型推理中的性能表現(xiàn)。Stable- Di?usion是一種基于機(jī)器學(xué)習(xí)的生成 式人工智能模型,能夠根據(jù)文本生成高分辨率圖像。Stable-Di?usion一般需要數(shù)秒完成圖片生成,計算量極大,其主要性能瓶頸在多頭注意力計算部分 (MHA)。

第四代英特爾至強(qiáng) 可擴(kuò)展處理器在Stable-Di?usion模型推理中有著卓越的性能表現(xiàn),這源于其在算法上面的優(yōu)化。針對該模型的 MHA 計算瓶頸,英特爾基于PyTorch 優(yōu)化的 Intel-Extension-for-PyTorch (IPEX) 插件在2.0 版本發(fā)布了基于至強(qiáng) 可擴(kuò)展處理器平臺的Flash Attention算法,主要內(nèi)容包括以合適的尺寸拆分矩陣計算,實現(xiàn)更高效的緩存利用;使用張量 AMX- BF16 加速MHA矩陣計算,達(dá)到更快的速度;將計算緩存區(qū)與線程綁定,實現(xiàn)更少的內(nèi)存開銷。

在搭載英特爾至強(qiáng) 鉑金 8458P處理器的金山云新一代云服務(wù)器X7上,雙方對 Stable-Di?usion模型推理性能進(jìn)行了測試。測試數(shù)據(jù)如圖所示,相較優(yōu)化之前的模型,在使用 IPEX 2.0 BF16優(yōu)化之后,Stable-Di?usion模型推理性能提升了3.97倍- 4.96倍9

wKgaomToPQOAKaQFAAFILaX_UTU759.png

圖:Stable-Diffusion 模型優(yōu)化前后性能對比10

賦能云服務(wù)器AI性能提升,英特爾攜手合作伙伴為云上AI用戶提供既高效又經(jīng)濟(jì)的解決方案

云服務(wù)器已經(jīng)成為用戶擴(kuò)展人工智能創(chuàng)新,承載模型訓(xùn)練、模型推理等應(yīng)用需求的重要選擇,通過采用內(nèi)置英特爾AMX 加速器的四代英特爾 至強(qiáng) 可擴(kuò)展處理器,金山云第七代性能保障型云服務(wù)器X7能夠顯著加速AIGC等模型的性能表現(xiàn),在端到端人工智能流程中的優(yōu)勢突出。而且,該方案不需要部署獨立的加速器,因此在經(jīng)濟(jì)性方面有著更佳的表現(xiàn)。具體來講,它為用戶的云上業(yè)務(wù)帶來的收益包括:

更高的性能,能夠滿足廣泛實際應(yīng)用場景的對于性能的需求。特別是在人工智能性能方面,金山云新一代云服務(wù)器 X7 能夠有效加速AIGC等應(yīng)用的運行。 通過英特爾 AMX 的應(yīng)用以及算法優(yōu)化,充分釋放了硬件潛力,有效利用服務(wù)器資源,從而降低了端到端人工智能應(yīng)用流程的TCO。 不受限于特定應(yīng)用類型,能夠靈活應(yīng)對深度學(xué)習(xí)、數(shù)據(jù)庫、高網(wǎng)絡(luò)收發(fā)包等負(fù)載的支撐需求,實現(xiàn)更高的敏捷性與擴(kuò)展性。

在當(dāng)前合作成果的基礎(chǔ)上,英特爾與金山云還將對第七代性能保障型云服務(wù)器X7進(jìn)行進(jìn)一步合作優(yōu)化,包括驗證服務(wù)器在更多場景中的性能表現(xiàn)、通過軟件與算法優(yōu)化進(jìn)一步釋放硬件潛力等,進(jìn)而為用戶提供更加卓越的云服務(wù)。同時,英特爾也將通過更多云服務(wù)合作伙伴,為云上的AI用戶提供更高效、經(jīng)濟(jì)的解決方案。

參考資料:

1 數(shù)據(jù)來源自第四代英特爾 至強(qiáng) 可擴(kuò)展處理器的最大核數(shù)(60 核)與第三代英特爾 至強(qiáng) 可擴(kuò)展處理器的最大核數(shù)(40 核)的比較。

2 詳細(xì)配置信息請訪問:intel.com/processorclaims,選擇 “第四代英特爾 至強(qiáng) 可擴(kuò)展處理器”,查看編號“G2”。實際性能受使用情況、配置和其他因素的差異影響。

3 數(shù)據(jù)來源自第四代英特爾 至強(qiáng) 可擴(kuò)展處理器(80 條 PCIe 5.0 通道)與第三代英特爾 至強(qiáng) 可擴(kuò)展處理器(64 條 PCIe 4.0 通道)的比較。

4詳細(xì)配置信息請訪問:intel.com/processorclaims,選擇 “第四代英特爾 至強(qiáng) 可擴(kuò)展處理器”,查看編號“G1”。實際性能受使用情況、配置和其他因素的差異影響。

5,6,7,8 https://www.ksyun.com/nv/activity/X7launch,截止 2023 年 6 月。

9,10 數(shù)據(jù)援引自截止 2023 年 6 月金山云內(nèi)部測試結(jié)果。測試配置:英特爾 至強(qiáng) 鉑金 8458P 處理器,48vcore,HuggingFace stabilityai/stable-diffusion-2-1。英特爾并不控制或?qū)徲嫷谌綌?shù)據(jù)。請您審查該內(nèi)容,咨詢其他來源,并確認(rèn)提及數(shù)據(jù)是否準(zhǔn)確。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10326

    瀏覽量

    181148
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11335

    瀏覽量

    226005

原文標(biāo)題:英特爾? AMX助金山云為用戶提供更高效經(jīng)濟(jì)的AI服務(wù),Stable-Di?usion模型推理性能提升近5倍

文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    英特爾至強(qiáng)6“芯”動GTC 2026,英偉達(dá)DCG Rubin解鎖系統(tǒng)級性能

    的關(guān)鍵階段,至強(qiáng)系列處理器GPU加速AI系統(tǒng),提供架構(gòu)一致性與強(qiáng)大擴(kuò)展能力所發(fā)揮的重要支撐作用。 英特爾公司副總裁兼數(shù)據(jù)中心戰(zhàn)略項目總經(jīng)理Jeff McVeigh表示: “當(dāng)前,
    的頭像 發(fā)表于 03-19 16:43 ?434次閱讀

    釋放極致游戲性能!英特爾酷睿Ultra 200S Plus發(fā)布

    布:今日,英特爾發(fā)布全新英特爾酷睿Ultra 200S Plus 系列臺式機(jī)處理器——270K ?Plus和 250K Plus,以全新特性和架構(gòu)優(yōu)化,臺式機(jī)用戶
    的頭像 發(fā)表于 03-19 13:13 ?445次閱讀

    英特爾與華陽通用聯(lián)手推出全新AI Box解決方案

    英特爾宣布推出基于最新英特爾 酷睿 Ultra 架構(gòu)的AI Box解決方案,將PC級旗艦算力引入汽車、工業(yè)自動化、軌道交通、機(jī)器人等多種工業(yè)環(huán)境,各行各業(yè)接入
    的頭像 發(fā)表于 03-02 14:15 ?791次閱讀

    發(fā)力圖形工作站和AI推理市場,英特爾大顯存GPU亮相灣芯展

    英特爾發(fā)布了面向?qū)I(yè)的銳炫Pro B50和B60。這兩款顯卡比較RTX2000和5660Ti,有哪些性能上的優(yōu)勢?在支持AI推理工作站和大模型
    的頭像 發(fā)表于 10-22 13:40 ?1.2w次閱讀
    發(fā)力圖形工作站和<b class='flag-5'>AI</b><b class='flag-5'>推理</b>市場,<b class='flag-5'>英特爾</b>大顯存GPU亮相灣芯展

    英特爾助力阿里推出多款實例和存儲方案

    AI時代數(shù)據(jù)爆發(fā)式增長,讓企業(yè)對數(shù)據(jù)的實時處理、深度分析與智能決策等提出了更高要求,同時也對基礎(chǔ)設(shè)施在性能、成本效益上的綜合能力提出了更迫切的需求。
    的頭像 發(fā)表于 10-16 10:22 ?782次閱讀

    到端:英特爾展示全棧AI能力,覆蓋、邊、PC多場景

    2025年9月25日,杭州——今日,在2025云棲大會上,英特爾與阿里帶來了多項基礎(chǔ)設(shè)施創(chuàng)新成果,包括兼容多代際服務(wù)器(支持第五代英特爾
    的頭像 發(fā)表于 09-26 17:27 ?1791次閱讀
    從<b class='flag-5'>云</b>到端:<b class='flag-5'>英特爾</b>展示全棧<b class='flag-5'>AI</b>能力,覆蓋<b class='flag-5'>云</b>、邊、PC多場景

    使用NVIDIA NVLink Fusion技術(shù)提升AI推理性能

    本文詳細(xì)闡述了 NVIDIA NVLink Fusion 如何借助高效可擴(kuò)展的 NVIDIA NVLink scale-up 架構(gòu)技術(shù),滿足日益復(fù)雜的 AI 模型不斷增長的需求。
    的頭像 發(fā)表于 09-23 14:45 ?1166次閱讀
    使用NVIDIA NVLink Fusion技術(shù)<b class='flag-5'>提升</b><b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>

    使用OpenVINO將PP-OCRv5模型部署在Intel顯卡上

    是一個用于優(yōu)化和部署人工智能(AI模型,提升AI推理性能的開源工具集合,不僅支持以卷積神經(jīng)網(wǎng)絡(luò)(CNN)
    的頭像 發(fā)表于 09-20 11:17 ?1447次閱讀
    使用OpenVINO將PP-OCRv<b class='flag-5'>5</b><b class='flag-5'>模型</b>部署在Intel顯卡上

    英特爾Gaudi 2E AI加速器DeepSeek-V3.1提供加速支持

    英特爾? Gaudi 2EAI加速器現(xiàn)已為DeepSeek-V3.1提供深度優(yōu)化支持。憑借出色的性能和成本效益,英特爾Gaudi 2E以更低的投入、
    的頭像 發(fā)表于 08-26 19:18 ?3360次閱讀
    <b class='flag-5'>英特爾</b>Gaudi 2E <b class='flag-5'>AI</b>加速器<b class='flag-5'>為</b>DeepSeek-V3.1<b class='flag-5'>提供</b>加速支持

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級

    租戶環(huán)境提供推理服務(wù),需實現(xiàn)性能隔離與穩(wěn)定擴(kuò)展。面對這一技術(shù)浪潮,深圳市睿海光電科技有限公司(簡稱“睿海光電”)憑借其創(chuàng)新的800G光模塊解決方案,以交付速度比同行快2-3天的硬核實力
    發(fā)表于 08-13 19:01

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    網(wǎng)絡(luò)智能診斷平臺。通過對私有化網(wǎng)絡(luò)數(shù)據(jù)的定向訓(xùn)練,信而泰打造了高性能、高可靠性的網(wǎng)絡(luò)診斷模型,顯著提升AI輔助診斷的精準(zhǔn)度與實用性。該方案實現(xiàn)了網(wǎng)絡(luò)全流量深度解析能力與
    發(fā)表于 07-16 15:29

    主控CPU全能選手,英特爾至強(qiáng)6助力AI系統(tǒng)高效運轉(zhuǎn)

    2025年3月,英偉達(dá)發(fā)布了DGX B300 AI加速計算平臺。2025年5月,英特爾發(fā)布了三款全新英特爾至強(qiáng)6性能核處理器,其中一款677
    的頭像 發(fā)表于 06-27 11:44 ?1062次閱讀
    主控CPU全能選手,<b class='flag-5'>英特爾</b>至強(qiáng)6助力<b class='flag-5'>AI</b>系統(tǒng)<b class='flag-5'>高效</b>運轉(zhuǎn)

    直擊Computex 2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4

    電子發(fā)燒友原創(chuàng)? 章鷹 5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——
    的頭像 發(fā)表于 05-21 00:57 ?7805次閱讀
    直擊Computex 2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b><b class='flag-5'>性能</b>躍升3.4<b class='flag-5'>倍</b>

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——
    的頭像 發(fā)表于 05-20 12:27 ?5714次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b><b class='flag-5'>性能</b>躍升3.4<b class='flag-5'>倍</b>

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    英特爾推出面向準(zhǔn)專業(yè)用戶AI開發(fā)者的英特爾銳炫Pro GPU系列,發(fā)布英特爾? Gaudi 3 AI
    發(fā)表于 05-20 11:03 ?1931次閱讀
    苍溪县| 利津县| 元阳县| 安乡县| 达州市| 南岸区| 登封市| 城固县| 客服| 武宁县| 普陀区| 兴文县| 茂名市| 锡林浩特市| 阿克苏市| 迁安市| 万全县| 澎湖县| 长海县| 胶州市| 中江县| 西林县| 台江县| 蓬溪县| 石台县| 庆城县| 邢台县| 东明县| 鲜城| 伊宁市| 曲水县| 峨眉山市| 梧州市| 红桥区| 郎溪县| 武强县| 富蕴县| 浙江省| 长汀县| 鄯善县| 扶沟县|