日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

異構(gòu)混訓(xùn)整合不同架構(gòu)芯片資源,提高算力利用率

Carol Li ? 來(lái)源:電子發(fā)燒友 ? 作者:李彎彎 ? 2024-07-18 00:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)隨著AI技術(shù)的飛速發(fā)展,大模型的訓(xùn)練和推理任務(wù)對(duì)算力的需求日益增長(zhǎng)。然而,單一品牌的芯片往往難以滿足所有需求,且可能存在供應(yīng)鏈風(fēng)險(xiǎn)。因此,異構(gòu)芯片混訓(xùn)成為了一種重要的解決方案。通過(guò)混合使用多種異構(gòu)芯片,可以充分利用不同芯片的優(yōu)勢(shì),提高算力利用率,降低算力成本,并推動(dòng)AI技術(shù)的廣泛應(yīng)用。

異構(gòu)混訓(xùn)能夠整合不同架構(gòu)芯片資源

在2024年世界人工智能大會(huì)AI基礎(chǔ)設(shè)施論壇上,無(wú)問(wèn)芯穹聯(lián)合創(chuàng)始人兼CEO夏立雪發(fā)布了全球首個(gè)千卡規(guī)模異構(gòu)芯片混訓(xùn)平臺(tái),千卡異構(gòu)混合訓(xùn)練集群算力利用率最高達(dá)到了97.6%。

同時(shí),無(wú)問(wèn)芯穹Infini-AI云平臺(tái)已集成大模型異構(gòu)千卡混訓(xùn)能力,是全球首個(gè)可進(jìn)行單任務(wù)千卡規(guī)模異構(gòu)芯片混合訓(xùn)練的平臺(tái),具備萬(wàn)卡擴(kuò)展性,支持包括AMD、華為昇騰、天數(shù)智芯、沐曦、摩爾線程、NVIDIA六種異構(gòu)芯片在內(nèi)的大模型混合訓(xùn)練。通過(guò)Infini-AI云平臺(tái),用戶可以在異構(gòu)算力資源上實(shí)現(xiàn)高效的模型訓(xùn)練和推理,從而加速AI應(yīng)用的開(kāi)發(fā)和部署。

據(jù)稱,已有智譜AI、月之暗面、生數(shù)科技等大模型公司客戶在Infini-AI上穩(wěn)定使用異構(gòu)算力,還有20余家AI Native應(yīng)用創(chuàng)業(yè)公司在Infini-AI上持續(xù)調(diào)用各種預(yù)置模型。

異構(gòu)混訓(xùn)平臺(tái)具有多樣化算力資源、高效算力分配、靈活性與可擴(kuò)展性、降低總體擁有成本(TCO)、推動(dòng)技術(shù)創(chuàng)新和生態(tài)整合等特點(diǎn)。

具體來(lái)看,異構(gòu)混訓(xùn)平臺(tái)能夠整合來(lái)自不同廠商、不同架構(gòu)的芯片資源,這些芯片在各自擅長(zhǎng)的領(lǐng)域具有不同的性能優(yōu)勢(shì)。通過(guò)智能的調(diào)度算法和任務(wù)分發(fā)機(jī)制,異構(gòu)混訓(xùn)平臺(tái)能夠根據(jù)任務(wù)的特性和需求,將最適合的算力資源分配給相應(yīng)的芯片,從而實(shí)現(xiàn)算力資源的最大化利用。

異構(gòu)混訓(xùn)平臺(tái)支持多種芯片和算法的組合使用,能夠靈活應(yīng)對(duì)不同規(guī)模、不同復(fù)雜度的訓(xùn)練任務(wù)。同時(shí),它也具備較高的可擴(kuò)展性,能夠根據(jù)實(shí)際需求進(jìn)行算力資源的動(dòng)態(tài)擴(kuò)展。通過(guò)整合不同架構(gòu)的芯片資源,避免對(duì)單一硬件平臺(tái)的過(guò)度依賴,異構(gòu)混訓(xùn)平臺(tái)能夠降低供應(yīng)鏈風(fēng)險(xiǎn),并通過(guò)提高算力利用率和訓(xùn)練效率來(lái)降低總體擁有成本。

異構(gòu)混訓(xùn)平臺(tái)為AI技術(shù)創(chuàng)新提供了更加廣闊的舞臺(tái),通過(guò)整合不同芯片和算法的優(yōu)勢(shì)資源,可以激發(fā)更多的創(chuàng)新靈感和技術(shù)突破。同時(shí),它也有助于打破不同硬件生態(tài)系統(tǒng)之間的壁壘,促進(jìn)生態(tài)整合與協(xié)同發(fā)展。

異構(gòu)混訓(xùn)在AI領(lǐng)域的需求日益凸顯

近年來(lái),隨著人工智能技術(shù)的不斷發(fā)展,大模型的參數(shù)量急劇增加,從十億、百億到千億甚至萬(wàn)億級(jí)別。以ChatGPT、LLama等為代表的大模型技術(shù)正持續(xù)推動(dòng)社會(huì)變革,引發(fā)新一輪人工智能熱潮。這些大模型具有數(shù)千億甚至上萬(wàn)億參數(shù)規(guī)模,單個(gè)計(jì)算節(jié)點(diǎn)無(wú)法滿足訓(xùn)練需求,訓(xùn)練過(guò)程耗時(shí)巨大。

面對(duì)如此龐大的模型,傳統(tǒng)的同構(gòu)算力集群已經(jīng)無(wú)法滿足訓(xùn)練需求。即使采用分布式訓(xùn)練框架,也需要充分整合可調(diào)動(dòng)的算力資源進(jìn)行分布式并行加速。然而,由于不同廠商的智算芯片之間存在計(jì)算架構(gòu)、緩存資源、互聯(lián)方式等諸多差異,以及AI計(jì)算框架與各廠商基礎(chǔ)軟件棧深度綁定,導(dǎo)致多種智算芯片難以協(xié)同工作,限制了算力資源的充分利用。

異構(gòu)芯片混訓(xùn)成了解決算力限制的重要方式,目前已經(jīng)有諸多應(yīng)用案例。如,醫(yī)療機(jī)構(gòu)采用異構(gòu)芯片混訓(xùn)平臺(tái),將NVIDIA GPU、Intel CPU以及華為昇騰AI處理器等多種芯片混合使用。通過(guò)平臺(tái)的高效調(diào)度和算力分配,實(shí)現(xiàn)了對(duì)醫(yī)學(xué)影像數(shù)據(jù)的快速處理和分析。

異構(gòu)芯片混訓(xùn)平臺(tái)能夠顯著提高了醫(yī)療影像分析系統(tǒng)的處理速度和精度,為醫(yī)生提供了更加準(zhǔn)確和及時(shí)的診斷支持。

自動(dòng)駕駛汽車研發(fā)公司采用異構(gòu)芯片混訓(xùn)平臺(tái),將AMD GPU、NVIDIA GPU以及專用AI加速器等多種芯片混合使用。通過(guò)平臺(tái)的異構(gòu)并行訓(xùn)練能力,實(shí)現(xiàn)了對(duì)自動(dòng)駕駛算法模型的高效訓(xùn)練和優(yōu)化。

異構(gòu)芯片混訓(xùn)平臺(tái)能顯著提高自動(dòng)駕駛算法模型的訓(xùn)練速度和精度,為自動(dòng)駕駛汽車的研發(fā)提供了有力支持。同時(shí),通過(guò)降低算力成本和提高資源利用率,也可以幫助公司加快自動(dòng)駕駛技術(shù)的商業(yè)化進(jìn)程。

寫(xiě)在最后

當(dāng)然,在異構(gòu)芯片混訓(xùn)過(guò)程中,可能會(huì)面臨一些技術(shù)挑戰(zhàn),如不同芯片間的通信問(wèn)題、性能差異等。為了解決這些問(wèn)題,可以采取相應(yīng)的措施,如建立通用的集合通信庫(kù),實(shí)現(xiàn)不同種芯片的高效通信,兼容多種硬件;提出基于流水線并行的非均勻拆分方案,解決不同硬件效率不一樣的問(wèn)題,針對(duì)自身情況分配最適合的任務(wù)等。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41315

    瀏覽量

    302694
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1697

    瀏覽量

    16838
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3797

    瀏覽量

    5279
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    天數(shù)智芯助力DeepLink異構(gòu)訓(xùn)推一體化升級(jí)

    當(dāng)前,通用人工智能發(fā)展駛?cè)肟燔嚨?,大模型?duì)的需求呈現(xiàn)爆發(fā)式增長(zhǎng),異構(gòu)的高效協(xié)同成為釋放
    的頭像 發(fā)表于 03-26 09:30 ?459次閱讀
    天數(shù)智芯助力DeepLink<b class='flag-5'>異構(gòu)</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>訓(xùn)</b>推一體化升級(jí)

    基于Arm架構(gòu)服務(wù)器釋放更高CPU利用率

    在大型云服務(wù)提供商的數(shù)據(jù)中心中,CPU 利用率長(zhǎng)期偏低,造成了大量資源閑置。根據(jù) CAST AI 的分析,超過(guò) 1,000 個(gè) CPU 的大型集群平均占用率僅約 17%[1],不同云服務(wù)商之間略有差異,但這一數(shù)據(jù)仍具有一定代表性
    的頭像 發(fā)表于 03-24 10:19 ?572次閱讀

    GPU 利用率<30%?這款開(kāi)源智云平臺(tái)讓不浪費(fèi) 1%

    作為 AI 開(kāi)發(fā)者,你是否早已受夠這些困境:花數(shù)百萬(wàn)采購(gòu)的 GPU 集群,利用率常年低于 30%,閑置如同燒錢;跨 CPU/GPU/NPU 異構(gòu)
    的頭像 發(fā)表于 01-26 14:20 ?297次閱讀

    華為發(fā)布AI容器技術(shù)Flex:ai,平均利用率提升30%

    決方案。 ? 當(dāng)前,AI產(chǎn)業(yè)正處于高速發(fā)展的黃金時(shí)期,海量需求如潮水般涌來(lái)。然而,資源利用率
    的頭像 發(fā)表于 11-26 08:31 ?7824次閱讀

    湘軍,讓變成生產(chǎn)

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    從CPU、GPU到NPU,美格智能持續(xù)優(yōu)化異構(gòu)計(jì)算效能

    前言AI已成為數(shù)字經(jīng)濟(jì)時(shí)代的核心生產(chǎn),但全球AI產(chǎn)業(yè)正面臨“供給不足、成本高企、生態(tài)待建”三重挑戰(zhàn)。據(jù)行業(yè)統(tǒng)計(jì),行業(yè)
    的頭像 發(fā)表于 11-21 16:05 ?1344次閱讀
    從CPU、GPU到NPU,美格智能持續(xù)優(yōu)化<b class='flag-5'>異構(gòu)</b><b class='flag-5'>算</b><b class='flag-5'>力</b>計(jì)算效能

    國(guó)產(chǎn)AI芯片真能扛住“內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?

    反而壓到了310W。更有意思的是它的異構(gòu)架構(gòu):NPU+CPU+DVPP的組合,居然能同時(shí)扛住訓(xùn)練和推理場(chǎng)景,之前做自動(dòng)駕駛算法時(shí),用它跑模型時(shí)延直接降了20%。 但疑惑也有:這種密度下,散熱怎么解決?而且昇騰的生態(tài)適配速度能
    發(fā)表于 10-27 13:12

    中科曙光超智融合方案助力國(guó)產(chǎn)中心建設(shè)

    近期,位于魯中南地區(qū)的某大型中心正式啟動(dòng)建設(shè),標(biāo)志著國(guó)產(chǎn)技術(shù)在該區(qū)域數(shù)字經(jīng)濟(jì)中的重要突破。該中心采用中科曙光“超智融合”方案,實(shí)現(xiàn)
    的頭像 發(fā)表于 07-31 17:13 ?1906次閱讀

    立訊技術(shù)解讀ETH-X超節(jié)點(diǎn)高速互連技術(shù)的現(xiàn)狀與未來(lái)

    當(dāng)前,人工智能技術(shù)驅(qū)動(dòng)全球數(shù)據(jù)中心向智中心加速演進(jìn),傳統(tǒng)架構(gòu)在承載AI大模型訓(xùn)練時(shí)暴露出顯著瓶頸--資源調(diào)度碎片化、異構(gòu)
    的頭像 發(fā)表于 07-03 09:44 ?2763次閱讀
    立訊技術(shù)解讀ETH-X超節(jié)點(diǎn)高速互連技術(shù)的現(xiàn)狀與未來(lái)

    海光DCU率先展開(kāi)文心系列模型的深度技術(shù)合作 FLOPs利用率(MFU)達(dá)47%

    列模型的深度技術(shù)適配,預(yù)訓(xùn)練模型FLOPs利用率(MFU)達(dá)到47%,在多個(gè)文本與多模態(tài)基準(zhǔn)測(cè)試中取得SOTA水平。此次合作標(biāo)志著國(guó)產(chǎn)基礎(chǔ)設(shè)施與大模型技術(shù)的協(xié)同創(chuàng)新進(jìn)入新階段。 技術(shù)突破:
    的頭像 發(fā)表于 07-01 14:35 ?2582次閱讀

    潤(rùn)和軟件發(fā)布StackRUNS異構(gòu)分布式推理框架

    當(dāng)下,AI模型規(guī)模持續(xù)膨脹、多模態(tài)應(yīng)用場(chǎng)景日益復(fù)雜,企業(yè)正面臨異構(gòu)資源碎片化帶來(lái)的嚴(yán)峻挑戰(zhàn)。為應(yīng)對(duì)行業(yè)痛點(diǎn),江蘇潤(rùn)和軟件股份有限公司(以下簡(jiǎn)稱“潤(rùn)和軟件”)正式發(fā)布自主研發(fā)的Sta
    的頭像 發(fā)表于 06-13 09:10 ?1623次閱讀
    潤(rùn)和軟件發(fā)布StackRUNS<b class='flag-5'>異構(gòu)</b>分布式推理框架

    AIGC基礎(chǔ)設(shè)施技術(shù)架構(gòu)與行業(yè)實(shí)踐

    AIGC基礎(chǔ)設(shè)施技術(shù)架構(gòu)與行業(yè)實(shí)踐 一、硬件層:AI的物理載體 芯片技術(shù)升級(jí)? 國(guó)際前沿
    的頭像 發(fā)表于 05-29 07:44 ?1146次閱讀
    AIGC<b class='flag-5'>算</b><b class='flag-5'>力</b>基礎(chǔ)設(shè)施技術(shù)<b class='flag-5'>架構(gòu)</b>與行業(yè)實(shí)踐

    壁仞科技擔(dān)任智集群異構(gòu)訓(xùn)工作組組長(zhǎng)

    參與了本次交流,分享智集群異構(gòu)訓(xùn)的關(guān)鍵技術(shù)進(jìn)展、成功落地案例,為突破大模型異構(gòu)
    的頭像 發(fā)表于 05-27 16:55 ?1306次閱讀

    拼版怎么拼好,板廠經(jīng)常說(shuō)利用率太低,多收費(fèi)用?

    做板的時(shí)候,板廠經(jīng)常說(shuō)我拼版利用率太低,要多收取費(fèi)用,哪位大神知道怎么利用率
    發(fā)表于 05-14 13:42

    mes工廠管理系統(tǒng):如何讓設(shè)備利用率提升50%?

    在制造業(yè)競(jìng)爭(zhēng)日益激烈的今天,設(shè)備利用率直接決定了企業(yè)的盈利能力。許多工廠管理者都在思考同一個(gè)問(wèn)題:如何在不增加設(shè)備投資的情況下,讓現(xiàn)有產(chǎn)能發(fā)揮出最大價(jià)值?MES工廠管理系統(tǒng)正是解決這一難題的金鑰匙
    的頭像 發(fā)表于 05-09 15:55 ?989次閱讀
    mes工廠管理系統(tǒng):如何讓設(shè)備<b class='flag-5'>利用率</b>提升50%?
    丰镇市| 石台县| 山东省| 汶川县| 九龙城区| 通江县| 曲周县| 丘北县| 岑溪市| 淮安市| 乌拉特前旗| 宁国市| 南昌县| 永登县| 乌苏市| 铜陵市| 新野县| 凌云县| 凉山| 浏阳市| 西林县| 高台县| 哈巴河县| 四川省| 奈曼旗| 正定县| 渭源县| 博野县| 乌兰察布市| 贵定县| 沙洋县| 临西县| 贺兰县| 平武县| 台北县| 潞西市| 连城县| 游戏| 兖州市| 新晃| 托里县|