日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

重新思考 AI 時代的分布式計算

穎脈Imgtec ? 2025-07-31 14:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

DeepSeek的崛起,不僅因其巨大成就,更因其高效性而在AI行業(yè)引起了震動。雖然大家的關(guān)注重點(diǎn)大都放在DeepSeek僅花費(fèi)了560萬美元的訓(xùn)練成本,而OpenAI花費(fèi)超過1億美元,但其中更深層次的關(guān)注點(diǎn)在于這一效率突破揭示了傳統(tǒng)分布式計算范式與AI工作負(fù)載獨(dú)特需求之間的根本不匹配。

AI技術(shù)浪潮對基礎(chǔ)設(shè)施選型帶來了深層挑戰(zhàn):當(dāng)前廣泛部署的分布式計算架構(gòu)本質(zhì)上仍是為解決20世紀(jì)的大規(guī)模數(shù)據(jù)處理問題而設(shè)計,卻承擔(dān)著運(yùn)行21世紀(jì)AI工作負(fù)載的重任。DeepSeek的突破性實(shí)踐揭示了一個關(guān)鍵命題——業(yè)界需要從根本上重新思考如何實(shí)現(xiàn)AI的分布式計算,其影響將遠(yuǎn)遠(yuǎn)超出訓(xùn)練成本的范疇。


分布式計算與AI發(fā)展不匹配

傳統(tǒng)的分布式計算是基于一些假設(shè)而設(shè)計的,而這些假設(shè)在人工智能時代已不復(fù)存在。不妨想想經(jīng)典的 MapReduce 范式,它徹底改變了大數(shù)據(jù)處理:它擅長處理高度并行的問題,即數(shù)據(jù)可以清晰地分區(qū),并且計算在很大程度上是獨(dú)立的。然而,Transformer 架構(gòu)展現(xiàn)出了截然不同的計算模式。

Transformer 訓(xùn)練在注意力計算過程中涉及密集的、all-to-all的通信模式。每個 token 都可能關(guān)注其他所有 token,從而產(chǎn)生隨序列長度平方增長的通信需求。這與傳統(tǒng)分布式系統(tǒng)處理良好的稀疏、分層通信模式截然相反。注意力機(jī)制的全局依賴性意味著,在傳統(tǒng)分布式工作負(fù)載中行之有效的“分而治之”策略在AI中變得適得其反。

再看內(nèi)存訪問模式,問題更為嚴(yán)重。傳統(tǒng)的分布式計算假設(shè)計算可以與數(shù)據(jù)共存,從而最大限度地減少網(wǎng)絡(luò)流量——這是自集群計算早期以來一直指導(dǎo)系統(tǒng)設(shè)計的原則。但Transformer 架構(gòu)需要在海量參數(shù)空間(有時甚至高達(dá)數(shù)千億個參數(shù))中頻繁同步梯度更新。由此產(chǎn)生的通信開銷可能會占據(jù)總訓(xùn)練時間的大部分,這也解釋了為什么增加更多 GPU 往往會帶來的收益遞減,而非設(shè)計良好的分布式系統(tǒng)所預(yù)期的線性擴(kuò)展。


DeepSeek 效率革命的經(jīng)驗教訓(xùn)

DeepSeek 的成就不僅在于其巧妙的算法,更在于其架構(gòu)選擇能夠更好地契合 AI 工作負(fù)載的特性。其混合專家 (MoE) 方法通過使計算再次稀疏化,從根本上改變了分布式計算方程。MoE 架構(gòu)并非要求每個 GPU 都處理所有參數(shù),而是在每次計算中僅激活模型的子集,從而顯著降低了通信需求。

更有趣的是,DeepSeek 強(qiáng)調(diào)“蒸餾”和強(qiáng)化學(xué)習(xí),而非傳統(tǒng)的監(jiān)督微調(diào),這表明它正在轉(zhuǎn)向更高效的通信訓(xùn)練范式。與監(jiān)督學(xué)習(xí)相比,基于獎勵的強(qiáng)化學(xué)習(xí)可以比需要跨所有節(jié)點(diǎn)緊密同步標(biāo)記訓(xùn)練數(shù)據(jù)的監(jiān)督學(xué)習(xí)更自然地分布。但更深層次的教訓(xùn)并非關(guān)于具體的技術(shù),而是關(guān)于如何將AI工作負(fù)載與分布式系統(tǒng)協(xié)同設(shè)計,而不是強(qiáng)迫AI工作負(fù)載適應(yīng)現(xiàn)有的分布式計算模式。這代表著我們需要從根本上對分布式系統(tǒng)設(shè)計思維方式進(jìn)行轉(zhuǎn)變。


重新思考分布式人工智能系統(tǒng):三個核心原則

如果從頭開始為AI工作負(fù)載設(shè)計分布式計算,會是什么樣子?總的來說可以歸納為以下三個原則:

1. 異步優(yōu)先設(shè)計:傳統(tǒng)參數(shù)服務(wù)器假設(shè)同步更新以保持一致性,這一原則借鑒自數(shù)據(jù)庫系統(tǒng),在數(shù)據(jù)庫系統(tǒng)中,正確性至關(guān)重要。但AI訓(xùn)練本身對某些不一致性具有魯棒性;即使梯度過時,模型也能收斂。采用有限異步可以顯著降低通信開銷,同時保持訓(xùn)練效率。這不僅僅關(guān)乎最終一致性,而是設(shè)計能夠容忍并從受控不一致性中受益的系統(tǒng)。

2. 分層通信模式:AI 原生的分布式系統(tǒng)應(yīng)該利用 Transformer 架構(gòu)中自然的層級結(jié)構(gòu),而非扁平的all-to-all通信。層內(nèi)注意力模式與跨層依賴關(guān)系不同,這為多層通信優(yōu)化提供了機(jī)會。我們需要能夠理解這些計算依賴關(guān)系并相應(yīng)地優(yōu)化通信的分布式系統(tǒng)。

3. 自適應(yīng)資源分配:與資源需求可預(yù)測的傳統(tǒng)工作負(fù)載不同,AI 訓(xùn)練表現(xiàn)出階段依賴性行為。早期訓(xùn)練側(cè)重于學(xué)習(xí)基本模式,對通信精度的要求低于后期的微調(diào)階段。分布式系統(tǒng)應(yīng)該在整個訓(xùn)練過程中調(diào)整其通信策略和資源分配,而不是將其視為靜態(tài)工作負(fù)載。


基礎(chǔ)設(shè)施投資悖論

業(yè)界目前應(yīng)對 AI 擴(kuò)展挑戰(zhàn)的措施,例如 Stargate 宣布的 5000 億美元基礎(chǔ)設(shè)施投資,基本上都遵循著“大同小異”的策略:更大的 GPU 集群、更快的互連速度、更高的內(nèi)存帶寬。雖然有必要,但這種策略治標(biāo)不治本,就像在高速公路上增加車道,卻不解決交通信號燈的配時問題。

如果目前的趨勢持續(xù)下去,AI訓(xùn)練可能會在幾十年內(nèi)消耗掉全球相當(dāng)一部分電力。但能源消耗不僅僅取決于操作次數(shù),它很大程度上受到數(shù)據(jù)移動的影響。在對節(jié)能分布式系統(tǒng)的研究過程中可以觀察到,數(shù)據(jù)移動通常比計算本身消耗的能量高出幾個數(shù)量級。更好的分布式計算架構(gòu)可以最大限度地減少不必要的通信,從而實(shí)現(xiàn)大量的能源節(jié)約,使AI的發(fā)展更具可持續(xù)性。


跨層優(yōu)化:尚未開發(fā)的前沿

最有前景的方法涉及跨層優(yōu)化,而傳統(tǒng)系統(tǒng)在維護(hù)抽象邊界時會避免使用這種優(yōu)化。例如,現(xiàn)代 GPU 支持混合精度計算,但分布式系統(tǒng)很少能夠智能地利用這一能力。梯度更新可能不需要與前向傳播相同的精度,這意味著精度感知通信協(xié)議有機(jī)會將帶寬需求降低 50% 或更多。

同樣,從谷歌的TPU到新興的神經(jīng)形態(tài)芯片,AI專用硬件的興起也帶來了新的分布式計算挑戰(zhàn)。這些架構(gòu)通常具有不統(tǒng)一的內(nèi)存層次結(jié)構(gòu)和專用互連,無法清晰地映射到傳統(tǒng)的分布式計算抽象上。我們需要新的分布式系統(tǒng)設(shè)計,能夠利用這些硬件特定的優(yōu)化,同時保持可移植性。

31a4497c-6dd7-11f0-9080-92fbcf53809c.png

從傳統(tǒng)的基于網(wǎng)格的分布式計算架構(gòu)(左)到AI原生的流暢互連系統(tǒng)設(shè)計(右)的演變??梢暬@示幾何節(jié)點(diǎn)從僵化的層級模式演變?yōu)獒槍I工作負(fù)載通信模式優(yōu)化的自適應(yīng)、密集連接的類神經(jīng)架構(gòu)。


展望:后 GPU 時代

或許最重要的是,我們目前以 GPU 為中心的 AI 基礎(chǔ)設(shè)施觀念可能只是暫時的。隨著我們越來越接近摩爾定律和登納德縮放定律的極限,未來很可能屬于專用的異構(gòu)計算架構(gòu)。量子-經(jīng)典混合系統(tǒng)、神經(jīng)形態(tài)處理器光學(xué)計算平臺將需要全新的分布式計算范式。

在這個過渡中成功的組織將不是那些擁有最多GPU的組織,而是那些最理解如何為AI工作負(fù)載編排復(fù)雜的、異構(gòu)的分布式系統(tǒng)的組織。DeepSeek的效率突破只是一個開始,它表明,架構(gòu)創(chuàng)新并非僅僅是原始計算能力,仍然是AI進(jìn)步的關(guān)鍵。

隨著AI行業(yè)日趨成熟,超越了當(dāng)前“投入更多計算”的階段,分布式系統(tǒng)的基本原則——一致性、可用性、分區(qū)容錯性和效率,將決定哪些方法能夠持續(xù)發(fā)展。未來的道路需要我們摒棄對傳統(tǒng)分布式計算模式的執(zhí)著,擁抱專為 AI 工作負(fù)載優(yōu)化的設(shè)計。這不僅僅是一個優(yōu)化問題,更是對如何為 AI 優(yōu)先的世界構(gòu)建分布式系統(tǒng)的根本性反思。

*本文轉(zhuǎn)自SDNLAB,編譯自 CACM Blog,作者:Akshay Mittal。

原文鏈接:https://cacm.acm.org/blogcacm/rethinking-distributed-computing-for-the-ai-era/


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41315

    瀏覽量

    302690
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    855

    瀏覽量

    3413
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    2022全新版!Java分布式架構(gòu)設(shè)計與開發(fā)實(shí)戰(zhàn)(完結(jié))

    2022全新版!Java分布式架構(gòu)設(shè)計與開發(fā)實(shí)戰(zhàn)(完結(jié)) 分庫分表實(shí)戰(zhàn):Java海量數(shù)據(jù)存儲架構(gòu)設(shè)計 在現(xiàn)代互聯(lián)網(wǎng)應(yīng)用中,隨著業(yè)務(wù)規(guī)模的指數(shù)級增長,數(shù)據(jù)庫性能瓶頸已成為制約系統(tǒng)發(fā)展的關(guān)鍵因素。當(dāng)單
    發(fā)表于 03-30 15:20

    分布式能源管理物聯(lián)網(wǎng)解決方案

    分布式能源系統(tǒng)(如光伏電站、儲能電站等)具有設(shè)備多樣、分布較廣、數(shù)據(jù)量大等特點(diǎn),傳統(tǒng)人工抄表或本地監(jiān)控模式存在數(shù)據(jù)滯后、管理低效、優(yōu)化困難等問題。物通博聯(lián)(WideIOT)結(jié)合邊緣計算與云端協(xié)同技術(shù)
    的頭像 發(fā)表于 01-21 11:39 ?494次閱讀
    <b class='flag-5'>分布式</b>能源管理物聯(lián)網(wǎng)解決方案

    剖析AI分布式KVM系統(tǒng)的革新意義

    。AI技術(shù)的深度融合,不僅解決了傳統(tǒng)系統(tǒng)在復(fù)雜場景下的效率瓶頸,更通過數(shù)據(jù)驅(qū)動、場景感知與自主決策能力,重構(gòu)了人機(jī)協(xié)作的底層邏輯。本文將從技術(shù)演進(jìn)、行業(yè)痛點(diǎn)、應(yīng)用價值三個維度,剖析AI分布式KVM系統(tǒng)的革新意義。
    的頭像 發(fā)表于 11-11 11:28 ?1057次閱讀

    如何解決分布式光伏計量難題?

    分布式光伏成增長主力 據(jù)《2025-2030年中國分布式光伏行業(yè)市場前景預(yù)測及未來發(fā)展趨勢研究報告》顯示,2024年中國分布式光伏新增裝機(jī)118.18GW,同比增長23%,占光伏新增裝機(jī)總量的43
    的頭像 發(fā)表于 11-07 14:55 ?436次閱讀
    如何解決<b class='flag-5'>分布式</b>光伏計量難題?

    全新分布式智慧投屏終端開啟智慧教學(xué)新時代!

    全新分布式智慧教室系統(tǒng)的核心設(shè)備是分布式智慧投屏終端,集無線投屏、白板書寫、多機(jī)聯(lián)動、信息發(fā)布于一體,為老師學(xué)生分組投屏、互動分享提供多屏協(xié)作解決方案。智能書寫功能與方案中多屏互動相輔相成,可隨時以多視窗方式…
    的頭像 發(fā)表于 09-19 11:35 ?983次閱讀
    全新<b class='flag-5'>分布式</b>智慧投屏終端開啟智慧教學(xué)新<b class='flag-5'>時代</b>!

    【節(jié)能學(xué)院】Acrel-1000DP分布式光伏監(jiān)控系統(tǒng)在奉賢平高食品 4.4MW 分布式光伏中應(yīng)用

    摘要:在“雙碳”和新型電力系統(tǒng)建設(shè)背景下,分布式光伏接入比例不斷提高,對配電網(wǎng)電壓、調(diào)度運(yùn)行及調(diào)峰等環(huán)節(jié)造成強(qiáng)烈沖擊。本文設(shè)計包含平臺層、設(shè)備層二層架構(gòu)體系的分布式光伏管控平臺,以及小容量工商業(yè)
    的頭像 發(fā)表于 08-23 08:04 ?3686次閱讀
    【節(jié)能學(xué)院】Acrel-1000DP<b class='flag-5'>分布式</b>光伏監(jiān)控系統(tǒng)在奉賢平高食品 4.4MW <b class='flag-5'>分布式</b>光伏中應(yīng)用

    分布式光伏發(fā)電監(jiān)測系統(tǒng)技術(shù)方案

    分布式光伏發(fā)電監(jiān)測系統(tǒng)技術(shù)方案 柏峰【BF-GFQX】一、系統(tǒng)目標(biāo) :分布式光伏發(fā)電監(jiān)測系統(tǒng)旨在通過智能化的監(jiān)測手段,實(shí)現(xiàn)對分布式光伏電站的全方位、高精度、實(shí)時化管理。該系統(tǒng)能
    的頭像 發(fā)表于 08-22 10:51 ?3504次閱讀
    <b class='flag-5'>分布式</b>光伏發(fā)電監(jiān)測系統(tǒng)技術(shù)方案

    AcrelCloud-1200 分布式光伏運(yùn)維云平臺 用于居民屋頂光伏發(fā)電

    摘要:在當(dāng)今追求綠色可持續(xù)發(fā)展的時代,越來越多的企業(yè)選擇部署分布式光伏系統(tǒng),既響應(yīng)環(huán)保號召,又能降低用電成本。然而,隨著分布式光伏項目規(guī)模的不斷擴(kuò)大,企業(yè)在運(yùn)維管理方面面臨著諸多難題。如何管理
    的頭像 發(fā)表于 08-05 10:48 ?1187次閱讀
    AcrelCloud-1200 <b class='flag-5'>分布式</b>光伏運(yùn)維云平臺 用于居民屋頂光伏發(fā)電

    一鍵部署無損網(wǎng)絡(luò):EasyRoCE助力分布式存儲效能革命

    分布式存儲的性能瓶頸往往在于網(wǎng)絡(luò)。如何構(gòu)建一個高帶寬、超低時延、零丟包的無損網(wǎng)絡(luò),是釋放分布式存儲全部潛力、賦能企業(yè)關(guān)鍵業(yè)務(wù)(如實(shí)時數(shù)據(jù)庫、AI訓(xùn)練、高性能計算)的關(guān)鍵挑戰(zhàn)。
    的頭像 發(fā)表于 08-04 11:34 ?1844次閱讀
    一鍵部署無損網(wǎng)絡(luò):EasyRoCE助力<b class='flag-5'>分布式</b>存儲效能革命

    分布式光伏總出問題?安科瑞分布式光伏監(jiān)控系統(tǒng)來“救場”

    一、分布式光伏的痛點(diǎn)大揭秘 在 “雙碳” 目標(biāo)的大力推動下,分布式光伏作為綠色能源領(lǐng)域的重要力量,正以前所未有的速度蓬勃發(fā)展,越來越多的企業(yè)和家庭選擇安裝分布式光伏系統(tǒng)。然而,隨著分布式
    的頭像 發(fā)表于 07-16 16:50 ?973次閱讀
    <b class='flag-5'>分布式</b>光伏總出問題?安科瑞<b class='flag-5'>分布式</b>光伏監(jiān)控系統(tǒng)來“救場”

    Ceph分布式存儲系統(tǒng)解析

    在當(dāng)今數(shù)據(jù)爆炸的時代,企業(yè)對存儲系統(tǒng)的需求日益增長,傳統(tǒng)的集中式存儲已經(jīng)無法滿足大規(guī)模數(shù)據(jù)處理的要求。分布式存儲系統(tǒng)應(yīng)運(yùn)而生,而Ceph作為開源分布式存儲系統(tǒng)的佼佼者,以其高可用性、高擴(kuò)展性和統(tǒng)一存儲架構(gòu)贏得了眾多企業(yè)的青睞。
    的頭像 發(fā)表于 07-14 11:15 ?1249次閱讀

    雙電機(jī)分布式驅(qū)動汽車高速穩(wěn)定性機(jī)電耦合控制

    摘要:為了利用所設(shè)計的雙電機(jī)防滑差速驅(qū)動系統(tǒng)來提高分布式驅(qū)動汽車的動力學(xué)性能,在前期同軸耦合驅(qū)動控制理論研究的基礎(chǔ)上,開展該車的高速穩(wěn)定性機(jī)電耦合控制研究。建立并驗證包含所設(shè)計驅(qū)動系統(tǒng)在內(nèi)的分布式
    發(fā)表于 06-18 16:37

    訊維AI分布式控制系統(tǒng)的核心優(yōu)勢和應(yīng)用場景

    在數(shù)字化轉(zhuǎn)型的浪潮中,音視頻技術(shù)正從傳統(tǒng)的信號傳輸工具進(jìn)化為智能交互的核心載體。訊維AI分布式可視化控制系統(tǒng)通過深度融合AI技術(shù)與分布式架構(gòu),構(gòu)建了"去中心化節(jié)點(diǎn)+
    的頭像 發(fā)表于 05-26 15:12 ?1288次閱讀

    曙光存儲領(lǐng)跑中國分布式存儲市場

    近日,賽迪顧問發(fā)布《中國分布式存儲市場研究報告(2025)》,指出2024 年中國分布式存儲市場首次超過集中式存儲,規(guī)模達(dá) 198.2 億元,增速 43.7%。
    的頭像 發(fā)表于 05-19 16:50 ?1479次閱讀

    分布式光伏電力問題層出不窮?安科瑞分布式光伏運(yùn)維系統(tǒng)來“救場”

    一、分布式光伏電力運(yùn)維,痛點(diǎn)大揭秘? ? 分布式光伏作為實(shí)現(xiàn)綠色能源轉(zhuǎn)型的關(guān)鍵一環(huán),近年來在我國得到了迅猛發(fā)展。國家能源局?jǐn)?shù)據(jù)顯示,截至 2023 年底,中國分布式光伏電站累計并網(wǎng)容量約為 2.5
    的頭像 發(fā)表于 05-07 17:14 ?1111次閱讀
    <b class='flag-5'>分布式</b>光伏電力問題層出不窮?安科瑞<b class='flag-5'>分布式</b>光伏運(yùn)維系統(tǒng)來“救場”
    修武县| 贺兰县| 湖口县| 耿马| 万宁市| 肃南| 张家口市| 隆子县| 池州市| 邵阳县| 丰原市| 双牌县| 呼图壁县| 威海市| 高雄县| 嘉善县| 滦平县| 衡水市| 三门峡市| 化隆| 台北市| 噶尔县| 临泉县| 无为县| 松桃| 仁怀市| 南安市| 河津市| 卓资县| 延安市| 德庆县| 秀山| 利辛县| 北海市| 桂东县| 潼南县| 电白县| 塔城市| 政和县| 如皋市| 宁陕县|