日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為網(wǎng)絡(luò)管理員導(dǎo)航生成式 AI

NVIDIA英偉達(dá) ? 來源:未知 ? 2023-06-19 19:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

眾所周知,人工智能正在改變世界。對于網(wǎng)絡(luò)管理員而言,人工智能可以以一些令人驚嘆的方式改善日常運(yùn)營:

  • 重復(fù)性任務(wù)的自動化:這包括監(jiān)控、故障排除和升級,可以節(jié)省時間,同時降低人為錯誤的風(fēng)險(xiǎn)。

  • 網(wǎng)絡(luò)安全:人工智能可以幫助實(shí)時檢測和應(yīng)對安全威脅。例如,NVIDIA Morpheus 使網(wǎng)絡(luò)安全開發(fā)者能夠創(chuàng)建經(jīng)過優(yōu)化的實(shí)時數(shù)據(jù) AI 流水線。

  • 拓?fù)鋬?yōu)化:借助合適的遙測技術(shù),人工智能可以分析流量模式并提出更改建議,從而優(yōu)化網(wǎng)絡(luò)性能。

  • 主動式網(wǎng)絡(luò)規(guī)劃:人工智能可以使用同樣的高級網(wǎng)絡(luò)遙測技術(shù)來評估趨勢,以預(yù)測潛在問題,并在問題發(fā)生之前提出更改建議,從而避免問題的發(fā)生。

然而,人工智能無法取代經(jīng)驗(yàn)豐富的網(wǎng)絡(luò)管理員的專業(yè)知識。人工智能旨在增強(qiáng)您的能力,就像一個虛擬助理一樣。因此,人工智能可能會成為您最好的朋友,但生成式 AI 是一種新的數(shù)據(jù)中心工作負(fù)載,它帶來了新的范式轉(zhuǎn)變:NVIDIA 集合通信庫(NCCL)。

數(shù)據(jù)中心的演變

網(wǎng)絡(luò)管理員不得不處理許多其他近期更改:

  • 如何配置網(wǎng)絡(luò)

  • 如何監(jiān)控和管理網(wǎng)絡(luò)

  • 如何設(shè)計(jì)網(wǎng)絡(luò)

  • 網(wǎng)絡(luò)上的協(xié)議和工作負(fù)載

不久前,我們可能已經(jīng)通過特定網(wǎng)絡(luò)命令行界面(CLI)的專業(yè)水平來衡量新網(wǎng)絡(luò)管理員的價(jià)值。隨著混合云計(jì)算和 DevOps 的出現(xiàn),從 CLI 到 API 的轉(zhuǎn)變也在不斷發(fā)展。

甚至您監(jiān)控和管理網(wǎng)絡(luò)的方式也發(fā)生了變化。您已經(jīng)從使用 SNMP 和 NetFlow 在數(shù)據(jù)中心輪詢設(shè)備的工具轉(zhuǎn)向了新的基于交換機(jī)的遙測模型,在該模型中,交換機(jī)會主動以流式傳輸提供基于流的診斷詳細(xì)信息。

您可以實(shí)操將新的工作負(fù)載引入數(shù)據(jù)中心,其中許多數(shù)據(jù)中心都有獨(dú)特的網(wǎng)絡(luò)需求。您已經(jīng)看到傳統(tǒng)數(shù)據(jù)庫被數(shù)據(jù)分析和大數(shù)據(jù)集群所取代。

現(xiàn)在,當(dāng)被要求構(gòu)建人工智能集群時,人們很容易認(rèn)為人工智能只是一個規(guī)模更大、速度更快的大數(shù)據(jù)應(yīng)用程序。但人工智能是不同的,如果沒有合適的工具,人工智能可能會很難實(shí)現(xiàn)。

生成式 AI 和 NCCL 的影響

您是一家大型企業(yè)的網(wǎng)絡(luò)管理員。您的 CTO 參加了 GTC 2023,并了解了生成式 AI 他們希望通過構(gòu)建像 ChatGPT 這樣的大型語言模型來響應(yīng)最終用戶,并與最終用戶進(jìn)行交互,從而改變業(yè)務(wù)運(yùn)營方式。該模型必須經(jīng)過訓(xùn)練。這需要一個大型人工智能訓(xùn)練集群,許多 GPU 加速的服務(wù)器通過高速網(wǎng)絡(luò)連接。

這個人工智能訓(xùn)練集群帶來了許多新的挑戰(zhàn):

  • 網(wǎng)絡(luò)流量模式和流量特性發(fā)生了顯著變化,而傳統(tǒng) ECMP 表現(xiàn)不佳。

  • AI 集群參考設(shè)計(jì)需要用于計(jì)算/ GPU 、存儲甚至帶內(nèi)管理的專用網(wǎng)絡(luò)。

  • 網(wǎng)絡(luò)流量是異構(gòu)的,生成由 CPU 到 CPU 和 GPU 到 GPU 通信。

  • 人工智能集群必須能夠適應(yīng)在一臺服務(wù)器上、多臺服務(wù)器上運(yùn)行作業(yè),甚至是在一臺計(jì)算機(jī)上同時運(yùn)行多個作業(yè)。

  • 網(wǎng)絡(luò)配置發(fā)生變化,參數(shù)可優(yōu)化 RoCE 和 GPU 直接通信。

  • 人工智能作業(yè)必須在多次迭代中具有一致且可預(yù)測的作業(yè)完成時間。

  • 具有更高帶寬交換機(jī)的新型扁平化拓?fù)洹?/p>

  • 需要學(xué)習(xí)的新縮寫詞:CUDA、NVIDIA DOCA、BERT、LLM、DLRM 和 NCCL。

  • 新的監(jiān)控工具:他們?nèi)绾沃?AI 和 NCCL 是否表現(xiàn)良好?

那么,什么是 NCCL?以下是教科書般的答案:

NVIDIA Collective Communication Library(NCCL)實(shí)現(xiàn)了針對 NVIDIA GPU 和網(wǎng)絡(luò)優(yōu)化的多 GPU 和多節(jié)點(diǎn)通信原語。NCCL 提供了諸如 all-gather、all-reduce、broadcast、reduce 和 reduce-scatter 以及點(diǎn)對點(diǎn)發(fā)送和接收之類的例程,這些例程經(jīng)過優(yōu)化,可通過節(jié)點(diǎn)內(nèi)的 PCIe 和 NVLink 高速互連以及節(jié)點(diǎn)間的 NVIDIA 網(wǎng)絡(luò)實(shí)現(xiàn)高帶寬和低延遲。

資料來源:

NVIDIA Collective Communication Library (NCCL)


對于網(wǎng)絡(luò)管理員,NCCL 負(fù)責(zé)控制全新 AI 集群的流量模式。這意味著您需要針對 NCCL 進(jìn)行優(yōu)化的網(wǎng)絡(luò)設(shè)計(jì)、針對 NCCL 優(yōu)化的網(wǎng)絡(luò)監(jiān)控工具以及針對 NCCL 優(yōu)化的以太網(wǎng)交換機(jī)。

NCCL 是實(shí)現(xiàn) AI 集群上運(yùn)行的工作負(fù)載的高性能、一致性和可預(yù)測性的關(guān)鍵。NCCL 也是一個交匯點(diǎn):網(wǎng)絡(luò)管理員和數(shù)據(jù)科學(xué)家都必須講出并理解它。當(dāng)他們都能流利地講出它時,NCCL 可以成為這些具有不同所需技能的專業(yè)人士之間的共同語言。

鑒于 NCCL 的重要性,合適的網(wǎng)絡(luò)可以決定和突破 AI 集群的性能。人工智能集群有一些獨(dú)特的要求:

  • 抗噪能力強(qiáng)

  • 對故障具有彈性

  • 導(dǎo)軌優(yōu)化拓?fù)?/p>

  • 無損網(wǎng)絡(luò)轉(zhuǎn)發(fā)

  • 性能隔離

  • 無阻塞網(wǎng)絡(luò)架構(gòu)

那么,接下來是什么呢?

您的工作是防止網(wǎng)絡(luò)減緩人工智能集群的速度,但人工智能網(wǎng)絡(luò)需要什么?高帶寬、低延遲和高彈性是必要的,但還不夠。您將如何選擇合適的基礎(chǔ)設(shè)施?

  • 基于產(chǎn)品手冊?并不完全。

  • 根據(jù)供應(yīng)商告訴您的?有點(diǎn)冒險(xiǎn),因?yàn)樗麄兿胭u給您一些東西。

  • 基于數(shù)據(jù)科學(xué)家們所要求的?他們不是網(wǎng)絡(luò)專家,所以大多數(shù)人都不知道。

  • 基于經(jīng)驗(yàn)豐富的網(wǎng)絡(luò)管理員的建議?很有可能他們認(rèn)為是 CPU,而不是 GPU,并且需求已經(jīng)發(fā)生了變化。

人工智能的網(wǎng)絡(luò)可能很難。“沒有人會因?yàn)橘徺I X 而被解雇”這句格言與摩爾定律一樣過時,因?yàn)槿斯ぶ悄艿?X 因素與通用計(jì)算不同。即使是擁有專門的人工智能工程團(tuán)隊(duì)來預(yù)先測試集群性能的大型 IT 供應(yīng)商,當(dāng)性能隨著更多用戶的添加和多個作業(yè)的同時運(yùn)行而急劇下降時,也會經(jīng)常感到驚訝。

保證人工智能集群性能的最佳方法是遵循 NVIDIA 發(fā)布的人工智能參考架構(gòu)之一,并使用具有人工智能可見性功能的基礎(chǔ)設(shè)施來驗(yàn)證您的人工智能集群的健康狀況和供給情況。

無論您的人工智能集群使用以太網(wǎng)還是 InfiniBand,NVIDIA 都會為您提供所需的工具、支持和培訓(xùn),以使您成功并成為人工智能網(wǎng)絡(luò)專家。

掃描下方二維碼查看更多有關(guān) NVIDIA 集合通信庫(NCCL)的信息。

921c3bec-0e8f-11ee-962d-dac502259ad0.png


9238495e-0e8f-11ee-962d-dac502259ad0.gif ?

更多精彩內(nèi)容 使用 NVIDIA Spectrum-X 網(wǎng)絡(luò)平臺加速生成式 AI 工作負(fù)載
使用 NVIDIA Cumulus Linux 實(shí)現(xiàn)數(shù)據(jù)中心網(wǎng)絡(luò)自動化
借助 NVIDIA WJH 更快地診斷網(wǎng)絡(luò)問題
COMPUTEX2023 | NVIDIA 推出面向超大規(guī)模生成式 AI 的加速以太網(wǎng)平臺


原文標(biāo)題:為網(wǎng)絡(luò)管理員導(dǎo)航生成式 AI

文章出處:【微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4118

    瀏覽量

    99669

原文標(biāo)題:為網(wǎng)絡(luò)管理員導(dǎo)航生成式 AI

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    郭燕濤SQL Server 全能管理員在線課程分享

    的“兼職管理員”甚至開發(fā)人員順手維護(hù)。這種重前端、輕底層的資源配置方式,在經(jīng)濟(jì)學(xué)上被稱為“資產(chǎn)頭寸的嚴(yán)重錯配”。(看讠果aixuetang。xyz) 剝離掉技術(shù)的表象,一套關(guān)于“實(shí)例配置與權(quán)限體系
    發(fā)表于 04-19 16:28

    生成AI賦能虛擬調(diào)試——fe.screen-sim的架構(gòu)價(jià)值

    生成AI賦能虛擬調(diào)試——fe.screen-sim的架構(gòu)價(jià)值
    的頭像 發(fā)表于 12-04 14:59 ?1238次閱讀
    <b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>賦能虛擬調(diào)試——fe.screen-sim的架構(gòu)價(jià)值

    生成AI如何變革機(jī)器人工作流程

    非常激動地和大家分享我們最近的一些酷炫成果:我們正在利用生成 AI,讓機(jī)器人變得更加靈活,使用起來也更加便捷!
    的頭像 發(fā)表于 12-02 15:06 ?1816次閱讀
    <b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>如何變革機(jī)器人工作流程

    為什么網(wǎng)絡(luò)需要DHCP服務(wù)器?

    DHCP是一種網(wǎng)絡(luò)協(xié)議,全稱為動態(tài)主機(jī)配置協(xié)議(Dynamic Host Configuration Protocol)。它被用于在計(jì)算機(jī)網(wǎng)絡(luò)中自動分配IP地址和其他網(wǎng)絡(luò)配置信息給客戶端設(shè)備。DHCP的主要目標(biāo)是簡化
    的頭像 發(fā)表于 09-29 11:22 ?2345次閱讀
    為什么<b class='flag-5'>網(wǎng)絡(luò)</b>需要DHCP服務(wù)器?

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    當(dāng)今社會,AI已經(jīng)發(fā)展很迅速了,但是你了解AI的發(fā)展歷程嗎?本章作者將為我們打開AI的發(fā)展歷程以及需求和挑戰(zhàn)的面紗。 從2017年開始生成
    發(fā)表于 09-12 16:07

    智能體化AI生成AI的區(qū)別

    生成 AI 的核心是“生成內(nèi)容” —— 比如用大模型寫報(bào)告,是對輸入指令的被動響應(yīng)。而智能體化 AI(Agentic
    的頭像 發(fā)表于 08-25 17:24 ?1947次閱讀

    生成 AI 重塑自動駕駛仿真:4D 場景生成技術(shù)的突破與實(shí)踐

    生成AI驅(qū)動的4D場景技術(shù)正解決傳統(tǒng)方法效率低、覆蓋不足等痛點(diǎn),如何通過NeRF、3D高斯?jié)姙R等技術(shù)實(shí)現(xiàn)高保真動態(tài)建模?高效生成極端天氣等長尾場景?本文
    的頭像 發(fā)表于 08-06 11:20 ?5419次閱讀
    <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 重塑自動駕駛仿真:4D 場景<b class='flag-5'>生成</b>技術(shù)的突破與實(shí)踐

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    ,以“全流量采集 + AI根因診斷 + 預(yù)測性運(yùn)維”核心支柱,推動企業(yè)網(wǎng)絡(luò)運(yùn)維模式從傳統(tǒng)的“被動響應(yīng)”向“主動防御”和“故障自愈”的智能化方向躍遷。 三大核心能力:AI推理引擎重塑
    發(fā)表于 07-16 15:29

    SNMP協(xié)議在設(shè)備監(jiān)控中的使用

    隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)管理變得日益重要。網(wǎng)絡(luò)管理員需要一種高效、可靠的方式來監(jiān)控網(wǎng)絡(luò)設(shè)備、收集狀態(tài)信息并對其進(jìn)行配置。簡單
    的頭像 發(fā)表于 06-27 11:48 ?795次閱讀
    SNMP協(xié)議在設(shè)備監(jiān)控中的使用

    邊緣生成AI面臨哪些工程挑戰(zhàn)?

    內(nèi)就吸引了超過100萬用戶)在市場上迅速崛起并被廣泛采用。而手機(jī)用戶則經(jīng)常使用語音搜索功能。這些應(yīng)用有什么共同點(diǎn)呢?它們都依賴于云端來處理AI工作負(fù)載。盡管云端生成
    的頭像 發(fā)表于 06-25 10:44 ?1345次閱讀
    邊緣<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>面臨哪些工程挑戰(zhàn)?

    生成AI爆發(fā),企業(yè)還沒AI革命做好準(zhǔn)備

    當(dāng)前,生成AI(GenAI)的能力正以約每六個月翻倍的速度迭代,但多數(shù)企業(yè)的應(yīng)用進(jìn)展仍停留在緩慢的線性增長中,甚至還在觀望。這種差距導(dǎo)致企業(yè)逐漸落后,無法釋放AI帶來的巨大商業(yè)價(jià)值。
    的頭像 發(fā)表于 06-18 23:10 ?877次閱讀
    <b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>爆發(fā),企業(yè)還沒<b class='flag-5'>為</b><b class='flag-5'>AI</b>革命做好準(zhǔn)備

    谷歌新一代生成AI媒體模型登陸Vertex AI平臺

    我們在 Vertex AI 上推出新一代生成 AI 媒體模型: Imagen 4、Veo 3 和 Lyria 2。
    的頭像 發(fā)表于 06-18 09:56 ?1337次閱讀

    麻煩管理員幫忙注銷一下這個賬號

    我想要注銷jf_00115938這個賬號,不想用這個平臺,出于隱私保護(hù),麻煩管理員幫忙注銷一下。
    發(fā)表于 06-10 08:51

    Dify攜手亞馬遜云科技加速全球企業(yè)生成AI應(yīng)用規(guī)模化落地

    科技遍布全球的基礎(chǔ)設(shè)施與亞馬遜云科技Marketplace,Dify將產(chǎn)品迅速推廣至全球,汽車、制造、零售快消、醫(yī)療健康和游戲等多個行業(yè)逾百家企業(yè)提供服務(wù),助力企業(yè)釋放生成AI創(chuàng)新
    的頭像 發(fā)表于 06-07 16:00 ?1042次閱讀

    從Gartner報(bào)告看Atlassian在生成AI領(lǐng)域的創(chuàng)新路徑與實(shí)踐價(jià)值

    Atlassian入選Gartner 2025生成AI技術(shù)"新興領(lǐng)導(dǎo)者"!其核心AI產(chǎn)品Rovo依托Teamwork Graph,支持從團(tuán)隊(duì)知識庫中提取情境化的個性答案與洞察
    的頭像 發(fā)表于 06-05 15:59 ?1297次閱讀
    從Gartner報(bào)告看Atlassian在<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>領(lǐng)域的創(chuàng)新路徑與實(shí)踐價(jià)值
    汾阳市| 富民县| 介休市| 玉环县| 平陆县| 长阳| 浮梁县| 苗栗县| 怀远县| 北安市| 佛山市| 奈曼旗| 成武县| 昌乐县| 班玛县| 景宁| 汝城县| 平安县| 鹰潭市| 岳阳县| 乐安县| 财经| 沙洋县| 乌拉特中旗| 冀州市| 利辛县| 政和县| 莫力| 罗定市| 阜新市| 沁阳市| 阜平县| 鹰潭市| 平度市| 盱眙县| 肥城市| 康平县| 丰顺县| 石河子市| 陈巴尔虎旗| 梁河县|