日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI 創(chuàng)新的阻礙是對現(xiàn)有計算利用不足和成本增加

如意 ? 來源:讀芯術微信公眾號 ? 作者:讀芯術微信公眾號 ? 2020-11-02 15:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

雖然人工智能融合到商業(yè)具有很高的商業(yè)價值,但通常這個價值還不能抵消把模型應用到商業(yè)中所需的計算成本。機器學習深度學習是計算密集型的學習,有人認為,除非云計算或本地計算成本降低,否則盡管具有空前的商業(yè)價值,也不值得付出這筆成本。

麻省理工學院的研究科學家兼《深度學習的計算極限》一書的作者尼爾·湯普森(Neil Thompson)在《連線》雜志上發(fā)表的文章中提到,Google、Facebook等眾多組織已經建立了影響力廣又能節(jié)約成本的模型,但由于計算成本高而導致這些模型無法盈利。

湯普森表示在最近的一些演講和論文中表示,從事大型和前沿人工智能項目的研究人員開始抱怨,因為成本太高,他們無法測試多個算法設計,或者重新進行實驗。

商業(yè)機構需要極大地完善計算效率的方法,以促進創(chuàng)新并提高人工智能工作的投資回報率。但是,高昂的計算成本以及人們對高效計算的關注并不應該就此背黑鍋。

實際上,GPU加速基礎架構和其他云供應商已經取得了重大的進步,極大提高了訓練復雜人工智能網絡的能力,這種速度是前所未有的。

2020年5月,DeepCube發(fā)布了基于軟件的推理加速器,大大提高了所有現(xiàn)有硬件上的深度學習性能。換句話說,人們正在開發(fā)計算解決方案以滿足機器學習和深度學習日益增長的需求。人工智能創(chuàng)新潛在的阻礙就是對現(xiàn)有計算利用不足,以及“計算債務”的成本不斷增加。

什么是“計算債務”?

人工智能的領頭羊或許會驚訝地發(fā)現(xiàn),阻礙機器學習投資回報的主要因素之一是GPU,CPU和內存資源利用不足。

公司在計算上投資了數(shù)百萬美元,這些計算有可能極大地加速人工智能工作的負載量并提高性能,但最終只利用其中的一小部分,有時只利用了20%的資源。計算分配和實際利用率之間的差距令人震驚,可能需要公司付出比想象中更高的成本。

計算、分配和利用率之間的差距可稱為“計算債務”。指的是分配和能力之間的“浪費”。下圖直觀地對比了綠色所代表的平均利用率和黃色所代表的(當時的)分配。

當工作負載正在運行時,通常僅利用GPU的一部分,而另一部分則被其他潛在的工作負載所阻擋?;疑珔^(qū)域表示容量即GPU,CPU或內存可用的現(xiàn)有計算量,是所有閑置且未充分利用的計算區(qū)域。

資料來源:cnvrg.io

是什么導致了“計算債務”?

機器學習和深度學習是計算密集型的學習,管理起來很復雜,降低這種計算負擔會更難。人工智能基礎設施團隊面臨的最大挑戰(zhàn)之一是知道如何提高利用率,并以最大化消耗的方式管理資源,提高機器學習項目的投資回報率。導致“計算債務”的主要原因包括:

(1) 基礎設施團隊缺乏人工智能項目可見性

機器學習項目的基礎設施成本每年以兩倍的速度增長,但是IT團隊卻缺乏正確管理、優(yōu)化和預算機器學習資源的工具。大多數(shù)IT/DevOps領導者無法在給定時間了解GPU/CPU和內存的利用率、分配和容量。這導致無法控制消耗,無法提高效率。

(2) “計算債務”增長

隨著人工智能計算需求變得越來越復雜,計算分配和實際利用率之間的差距也越來越大。通常來說,公司可能只消耗了全部資源的30%。這導致將近70%的計算資源閑置,浪費了公司幾千甚至數(shù)百萬美元。

(3) 無法識別效率低下的工作

基礎架構團隊無法輕松識別未充分利用GPU/CPU的工作負載。如果沒有收集有關歷史工作負載的數(shù)據,就無法分析和識別運行效率低下的工作負載。缺乏可見性導致難以提高利用率,也難以控制工作負載的優(yōu)先級。

(4) 生產力中斷

未充分利用的GPU被打斷為其他工作讓路,增加了數(shù)據科學家的等待時間。這導致在等待GPU上浪費了很多時間和資源。同時還包括資源處于閑置狀態(tài)的問題,這些資源本來可以用于做其他工作的。

(5) 缺乏標準化和統(tǒng)一性

團隊經常無法將一項工作與利用率指標關聯(lián)起來。沒有標準的可視化工具來查看特定時間點的工作分配、利用率和容量。這使得識別效率低下的工作變得十分困難,而且難以確定浪費的工作量。機器學習已經達到了成熟的階段,為了成長,必須對人工智能基礎架構進行戰(zhàn)略化發(fā)展。

(6) 無法控制優(yōu)化策略

有些團隊能識別低效率并計劃好優(yōu)化的基礎架構策略,卻缺乏執(zhí)行這些策略上的工具。IT / DevOps團隊需要控制人工智能工作負載,以優(yōu)化資源管理。如果沒有辦法確定工作的優(yōu)先級、配置計算模板以及監(jiān)視工作負載的分配和利用率,就無法做出重大改進。

減少“計算債務”的策略

這一問題沒有明確的解決方法,但是有一些方法可以提高資源管理的效率。

(1) 投資最先進的具有GPU加速技術的人工智能基礎設施

GPU加速技術已經取得了一些成就。硬件和軟件深度學習加速解決方案已經出現(xiàn),可提供前所未有的計算性能。研究最新的GPU加速解決方案,采用真正的現(xiàn)代人工智能基礎架構。

(2) 采用混合的云基礎架構

結合公共云、私有云和本地資源可在運行人工智能工作負載方面更加敏捷和靈活。由于人工智能工作負載之間的負載類型差異很大,因此公司搭建了混合云基礎架構后,能夠更靈活地分配資源和自定義大小??梢允褂霉苍平档唾Y本支出,并提供高計算需求期間所需的可伸縮性。

如果一些公司有著嚴格的安全性要求,則必須添加私有云,隨著時間的推移可降低運營支出。混合云可實現(xiàn)必要的控制和靈活性,以改善資源預算。

(3) 利用估算工具估算GPU / CPU內存消耗

根據Microsoft Research對Microsoft的4960個失敗的深度學習任務的研究,8.8%的失敗是由GPU內存耗盡導致的,這是所有深度學習故障中最主要的問題。當前已經開發(fā)出許多估算工具用以預估GPU內存消耗以減少這些故障。此外,如果能夠收集利用率數(shù)據,則可以使用此歷史數(shù)據更好地預測每個季度的GPU / CPU和內存需求。

(4) 規(guī)?;疢LOps

引入可以簡化機器學習工作流程,并標準化科學和工程角色之間轉換的方法。由于IT和DevOps負責部署和管理工作負載,因此在執(zhí)行不同的工作時擁有清晰的溝通渠道非常重要。適當?shù)恼{度工具和對資源模板進行策略化可以改善人工智能工作負載的資源管理。

(5) 最大限度地提高利用率,減少“計算債務”

為了提高利用率,有必要將計算債務作為基礎架構團隊和數(shù)據科學團隊的KPI。如果公司能減少計算債務并提高利用率,就可以在向人工智能的競爭中脫穎而出。

要想讓基礎架構團隊最大限度地提高GPU/CPU的可見性和內存消耗從而提高利用率,基本上是沒有萬全之策。盡管業(yè)界正在迅速構建更高效的硬件和軟件來解決計算債務的威脅,但仍然任重而道遠。很多公司花費了幾百萬美元在計算上,而這些計算并未被充分利用。

通過使用現(xiàn)有資源并完善資源管理,公司可以使人工智能基礎架構具有巨大的可擴展性。根據文章中的策略,你可以完全利用好計算資源。公司若專注于優(yōu)化基礎架構,將會看到辛苦付出得到更高的投資回報率,從而在競爭中獲得優(yōu)勢。
責編AJX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算
    +關注

    關注

    2

    文章

    460

    瀏覽量

    40134
  • AI
    AI
    +關注

    關注

    91

    文章

    41326

    瀏覽量

    302731
  • 人工智能
    +關注

    關注

    1821

    文章

    50367

    瀏覽量

    267072
  • 機器學習
    +關注

    關注

    67

    文章

    8567

    瀏覽量

    137263
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    華為發(fā)布AI容器技術Flex:ai,算力平均利用率提升30%

    電子發(fā)燒友網綜合報道 2025年11月21日,在上海舉辦的“2025 AI容器應用落地與發(fā)展論壇”上,華為正式發(fā)布并開源了創(chuàng)新AI容器技術Flex:ai,為解決算力資源
    的頭像 發(fā)表于 11-26 08:31 ?7829次閱讀

    成本AI邊緣計算盒子DIY:基于迅為RK3568和開源模型,輕松玩轉智能識別

    成本AI邊緣計算盒子DIY:基于迅為RK3568和開源模型,輕松玩轉智能識別
    的頭像 發(fā)表于 11-12 13:42 ?2063次閱讀
    低<b class='flag-5'>成本</b><b class='flag-5'>AI</b>邊緣<b class='flag-5'>計算</b>盒子DIY:基于迅為RK3568和開源模型,輕松玩轉智能識別

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    計算成本。 核心: MoE模型利用稀疏性驅動結構,通過包含多個專家網絡的稀疏MoE層替換密集層,其中每個專家致力于特定的訓練數(shù)據或任務的子集,并且一個可訓練的門控機制動態(tài)地將輸入標記分配給這些專家,從而
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    AI被賦予了人的智能,科學家們希望在沒有人類的引導下,AI自主的提出科學假設,諾貝爾獎級別的假設哦。 AI驅動科學被認為是科學發(fā)現(xiàn)的第五個范式了,與實驗科學、理論科學、計算科學、數(shù)據驅
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升算力還是智力

    本章節(jié)作者分析了下AI的未來在哪里,就目前而言有來那個兩種思想:①繼續(xù)增加大模型②將大模型改為小模型,并將之優(yōu)化使之與大模型性能不不相上下。 一、大模型是一條不可持續(xù)發(fā)展的道路 大模型的不可
    發(fā)表于 09-14 14:04

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學習AI芯片的創(chuàng)新方法與架構

    的同時,能夠利用更小、更快的數(shù)字格式,提升模型的整體性能。 1.3Transformer 模型中的矩陣乘法計算 2、存內計算AI芯片 存內計算
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    ②Transformer引擎③NVLink Switch系統(tǒng)④機密計算⑤HBM FPGA: 架構的主要特點:可重構邏輯和路由,可以快速實現(xiàn)各種不同形式的神經網絡加速。 ASIC: 介紹了幾種ASIC AI芯片
    發(fā)表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    生物化學計算機,它通過離子、分子間的相互作用來進行復雜的并行計算。因而未來可期的前景是AI硬件將走向AI濕件。 根據研究,估算出大腦的功率是20W,在進行智力活動時,其功率會增大到25
    發(fā)表于 09-06 19:12

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內容總覽

    、集成芯片、分子器件與分子憶阻器,以及打印類腦芯片等。 第五章至第八章分別探討用化學或生物方法實現(xiàn)AI、AI在科學發(fā)現(xiàn)中創(chuàng)新應用、實現(xiàn)神經形態(tài)計算與類腦芯片的
    發(fā)表于 09-05 15:10

    AI 芯片浪潮下,職場晉升新契機?

    、新架構不斷涌現(xiàn)。能夠在工作中提出創(chuàng)新性的解決方案,推動 AI 芯片性能、功耗、成本等關鍵指標的優(yōu)化,將極大提升在職稱評審中的競爭力。例如,在芯片設計中引入新的計算范式,如存算一體技術
    發(fā)表于 08-19 08:58

    AI 邊緣計算網關:開啟智能新時代的鑰匙?—龍興物聯(lián)

    計算網關在本地實時分析,一旦檢測到盜竊、斗毆等異常行為,能立即發(fā)出警報,極大提高了安防監(jiān)控的及時性和準確性,同時減輕了云端計算壓力,降低了網絡成本。? 豐富的人工智能算法應用,是AI
    發(fā)表于 08-09 16:40

    工地要增加AI識別功能?高性能邊緣計算設備解決方案來助力

    今年4月,廣州市住建局就發(fā)布了《廣州市住房和城鄉(xiāng)建設局關于房屋建筑工程領域考勤設備優(yōu)化升級的通知》,最新提出了要“增加AI識別功能模塊。為實現(xiàn)人員實名登記、實時考勤和自動監(jiān)測數(shù)據互相比對驗證”,自
    的頭像 發(fā)表于 08-05 10:18 ?1168次閱讀
    工地要<b class='flag-5'>增加</b><b class='flag-5'>AI</b>識別功能?高性能邊緣<b class='flag-5'>計算</b>設備解決方案來助力

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    創(chuàng)新、應用創(chuàng)新、系統(tǒng)創(chuàng)新五個部分,接下來一一解讀。 算法創(chuàng)新 在深度學習AI芯片的創(chuàng)新上,書中圍
    發(fā)表于 07-28 13:54

    【「DeepSeek 核心技術揭秘」閱讀體驗】第三章:探索 DeepSeek - V3 技術架構的奧秘

    融入 Transformer,通過替換 FFN 層、多機多卡訓練等策略,試圖拓展模型能力??吹侥P腿萘恳驅<覕?shù)量增加而擴展,能處理更復雜任務,讓我感受到創(chuàng)新的潛力。但同時,通信成本高、訓練穩(wěn)定性
    發(fā)表于 07-20 15:07

    Axelera AI:邊緣計算加速智能創(chuàng)新解決方案

    隨著人工智能技術的不斷發(fā)展,邊緣計算(EdgeComputing)已成為企業(yè)創(chuàng)新與數(shù)字化轉型的重要引擎。如何在有限的計算資源下,實現(xiàn)高速且精確的AI推理任務,是企業(yè)面臨的主要挑戰(zhàn)之一
    的頭像 發(fā)表于 07-17 11:00 ?1094次閱讀
    Axelera <b class='flag-5'>AI</b>:邊緣<b class='flag-5'>計算</b>加速智能<b class='flag-5'>創(chuàng)新</b>解決方案
    浦北县| 民和| 平定县| 株洲市| 岳西县| 东方市| 根河市| 金塔县| 绩溪县| 石棉县| 义乌市| 万年县| 新宁县| 永宁县| 崇文区| 海门市| 宁远县| 茌平县| 浠水县| 巴彦县| 南平市| 兴仁县| 郓城县| 大同县| 汶川县| 江阴市| 西乌珠穆沁旗| 锡林郭勒盟| 鄯善县| 罗源县| 正定县| 绥阳县| 额尔古纳市| 日喀则市| 呼伦贝尔市| 双牌县| 井冈山市| 桦川县| 安福县| 延津县| 法库县|