日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么計(jì)算軟件庫(kù)是AI成功的關(guān)鍵

穎脈Imgtec ? 2024-10-18 08:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

老話常說(shuō),“你付出什么,就得到什么”,這可能是總結(jié)接下來(lái)幾段內(nèi)容的最簡(jiǎn)單方式,我們將介紹Imagination的新OpenCL計(jì)算庫(kù)。如果你沒(méi)有時(shí)間繼續(xù)閱讀,只需記住這一點(diǎn):我們能夠從GPU中擠壓出更多的計(jì)算和AI性能,因?yàn)槲覀冊(cè)谶@些新軟件庫(kù)的精心設(shè)計(jì)上投入了大量工作,這樣我們的客戶就不必再投入這些工作了。對(duì)于一些客戶來(lái)說(shuō),這種開箱即用的體驗(yàn)正是他們完成工作所需的。而對(duì)于其他客戶,特別是那些正在開發(fā)自己的自定義庫(kù)/內(nèi)核的客戶,Imagination的計(jì)算庫(kù)以及相關(guān)的支持材料和工具,是他們?cè)陂_發(fā)和性能目標(biāo)上取得成功的一個(gè)完美起點(diǎn)。

Imagination多年來(lái)一直在構(gòu)建支持OpenCL的GPU,用于計(jì)算應(yīng)用。我們與許多企業(yè)合作,這些企業(yè)擁有自己的NPU(神經(jīng)處理單元),但需要一個(gè)GPU(通用GPU)來(lái)提供NPU通常不具備的編程靈活性。我們還看到市場(chǎng)上普遍認(rèn)識(shí)到靈活性是必不可少的,尤其是在從“功能到性能再到優(yōu)化”的開發(fā)者旅程中針對(duì)自己的計(jì)算算法時(shí)。我們?cè)谥暗奈恼隆稉肀н吘堿I中的靈活性》中討論了通用加速相對(duì)于特定領(lǐng)域加速的優(yōu)勢(shì),并強(qiáng)調(diào)開發(fā)者的賦能在于提供適合工作的軟件。


什么是正確的軟件呢?

數(shù)學(xué)庫(kù)和神經(jīng)網(wǎng)絡(luò)庫(kù)被廣泛認(rèn)為是在可編程平臺(tái)上高效執(zhí)行AI應(yīng)用和其他計(jì)算密集型工作負(fù)載的基本構(gòu)建塊。車內(nèi)駕駛員監(jiān)控應(yīng)用、激光雷達(dá)、雷達(dá)、視覺預(yù)/后處理算法,甚至是像LLM這樣的基礎(chǔ)模型中的transformer塊的關(guān)鍵處理元素,都依賴于底層優(yōu)化的庫(kù)。對(duì)這些基本構(gòu)建塊的需求催生了大量的開源項(xiàng)目(如clBLAS、vkFFT、xnnpack等),任何開發(fā)者現(xiàn)在都可以快速訪問(wèn)并在他們的應(yīng)用中使用這些庫(kù),以實(shí)現(xiàn)其功能。

然而,最初的完成工作的熱情往往很快會(huì)被失望所取代,因?yàn)殚_發(fā)者發(fā)現(xiàn),使用開源庫(kù)的性能遠(yuǎn)遠(yuǎn)低于他們基于可用硬件TFLOPS/TOPS的預(yù)期。隨后,這種失望很快會(huì)變成持續(xù)的挫敗感,因?yàn)橛脩裘鎸?duì)的現(xiàn)實(shí)是,要解決這些問(wèn)題,需要深入了解硬件微架構(gòu)和開發(fā)者工具。


這是一個(gè)新問(wèn)題嗎?

在我職業(yè)生涯的早期,我花了幾年時(shí)間深入優(yōu)化用于音頻和視頻算法的DSP代碼,任何在邊緣計(jì)算領(lǐng)域工作過(guò)的人都會(huì)講述類似的故事:通宵達(dá)旦地吃著披薩,與算法、編譯器和硬件調(diào)試器斗爭(zhēng),以獲得所需性能。盡管自那時(shí)以來(lái),技術(shù)取得了許多進(jìn)步,比如新的并行編程語(yǔ)言和智能編譯技術(shù),但歸根結(jié)底,情況并沒(méi)有太大改變。對(duì)最高性能的需求依然存在,而這只能通過(guò)手工優(yōu)化的算法和底層庫(kù)及內(nèi)核來(lái)滿足。如果沒(méi)有這些性能庫(kù),最近流行的“加速計(jì)算”這一術(shù)語(yǔ)就無(wú)法實(shí)現(xiàn)其承諾,即充分利用底層硬件的潛力來(lái)加速計(jì)算任務(wù)。換句話說(shuō),如果不投資于軟件,客戶就永遠(yuǎn)無(wú)法真正解鎖硬件的潛力。這是一個(gè)新問(wèn)題嗎?顯然不是!從任何系統(tǒng)中獲得最優(yōu)性能的挑戰(zhàn)一直都很困難,并且仍然如此。解決這個(gè)問(wèn)題需要廣泛的專業(yè)知識(shí):1. 對(duì)算法及其算法實(shí)現(xiàn)選擇的深刻理解(通常問(wèn)題具有多維度,有許多分解方式可供選擇)。
2. 深入了解硬件微架構(gòu)以及可用于利用上述架構(gòu)選擇的各種選項(xiàng)。3. 了解編程語(yǔ)言的靈活性和功能,以及相關(guān)編譯器的“智能”。4. 在一段時(shí)間內(nèi)持續(xù)應(yīng)用上述知識(shí),為用戶可能需要的多種可能性開發(fā)良好的覆蓋范圍。優(yōu)秀的程序員能夠?qū)⑺羞@些要素結(jié)合在一起,并且再加上只有最有經(jīng)驗(yàn)的編碼人員才能掌握的一點(diǎn)點(diǎn)魔法,從而從硬件中獲得非常好的甚至最優(yōu)性能的。但這樣的程序員是稀缺的。

因此,為了讓加速計(jì)算的承諾對(duì)每個(gè)人來(lái)說(shuō)都可實(shí)現(xiàn),Imagination將其專業(yè)知識(shí)應(yīng)用于這個(gè)問(wèn)題。畢竟,我們的工程師是最適合為我們自己的硬件創(chuàng)建優(yōu)化庫(kù)的人。


Imagination的解決方案是什么?Imagination的GPU產(chǎn)品的靈活微架構(gòu)為智能映射和并行化工作負(fù)載提供了許多機(jī)會(huì),以最大化計(jì)算引擎和內(nèi)存層次帶寬(GPU內(nèi)部和外部)的利用率。為了實(shí)現(xiàn)最優(yōu)性能,Imagination的一個(gè)跨職能專家團(tuán)隊(duì)解決了上述所有問(wèn)題,并應(yīng)用了我們對(duì)運(yùn)行時(shí)系統(tǒng)中動(dòng)態(tài)元素的深入理解,例如運(yùn)行時(shí)OpenCL編譯器和硬件的動(dòng)態(tài)調(diào)度。從這項(xiàng)活動(dòng)中獲得的經(jīng)驗(yàn)反饋到硬件和編譯器設(shè)計(jì)的改進(jìn)中,通過(guò)我們的AI產(chǎn)品路線圖,這個(gè)良性循環(huán)將持續(xù)進(jìn)行。在發(fā)布時(shí),Imagination的OpenCL計(jì)算庫(kù)通常能夠?qū)崿F(xiàn)比客戶使用開源解決方案所報(bào)告的性能提升3倍到4倍的更好結(jié)果。

在新發(fā)布的DXS GPU中,這些庫(kù)與專注于計(jì)算的硬件改進(jìn)相結(jié)合,例如額外的SPU(可擴(kuò)展處理單元)和額外的FP16流水線,對(duì)于許多計(jì)算工作負(fù)載,相比我們上一代的汽車GPU,性能提升了10倍或更多。


還有什么?

我們這些基礎(chǔ)庫(kù)的目標(biāo)是專注于我們作為IP公司的核心價(jià)值:最大限度地發(fā)揮我們芯片的性能,并使用戶能夠做到同樣的事情。但除此之外,我們還在做什么?我們現(xiàn)在專注于兩個(gè)關(guān)鍵領(lǐng)域:1. 提供參考計(jì)算和AI工具包,使客戶能夠在實(shí)際用例中利用這些計(jì)算庫(kù)。

2. 構(gòu)建我們的領(lǐng)域?qū)<液献骰锇樯鷳B(tài)系統(tǒng),幫助客戶通過(guò)解決方案和服務(wù)加速其上市目標(biāo)。

我們最近與MulticoreWare和澎峰科技的合作就是創(chuàng)新合作伙伴基于我們的計(jì)算庫(kù)構(gòu)建AI解決方案,并利用我們的參考工具包的兩個(gè)范例。


澎峰科技為希望加速AI的企業(yè)開發(fā)異構(gòu)計(jì)算軟件堆棧和基礎(chǔ)設(shè)施解決方案。我們使用Imagination的計(jì)算軟件解決方案在Imagination GPU上運(yùn)行各種AI應(yīng)用,包括我們的LLM推理引擎PerfXLM,迄今為止與CPU相比性能提升高達(dá)100%,而移植所需的時(shí)間極少。

——澎峰科技首席執(zhí)行官?gòu)埾容W

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41315

    瀏覽量

    302691
  • 計(jì)算軟件
    +關(guān)注

    關(guān)注

    0

    文章

    58

    瀏覽量

    11475
  • 軟件庫(kù)
    +關(guān)注

    關(guān)注

    0

    文章

    15

    瀏覽量

    7977
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    潤(rùn)和軟件亮相2026開放計(jì)算ROCm生態(tài)大會(huì)

    4月18日,2026開放計(jì)算ROCm生態(tài)大會(huì)在中國(guó)(南京)軟件成功舉辦。本次大會(huì)以“開源共生 智能共贏——構(gòu)建開放AI新生態(tài)”為主題,由AMD ROCm Lab主辦,南京市工業(yè)和信息
    的頭像 發(fā)表于 04-22 17:20 ?540次閱讀
    潤(rùn)和<b class='flag-5'>軟件</b>亮相2026開放<b class='flag-5'>計(jì)算</b>ROCm生態(tài)大會(huì)

    AI輔助軟件測(cè)試:幾個(gè)關(guān)鍵路徑

    軟件測(cè)試是保障質(zhì)量的關(guān)鍵環(huán)節(jié),但測(cè)試用例設(shè)計(jì)耗時(shí)、覆蓋分析繁瑣、自動(dòng)化腳本維護(hù)成本高等問(wèn)題,一直困擾著測(cè)試團(tuán)隊(duì)。大語(yǔ)言模型的出現(xiàn),為測(cè)試工作提供了一種新的輔助手段。這里從幾個(gè)實(shí)踐角度,聊聊AI如何在
    的頭像 發(fā)表于 03-23 15:34 ?159次閱讀

    軟通動(dòng)力ASDM AI優(yōu)先軟件研發(fā)流水線助力軟件工程發(fā)展

    ” 的研發(fā)模式。而這一體系的成功落地,核心依托于軟通動(dòng)力 FINSE 軟件工程事業(yè)部的專業(yè)實(shí)力與行業(yè)積淀,讓 AI 優(yōu)先的研發(fā)范式在金融、能源等關(guān)鍵行業(yè)實(shí)現(xiàn)了可落地、可提效的實(shí)際價(jià)值。
    的頭像 發(fā)表于 02-27 11:21 ?673次閱讀
    軟通動(dòng)力ASDM <b class='flag-5'>AI</b>優(yōu)先<b class='flag-5'>軟件</b>研發(fā)流水線助力<b class='flag-5'>軟件</b>工程發(fā)展

    使用NORDIC AI的好處

    × 在 CPU 上運(yùn)行時(shí)可快 10×、更省電,平均模型體積 <5 KB。[Edge AI 軟件頁(yè)] Axon NPU 對(duì)同一 TensorFlow Lite 模型:* 推理速度最高可比
    發(fā)表于 01-31 23:16

    2025開放原子開發(fā)者大會(huì)AI時(shí)代數(shù)據(jù)庫(kù)創(chuàng)新實(shí)踐分論壇成功舉辦

    11月21日,2025開放原子開發(fā)者大會(huì)——AI時(shí)代數(shù)據(jù)庫(kù)創(chuàng)新實(shí)踐分論壇成功舉辦。論壇以“構(gòu)建AI時(shí)代智能數(shù)據(jù)底座”為核心主題,匯聚OpenTenBase、Apache Doris、K
    的頭像 發(fā)表于 11-27 14:56 ?745次閱讀

    融合AI的OpenHarmony應(yīng)用軟件開發(fā):ai學(xué)習(xí)自律輔助軟件

    *附件:ai study.zip*附件:融合AI的OpenHarmony應(yīng)用軟件開發(fā):ai學(xué)習(xí)自律輔助軟件.pdf 基于開源鴻蒙編寫的
    發(fā)表于 11-12 15:38

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    、分布式群體智能 1)物聯(lián)網(wǎng)AGI系統(tǒng) 優(yōu)勢(shì): 組成部分: 2)分布式AI訓(xùn)練 7、發(fā)展重點(diǎn):基于強(qiáng)化學(xué)習(xí)的后訓(xùn)練與推理 8、超越大模型:神經(jīng)符號(hào)計(jì)算 三、AGI芯片的實(shí)現(xiàn) 1、技術(shù)需求 AI取得
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+神經(jīng)形態(tài)計(jì)算、類腦芯片

    功耗和并行處理信息能力。 類腦芯片的理論基礎(chǔ)是神經(jīng)形態(tài)計(jì)算,即借鑒生物神經(jīng)系統(tǒng)信息的處理模式和結(jié)構(gòu),以人腦為藍(lán)本、旨在構(gòu)建能夠像人腦一樣學(xué)習(xí)、感知及決策的計(jì)算系統(tǒng)。 實(shí)現(xiàn)神經(jīng)形態(tài)極端的關(guān)鍵技術(shù)是SNN
    發(fā)表于 09-17 16:43

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    流體芯片 ⑤AI計(jì)算平臺(tái) ⑥基于AI的自主決策系統(tǒng) ⑦基于AI的自主學(xué)習(xí)系統(tǒng) 2、面臨的挑戰(zhàn) ①需要造就一個(gè)跨學(xué)科、全面性覆蓋的知識(shí)庫(kù)和科學(xué)
    發(fā)表于 09-17 11:45

    AI芯片:科技探索與AGI愿景》—— 勾勒計(jì)算未來(lái)的戰(zhàn)略羅盤

    如果說(shuō)算力是AGI的“燃料”,那么AI芯片就是制造燃料的“精煉廠”。本書的卓越之處在于,它超越了單純的技術(shù)拆解,成功繪制了一幅從專用智能邁向通用智能的“戰(zhàn)略路線圖”。作者以芯片為棱鏡,折射出算法
    發(fā)表于 09-17 09:32

    QNX亮相2025未來(lái)汽車AI計(jì)算大會(huì)

    由蓋世汽車主辦的第五屆未來(lái)汽車AI計(jì)算大會(huì)于9月10日至11日成功舉行。本次大會(huì)歷時(shí)一天半,大會(huì)圍繞智算中心、汽車軟件、大算力芯片、中央計(jì)算
    的頭像 發(fā)表于 09-16 16:26 ?1185次閱讀

    NVIDIA通過(guò)全新 Omniverse庫(kù)、Cosmos物理AI模型及AI計(jì)算基礎(chǔ)設(shè)施,為機(jī)器人領(lǐng)域開啟新篇章

    NVIDIA 通過(guò)全新 Omniverse 庫(kù)、Cosmos 物理 AI 模型及 AI 計(jì)算基礎(chǔ)設(shè)施,為機(jī)器人領(lǐng)域開啟新篇章 ? ·?全新 NVIDIA Omniverse NuRec
    的頭像 發(fā)表于 08-12 11:29 ?2027次閱讀
    NVIDIA通過(guò)全新 Omniverse<b class='flag-5'>庫(kù)</b>、Cosmos物理<b class='flag-5'>AI</b>模型及<b class='flag-5'>AI</b><b class='flag-5'>計(jì)算</b>基礎(chǔ)設(shè)施,為機(jī)器人領(lǐng)域開啟新篇章

    AI 邊緣計(jì)算網(wǎng)關(guān):開啟智能新時(shí)代的鑰匙?—龍興物聯(lián)

    在數(shù)字化浪潮的當(dāng)下,AI 邊緣計(jì)算網(wǎng)關(guān)正逐漸嶄露頭角,成為眾多行業(yè)轉(zhuǎn)型升級(jí)的關(guān)鍵力量。它宛如一座智能橋梁,一端緊密連接著各類物理設(shè)備,如傳感器、攝像頭、工業(yè)機(jī)器等,負(fù)責(zé)收集豐富的數(shù)據(jù)信息;另一端則
    發(fā)表于 08-09 16:40

    求助,關(guān)于NanoEdge AI Studio生成的庫(kù)交叉編譯器版本疑問(wèn)求解

    20231009\", 那么問(wèn)題來(lái)了,怎么在NanoEdge AI Studio設(shè)定交叉編譯器呢,比如設(shè)置為armcc、armclang、iccram,因?yàn)槲倚枰獙?b class='flag-5'>庫(kù)加到keil或者iar工程里面。 看樣子這個(gè)軟件生成的
    發(fā)表于 08-08 07:25

    大家都在用什么AI軟件?有沒(méi)有好用的免費(fèi)的AI軟件推薦一下?

    大家都在用什么AI軟件?有沒(méi)有好用的免費(fèi)的AI軟件推薦一下?直接發(fā)個(gè)安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度
    發(fā)表于 07-09 18:30
    固原市| 鹰潭市| 莆田市| 衡阳县| 萝北县| 环江| 太仆寺旗| 台中市| 习水县| 贵州省| 长汀县| 巩留县| 固始县| 丁青县| 岫岩| 乐安县| 元谋县| 盐山县| 沭阳县| 沈丘县| 旺苍县| 金川县| 徐州市| 江阴市| 辽中县| 博野县| 丽水市| 乌兰察布市| 美姑县| 宜宾县| 浮梁县| 法库县| 大厂| 大邑县| 定远县| 财经| 东平县| 孟村| 青田县| 东方市| 铜川市|