日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook發(fā)布高性能AI代碼

DPVg_AI_era ? 來源:未知 ? 作者:李威 ? 2018-03-05 11:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Facebook今天宣布發(fā)布Tensor Comprehensions,能夠自動將數(shù)學(xué)符號快速轉(zhuǎn)換成高性能機(jī)器學(xué)習(xí)代碼,將原本幾天乃至幾周的過程縮短為幾分鐘,大幅提高生產(chǎn)力。

Facebook AI Research(FAIR)今天宣布發(fā)布Tensor Comprehensions,這是一個C++庫和數(shù)學(xué)語言,旨在幫助彌合研究人員和工程師在從事機(jī)器學(xué)習(xí)任務(wù)時,在溝通上的差距;研究人員習(xí)慣使用數(shù)學(xué)運算,而工程師則專注在不同的硬件后端運行大規(guī)模ML模型的實際需求。

相比其他庫,Tensor Comprehensions 的主要不同是對Just-In-Time編譯有獨特的研究,能夠自動按需生成機(jī)器學(xué)習(xí)社區(qū)需要的高性能代碼。

只需幾分鐘生成高性能CPU/GPU代碼,生產(chǎn)力實現(xiàn)數(shù)量級提高

要創(chuàng)建新的高性能機(jī)器學(xué)習(xí)(ML)層,典型的工作流程一般包含兩個階段,時間往往需要好幾天乃至數(shù)周:

1、首先,一位研究人員在numpy級別的抽象中編寫了一個新的層,并將其與像PyTorch這樣的深度學(xué)習(xí)庫鏈接起來,然后在小規(guī)模實驗中對其進(jìn)行測試。想法得到驗證后,相關(guān)的代碼,性能需要加快一個數(shù)量級才能運行大規(guī)模實驗。

2、接下來,一位工程師為GPU和CPU編寫高效代碼,而這又需要:

這名工程師需要是高性能計算的專家,這方面人才數(shù)量有限

這名工程師需要獲取上下文,制定策略,編寫和調(diào)試代碼

將代碼移到后端需要進(jìn)行一些枯燥但必須完成的任務(wù),例如反復(fù)進(jìn)行參數(shù)檢查和添加Boilerplate集成代碼

因此,在過去的幾年中,深度學(xué)習(xí)社區(qū)在很大程度上都依靠CuBLAS,MKL和CuDNN等高性能庫來獲得GPU和CPU上的高性能代碼。不使用這些庫提供的原語來進(jìn)行試驗,需要極高的工程水平,這對不少研究人員都構(gòu)成了很大的挑戰(zhàn)。

如果有套件能夠?qū)⑸鲜鲞^程從幾周縮短為幾分鐘,我們預(yù)期,將這樣一個套件開源將具有重大實用價值。有了Tensor Comprehensions,我們的愿景是讓研究人員用數(shù)學(xué)符號寫出他們的想法,這個符號自動被我們的系統(tǒng)編譯和調(diào)整,結(jié)果就是具有良好性能的專用代碼。

在這次發(fā)布的版本中,我們將提供:

表達(dá)一系列不同機(jī)器學(xué)習(xí)概念的數(shù)學(xué)符號

用于這一數(shù)學(xué)符號的基于Halide IR的C++前端

基于Integer Set Library(ISL)的多面體Just-in-Time(JIT)編譯器

基于進(jìn)化搜索的多線程、多GPU自動調(diào)節(jié)器

使用高級語法編寫網(wǎng)絡(luò)層,無需明確如何運行

最近在高性能圖像處理領(lǐng)域很受歡迎的一門語言是Halide。Halide使用類似的高級函數(shù)語法來描述圖像處理流水線,然后在單獨的代碼塊中,明確將其調(diào)度(schedule)到硬件上,詳細(xì)指定運算如何平鋪、矢量化、并行和融合。這對于擁有架構(gòu)專業(yè)知識的人來說,是一種非常高效的語言,但對于大多數(shù)機(jī)器學(xué)習(xí)從業(yè)者卻很難使用。目前有很多研究積極關(guān)注Halide的自動調(diào)度(Automatic scheduling),但對于在GPU上運行的ML代碼,還沒有很好的解決方案。

Tensor Comprehensions使用Halide編譯器作為庫。在Halide的中間表示(IR)和分析工具的基礎(chǔ)上,將其與多面體編譯技術(shù)相結(jié)合,使用者可以用類似的高級語法編寫網(wǎng)絡(luò)層,而無需明確它將如何運行。我們還成功使語言更加簡潔,無需指定減法(reduction)的循環(huán)邊界。

Tensor Comprehensions使用Halide和Polyhedral Compilation 技術(shù),自動合成CUDA內(nèi)核。這種轉(zhuǎn)換會為通用算子融合、快速本地內(nèi)存、快速減法和JIT類型特化進(jìn)行優(yōu)化。由于沒有或者沒有去優(yōu)化內(nèi)存管理,我們的流程可以輕松高效地集成到任何ML框架和任何允許調(diào)用C++函數(shù)的語言中。

與傳統(tǒng)的編譯器技術(shù)和庫的方法相反,多面編譯(Polyhedral Compilation)讓Tensor Comprehensions為每個新網(wǎng)絡(luò)按需調(diào)度單個張量元素的計算。

在CUDA層面,Tensor Comprehensions結(jié)合了affine loop transformations,fusion/fission和自動并行處理,同時確保數(shù)據(jù)在存儲器層次結(jié)構(gòu)中正確移動。

圖中的數(shù)字表示最初計算張量元素的順序,箭頭表示它們之間的依賴關(guān)系。在這個例子中,數(shù)字旋轉(zhuǎn)對應(yīng)loop interchange,深度算子融合就發(fā)生在這個過程中。

性能媲美乃至超越Caffe2+cuBLAS

為了推動搜索過程,我們還提供了一個集成的多線程、多GPU自動調(diào)諧庫(autotuning library),它使用Evolutionary Search來生成和評估數(shù)千種實現(xiàn)方案,并從中選擇性能最佳的方案。只需調(diào)用Tensor Comprehension的tune函數(shù),你就能實時地看著性能提高,到你滿意時停止即可。最好的策略是通過protobuf序列化,立即就可重用,或在離線情況下。

在性能方面,盡管我們還有很多需要改進(jìn)的地方,但在某些情況下,Tensor Comprehensions 已經(jīng)可以媲美甚至超越當(dāng)前整合了手動調(diào)整庫的ML框架。這主要通過將代碼生成策略適應(yīng)特定問題大小的能力來實現(xiàn)的。下面的條形圖展示了將Tensor Comprehensions自動生成的內(nèi)核與Caffe2和ATen(使用CuDNN)相比較時的結(jié)果。更多信息,請參閱論文(見文末鏈接)。

隨著我們擴(kuò)大至更多硬件后端,Tensor Comprehensions將補(bǔ)充硬件制造商(如NVIDIA和Intel)編寫的速度很快的庫,并將與CUDNN,MKL或NNPack等庫一起使用。

未來計劃

這次發(fā)布的版本將讓研究人員和程序員用與他們在論文中使用的數(shù)學(xué)語言來編寫網(wǎng)絡(luò)層,并簡明地傳達(dá)他們程序的意圖。同時,研究人員還能在幾分鐘之內(nèi)將他們的數(shù)學(xué)符號轉(zhuǎn)化成能夠快速實施的代碼。隨著工具鏈的不斷增長,我們預(yù)計可用性和性能將會增加,并使整個社區(qū)受益。

我們將在稍后發(fā)布PyTorch的Tensor Comprehensions集成。

我們感謝與框架團(tuán)隊的頻繁交流和反饋,并期待著將這一令人興奮的新技術(shù)帶入你最喜愛的ML框架。

FAIR致力于開放科學(xué)并與機(jī)器學(xué)習(xí)社區(qū)合作,進(jìn)一步推動AI研究。Tensor Comprehensions(已經(jīng)在Apache 2.0協(xié)議下發(fā)布)已經(jīng)是Facebook,Inria,蘇黎世聯(lián)邦理工學(xué)院和麻省理工學(xué)院的合作項目。目前工作還處于早期階段,我們很高興能夠盡早分享,并期望通過社區(qū)的反饋來改進(jìn)它。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    214

    文章

    31565

    瀏覽量

    224123
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41654

    瀏覽量

    302908
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4980

    瀏覽量

    74468

原文標(biāo)題:【AI大紅包】Facebook發(fā)布張量理解庫,幾分鐘自動生成ML代碼

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    深入解析HCS300:高性能代碼跳變編碼器的技術(shù)探秘

    深入解析HCS300:高性能代碼跳變編碼器的技術(shù)探秘 在電子工程領(lǐng)域,安全可靠的遠(yuǎn)程無鑰匙進(jìn)入(RKE)系統(tǒng)一直是研究的重點。Microchip Technology Inc.推出的HCS300代碼
    的頭像 發(fā)表于 04-07 10:50 ?165次閱讀

    樂鑫發(fā)布 ESP32-S31:高性能多協(xié)議雙核 RISC-V,面向 AI 智能交互!

    樂鑫信息科技(688018.SH)發(fā)布ESP32-S31,一款高性能雙核RISC-V多協(xié)議SoC?;跇扶纬墒烨医?jīng)過市場驗證的技術(shù)積累,ESP32-S31面向新一代AIoT應(yīng)用打造,適用于消費類
    的頭像 發(fā)表于 03-27 18:02 ?641次閱讀
    樂鑫<b class='flag-5'>發(fā)布</b> ESP32-S31:<b class='flag-5'>高性能</b>多協(xié)議雙核 RISC-V,面向 <b class='flag-5'>AI</b> 智能交互!

    還在手動拼接 AI 代碼?你的 IDE 早就該升級了

    進(jìn)度,更可能因操作繁瑣引發(fā)代碼錯誤,直接影響工業(yè)控制系統(tǒng)的穩(wěn)定性與安全性。傳統(tǒng)IDE的AI應(yīng)用模式,早已無法適配嵌入式開發(fā)的高效、高可靠需求。 我們真正需要的,是一款深度適配嵌入式開發(fā)、AI工作流內(nèi)嵌
    發(fā)表于 03-11 10:25

    新品 | AI Pyramid AI Pyramid-Pro,面向本地推理與智能交互的高性能AI PC

    AIPyramid是一款金字塔形狀的高性能AIPC,專為本地AI推理與邊緣智能應(yīng)用而生。內(nèi)置AxeraAX8850SoC,集成八核Cortex-A55處理器與24TOPS@INT8NPU,輕松應(yīng)對
    的頭像 發(fā)表于 02-06 17:24 ?3993次閱讀
    新品 | <b class='flag-5'>AI</b> Pyramid <b class='flag-5'>AI</b> Pyramid-Pro,面向本地推理與智能交互的<b class='flag-5'>高性能</b><b class='flag-5'>AI</b> PC

    國產(chǎn)高性能ONFI IP解決方案全解析

    1. 什么是ONFI IP?其在AI時代的作用是什么?ONFI (Open NAND Flash Interface) 是連接閃存控制器與NAND顆粒的關(guān)鍵高速接口協(xié)議。在AI高性能計算(HPC
    發(fā)表于 01-13 16:15

    安霸發(fā)布高性能端側(cè)AI 8K視覺感知芯片CV7

    美國加利福尼亞州圣克拉拉市,2026年1月5日——Ambarella(下稱“安霸”,納斯達(dá)克股票代碼:AMBA,AI 視覺感知芯片公司)在國際消費電子展(CES)上發(fā)布 CV7 端側(cè) AI
    的頭像 發(fā)表于 01-08 14:46 ?1161次閱讀

    【新品發(fā)布】艾為重磅發(fā)布端側(cè)AI高性能NPU語音芯片,打造智能語音體驗新標(biāo)桿

    數(shù)模龍頭艾為電子全新推出高性能NPU神經(jīng)網(wǎng)絡(luò)智能語音處理芯片:AWA89601,集成音頻專用NPU(神經(jīng)網(wǎng)絡(luò)處理器),通過聲音模型訓(xùn)練與NPU硬件結(jié)合,該芯片在AI降噪、AI人聲增強(qiáng)、AI
    的頭像 發(fā)表于 01-07 18:33 ?608次閱讀
    【新品<b class='flag-5'>發(fā)布</b>】艾為重磅<b class='flag-5'>發(fā)布</b>端側(cè)<b class='flag-5'>AI</b><b class='flag-5'>高性能</b>NPU語音芯片,打造智能語音體驗新標(biāo)桿

    亞馬遜云科技推出全新的Amazon AI Factories 將客戶現(xiàn)有基礎(chǔ)設(shè)施轉(zhuǎn)化為高性能AI環(huán)境

    亞馬遜云科技在2025 re:Invent全球大會上,宣布推出全新的Amazon AI Factories,助力企業(yè)將現(xiàn)有基礎(chǔ)設(shè)施轉(zhuǎn)化為高性能AI環(huán)境。
    的頭像 發(fā)表于 12-13 13:44 ?912次閱讀

    48 TOPS 算力!高性能 AI 核心板:CORE-8550JD4

    采用高通八核高性能AI處理器QCS8550,集成48TOPSNPU,支持多種主流AI大模型和深度學(xué)習(xí)框架。內(nèi)置Adreno740GPU,支持光線追蹤技術(shù)、8K視頻編解碼。搭載認(rèn)知ISP,支持1億像素
    的頭像 發(fā)表于 12-03 17:47 ?1312次閱讀
    48 TOPS 算力!<b class='flag-5'>高性能</b> <b class='flag-5'>AI</b> 核心板:CORE-8550JD4

    使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025構(gòu)建高性能AI應(yīng)用

    搜索和調(diào)用外部 AI 模型的 SQL 原生 API。NVIDIA 與微軟共同將 SQL Server 2025 與 NVIDIA Nemotron RAG 開放模型集合無縫連接,這使您能夠在云端或本地環(huán)境中基于自己的數(shù)據(jù)構(gòu)建高性能、安全的
    的頭像 發(fā)表于 12-01 09:31 ?1139次閱讀
    使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025構(gòu)建<b class='flag-5'>高性能</b><b class='flag-5'>AI</b>應(yīng)用

    推薦高性能存儲psram芯片

    智能穿戴、物聯(lián)網(wǎng)設(shè)備和端側(cè)AI應(yīng)用快速發(fā)展,PSRAM偽靜態(tài)隨機(jī)存儲器,正成為越來越多嵌入式系統(tǒng)的優(yōu)選方案,如何選擇一個高性能、小尺寸與低功耗的psram芯片是一個值得思考的問題。由EMI自主研發(fā)
    的頭像 發(fā)表于 11-18 17:24 ?730次閱讀

    AMD Vitis AI 5.1測試版發(fā)布

    AMD Vitis AI 5.1全新發(fā)布——新增了對 AMD Versal AI Edge 系列神經(jīng)網(wǎng)絡(luò)處理單元 (NPU) 的支持。Vitis AI 包含優(yōu)化的 NPU IP、模型編
    的頭像 發(fā)表于 10-31 12:46 ?1059次閱讀

    Vicor高性能電源模塊在數(shù)據(jù)中心的應(yīng)用優(yōu)勢

    隨著人工智能(AI)在高性能計算中發(fā)揮越來越重要的作用,為能耗巨大的AI服務(wù)器提供高效、高性能的電源解決方案,變得至關(guān)重要。
    的頭像 發(fā)表于 09-29 16:50 ?1828次閱讀

    高性能計算集群在AI領(lǐng)域的應(yīng)用前景

    隨著人工智能技術(shù)的飛速發(fā)展,高性能計算集群(HPC)在AI領(lǐng)域的應(yīng)用前景日益受到關(guān)注。HPC提供的計算能力與AI的智能分析能力相結(jié)合,為解決復(fù)雜問題和推動科學(xué)研究提供了新的動力。1、HPC與A
    的頭像 發(fā)表于 06-23 13:07 ?1458次閱讀
    <b class='flag-5'>高性能</b>計算集群在<b class='flag-5'>AI</b>領(lǐng)域的應(yīng)用前景

    芯原可擴(kuò)展的高性能GPGPU-AI計算IP賦能汽車與邊緣服務(wù)器AI解決方案

    芯原股份 (芯原,股票代碼:688521.SH) 日前宣布其 高性能、可擴(kuò)展的GPGPU-AI計算IP的最新進(jìn)展,這些IP現(xiàn)已為新一代汽車電子和邊緣服務(wù)器應(yīng)用提供強(qiáng)勁賦能 。通過將可編程并行計算能力
    的頭像 發(fā)表于 06-16 10:44 ?1573次閱讀
    盐池县| 伊宁县| 贵定县| 延吉市| 望谟县| 上林县| 大新县| 罗江县| 微山县| 尼木县| 阿鲁科尔沁旗| 苏尼特左旗| 讷河市| 临沂市| 九龙坡区| 嘉兴市| 武穴市| 定兴县| 克什克腾旗| 余庆县| 凯里市| 郯城县| 新竹县| 西林县| 五常市| 措勤县| 浦江县| 屯昌县| 阜新市| 莒南县| 保亭| 苍山县| 尼木县| 黎城县| 阳新县| 新绛县| 科尔| 河南省| 竹北市| 万载县| 海口市|