日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

如何加速深度學習_GPU、FPGA還是專用芯片

電子工程師 ? 來源:網(wǎng)絡整理 ? 2018-03-31 07:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

計算機發(fā)展到今天,已經(jīng)大大改變了我們的生活,我們已經(jīng)進入了智能化的時代。但要是想實現(xiàn)影視作品中那樣充分互動的人工智能與人機互動系統(tǒng),就不得不提到深度學習。

深度學習

深度學習的概念源于人工神經(jīng)網(wǎng)絡的研究。含多隱層的多層感知器就是一種深度學習結構。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。

深度學習的概念由Hinton等人于2006年提出?;谏钚哦染W(wǎng)(DBN)提出非監(jiān)督貪心逐層訓練算法,為解決深層結構相關的優(yōu)化難題帶來希望,隨后提出多層自動編碼器深層結構。此外Lecun等人提出的卷積神經(jīng)網(wǎng)絡是第一個真正多層結構學習算法,它利用空間相對關系減少參數(shù)數(shù)目以提高訓練性能。

深度學習是機器學習研究中的一個新的領域,其動機在于建立、模擬人腦進行分析學習的神經(jīng)網(wǎng)絡,它模仿人腦的機制來解釋數(shù)據(jù),例如圖像,聲音和文本。

同機器學習方法一樣,深度機器學習方法也有監(jiān)督學習與無監(jiān)督學習之分.不同的學習框架下建立的學習模型很是不同.

例如,卷積神經(jīng)網(wǎng)絡(Convolutional neural networks,簡稱CNNs)就是一種深度的監(jiān)督學習下的機器學習模型,而深度置信網(wǎng)(Deep Belief Nets,簡稱DBNs)就是一種無監(jiān)督學習下的機器學習模型。

Artificial Intelligence,也就是人工智能,就像長生不老和星際漫游一樣,是人類最美好的夢想之一。雖然計算機技術已經(jīng)取得了長足的進步,但是到目前為止,還沒有一臺電腦能產(chǎn)生“自我”的意識。是的,在人類和大量現(xiàn)成數(shù)據(jù)的幫助下,電腦可以表現(xiàn)的十分強大,但是離開了這兩者,它甚至都不能分辨一個喵星人和一個汪星人。

圖靈(圖靈,大家都知道吧。計算機和人工智能的鼻祖,分別對應于其著名的“圖靈機”和“圖靈測試”)在 1950 年的論文里,提出圖靈試驗的設想,即,隔墻對話,你將不知道與你談話的,是人還是電腦。這無疑給計算機,尤其是人工智能,預設了一個很高的期望值。但是半個世紀過去了,人工智能的進展,遠遠沒有達到圖靈試驗的標準。這不僅讓多年翹首以待的人們,心灰意冷,認為人工智能是忽悠,相關領域是“偽科學”。

但是自 2006 年以來,機器學習領域,取得了突破性的進展。圖靈試驗,至少不是那么可望而不可及了。至于技術手段,不僅僅依賴于云計算對大數(shù)據(jù)的并行處理能力,而且依賴于算法。這個算法就是,Deep Learning。借助于 Deep Learning 算法,人類終于找到了如何處理“抽象概念”這個亙古難題的方法。

2012年6月,《紐約時報》披露了Google Brain項目,吸引了公眾的廣泛關注。這個項目是由著名的斯坦福大學的機器學習教授Andrew Ng和在大規(guī)模計算機系統(tǒng)方面的世界頂尖專家JeffDean共同主導,用16000個CPU Core的并行計算平臺訓練一種稱為“深度神經(jīng)網(wǎng)絡”(DNN,Deep Neural Networks)的機器學習模型(內(nèi)部共有10億個節(jié)點。這一網(wǎng)絡自然是不能跟人類的神經(jīng)網(wǎng)絡相提并論的。要知道,人腦中可是有150多億個神經(jīng)元,互相連接的節(jié)點也就是突觸數(shù)更是如銀河沙數(shù)。曾經(jīng)有人估算過,如果將一個人的大腦中所有神經(jīng)細胞的軸突和樹突依次連接起來,并拉成一根直線,可從地球連到月亮,再從月亮返回地球),在語音識別和圖像識別等領域獲得了巨大的成功。

項目負責人之一Andrew稱:“我們沒有像通常做的那樣自己框定邊界,而是直接把海量數(shù)據(jù)投放到算法中,讓數(shù)據(jù)自己說話,系統(tǒng)會自動從數(shù)據(jù)中學習?!绷硗庖幻撠熑薐eff則說:“我們在訓練的時候從來不會告訴機器說:‘這是一只貓。’系統(tǒng)其實是自己發(fā)明或者領悟了“貓”的概念?!?/p>

2012年11月,微軟在中國天津的一次活動上公開演示了一個全自動的同聲傳譯系統(tǒng),講演者用英文演講,后臺的計算機一氣呵成自動完成語音識別、英中機器翻譯和中文語音合成,效果非常流暢。據(jù)報道,后面支撐的關鍵技術也是DNN,或者深度學習(DL,DeepLearning)。

用什么加快計算速度?異構處理器

在摩爾定律的作用下,單核標量處理器的性能持續(xù)提升,軟件開發(fā)人員只需要寫好軟件,而性能就等待下次硬件的更新,在2003年之前的幾十年里,這種“免費午餐”的模式一直在持續(xù)。2003年后,主要由于功耗的原因,這種“免費的午餐”已經(jīng)不復存在。為了生存,各硬件生產(chǎn)商不得不采用各種方式以提高硬件的計算能力,以下是目前最流行的幾種方式是。

1) 讓處理器一個周期處理多條指令 ,這多條指令可相同可不同。如Intel Haswell處理器一個周期可執(zhí)行4條整數(shù)加法指令、2條浮點乘加指令,同時訪存和運算指令也可同時執(zhí)行。

2) 使用向量指令 ,主要是SIMD和VLIW技術。SIMD技術將處理器一次能夠處理的數(shù)據(jù)位數(shù)從字長擴大到128或256位,也就提升了計算能力。

3) 在同一個芯片中集成多個處理單元 ,根據(jù)集成方式的不同,分為多核處理器或多路處理器。多核處理器是如此的重要,以至于現(xiàn)在即使是手機上的嵌入式ARM處理器都已經(jīng)是四核或八核。

4) 使用異構處理器,不同的架構設計的處理器具有不同的特點,如X86 處理器為延遲優(yōu)化,以減少指令的執(zhí)行延遲為主要設計考量(當然今天的X86 處理器設計中也有許多為吞吐量設計的影子);如NVIDIA GPUAMD GPU則為吞吐量設計,以提高整個硬件的吞吐量為主要設計目標。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5283

    瀏覽量

    136105
  • 深度學習
    +關注

    關注

    73

    文章

    5610

    瀏覽量

    124656
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    深度學習為什么還是無法處理邊緣場景?

    選擇視而不見甚至直接加速。 之所以出現(xiàn)這個問題,是因為深度學習模型大多建立在統(tǒng)計學基礎之上,它們通過觀察數(shù)以千萬計的圖像學習識別物體的特征。然而,真實世界的道路場景是無限多樣的,這種基
    的頭像 發(fā)表于 05-04 10:16 ?1730次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b>為什么<b class='flag-5'>還是</b>無法處理邊緣場景?

    基于openEuler平臺的CPU、GPUFPGA異構加速實戰(zhàn)

    隨著 AI、視頻處理、加密和高性能計算需求的增長,單一 CPU 已無法滿足低延遲、高吞吐量的計算需求。openEuler 作為面向企業(yè)和云端的開源操作系統(tǒng),在 多樣算力支持 方面表現(xiàn)出色,能夠高效調(diào)度 CPU、GPUFPGA 及 AI
    的頭像 發(fā)表于 04-08 11:02 ?939次閱讀
    基于openEuler平臺的CPU、<b class='flag-5'>GPU</b>與<b class='flag-5'>FPGA</b>異構<b class='flag-5'>加速</b>實戰(zhàn)

    GPU云服務器哪家強?深度學習與AI訓練性能實測

    進入2026年,AI大模型已從“百模大戰(zhàn)”轉向“應用爆發(fā)”。無論是進行大語言模型的微調(diào)、文生視頻的渲染,還是復雜的自動駕駛仿真,GPU云服務器已成為企業(yè)的核心生產(chǎn)力工具。 然而,GPU服務器動輒
    的頭像 發(fā)表于 03-19 16:45 ?476次閱讀

    FPGA+GPU異構混合部署方案設計

    為滿足對 “納秒級實時響應” 與 “復雜數(shù)據(jù)深度運算” 的雙重需求,“FPGA+GPU”異構混合部署方案通過硬件功能精準拆分與高速協(xié)同,突破單一硬件的性能瓶頸 ——FPGA聚焦低延遲實時交易鏈路,
    的頭像 發(fā)表于 01-13 15:20 ?507次閱讀

    NVIDIA RTX PRO 5000 Blackwell GPU深度評測

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升級迭代產(chǎn)品,其各項核心指標均針對 GPU 加速工作流的高性能
    的頭像 發(fā)表于 01-06 09:51 ?4365次閱讀
    NVIDIA RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的<b class='flag-5'>深度</b>評測

    FPGAGPU加速的視覺SLAM系統(tǒng)中特征檢測器研究

    (Nvidia Jetson Orin與AMD Versal)上最佳GPU加速方案(FAST、Harris、SuperPoint)與對應FPGA加速方案的性能,得出全新結論。
    的頭像 發(fā)表于 10-31 09:30 ?894次閱讀
    <b class='flag-5'>FPGA</b>和<b class='flag-5'>GPU</b><b class='flag-5'>加速</b>的視覺SLAM系統(tǒng)中特征檢測器研究

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學習AI芯片的創(chuàng)新方法與架構

    、Transformer 模型的后繼者 二、用創(chuàng)新方法實現(xiàn)深度學習AI芯片 1、基于開源RISC-V的AI加速器 RISC-V是一種開源、模塊化的指令集架構(ISA)。優(yōu)勢如下: ①模
    發(fā)表于 09-12 17:30

    Andes晶心科技推出新一代深度學習加速

    高效能、低功耗 32/64 位 RISC-V 處理器核與 AI 加速解決方案的領導供貨商—Andes晶心科技(Andes Technology)今日正式發(fā)表最新深度學習加速器 Ande
    的頭像 發(fā)表于 08-20 17:43 ?3149次閱讀

    AI 芯片浪潮下,職場晉升新契機?

    運算能力,是其在深度學習訓練環(huán)節(jié)發(fā)揮優(yōu)勢的關鍵,相關工作成果對證明專業(yè)能力極為重要。 若投身于 FPGA 芯片研發(fā),鑒于 FPGA 可重構、
    發(fā)表于 08-19 08:58

    FPGA在機器學習中的具體應用

    隨著機器學習和人工智能技術的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效的硬件
    的頭像 發(fā)表于 07-16 15:34 ?3120次閱讀

    AI芯片加速人工智能計算的專用硬件引擎

    人工智能(AI)的快速發(fā)展離不開高性能計算硬件的支持,而傳統(tǒng)CPU由于架構限制,難以高效處理AI任務中的大規(guī)模并行計算需求。因此,專為AI優(yōu)化的芯片應運而生,成為推動深度學習、計算機視覺、自然語言
    的頭像 發(fā)表于 07-09 15:59 ?1993次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

    自家GPU 提出的多卡算力互連技術,是早期為了應對深度學習對超高算力需求而單卡算力不足的局面的解決方案,當然這都是官方用來吹牛的話術。我自己在2019年左右第一次接觸到多卡交火的GIY玩法(從學生到
    發(fā)表于 06-18 19:31

    GPU架構深度解析

    GPU架構深度解析從圖形處理到通用計算的進化之路圖形處理單元(GPU),作為現(xiàn)代計算機中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)展成為強大的并行計算引擎,廣泛應用于人工智能
    的頭像 發(fā)表于 05-30 10:36 ?2048次閱讀
    <b class='flag-5'>GPU</b>架構<b class='flag-5'>深度</b>解析

    ARM Mali GPU 深度解讀

    ARM Mali GPU 深度解讀 ARM Mali 是 Arm 公司面向移動設備、嵌入式系統(tǒng)和基礎設施市場設計的圖形處理器(GPU)IP 核,憑借其異構計算架構、能效優(yōu)化和生態(tài)協(xié)同,成為全球移動
    的頭像 發(fā)表于 05-29 10:12 ?5016次閱讀
    中宁县| 琼结县| 南康市| 肇东市| 黄浦区| 临泉县| 石门县| 玉环县| 林甸县| 南溪县| 大悟县| 虎林市| 稷山县| 彭阳县| 噶尔县| 青龙| 秦安县| 西乌珠穆沁旗| 博湖县| 搜索| 高安市| 临潭县| 宜宾市| 朝阳市| 三台县| 永兴县| 丹阳市| 灵山县| 龙陵县| 增城市| 晋江市| 北辰区| 台江县| 平湖市| 鄂伦春自治旗| 吴旗县| 循化| 霸州市| 乌兰浩特市| 宁陵县| 洛阳市|