日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

突破FPGA限制:TS-M4i系列數(shù)字化儀利用GPU加速實現(xiàn)高效塊平均處理

Sophia_wff ? 來源:Sophia_wff ? 作者:Sophia_wff ? 2024-08-19 15:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、應用背景

塊或分段內存平均模式常用于在不同應用當中,移除信號中不相干的噪聲。不管是哪家的數(shù)字化儀制造商,幾乎所有基于FPGA實現(xiàn)的塊平均模式都會受到塊或者段內存大小的限。該限制一般取決于FPGA的容量,最大樣品量通常在32k到500k之間。

本白皮書將展示如何使用TS-M4i系列數(shù)字化儀的高速PCIe流模式來在軟件中實現(xiàn)塊平均處理,從而突破FPGA的限制。我們用了TS-M4i.2230(1通道,5 GS/s,8位垂直分辨率,1.5 GHz帶寬)作為例子,對比硬件和軟件進行塊平均處理的效果。

二、什么是塊平均?

塊平均模式可以用來移除隨機噪聲成分,提高重復信號的保真度。該模式允許對多次單段采集進行處理、累積和平均。這個過程減少了隨機噪聲,提高了重復信號的可見性,平均后的信號具有增強的測量分辨率和更高的信噪比(SNR)。

塊平均模式可用于改善雷達測試、天文學、質譜學、醫(yī)學成像、超聲波測試、光纖測試和激光測距等各種不同應用中的測量。

下面截圖顯示了一個較低電平的信號(大約2mV),完全被隨機噪聲覆蓋的情形,以及使用不同平均因子獲得的信號質量改進。雖然在原始單次采集中源信號基本無法看到,但10x平均時,能顯示出實際上有5個信號峰。執(zhí)行1000x的塊平均可以進一步改善信號質量,揭示出帶有二次最大值和最小值峰的完整信號形狀。

wKgaombC5imAFW_WAAHroimRuGo166.png

通過塊平均改善噪聲問題,該示例使用了一個500MS/s采樣率(每個采樣點2ns)和14位分辨率的數(shù)字化儀制作

三、系統(tǒng)配置

為了兼顧更多老舊設備的性能狀況,測試系統(tǒng)選用了一臺德思特公司內的舊辦公電腦,大致配置如下:

●主板:技嘉GA-H77-D3H

CPUIntel i7-3770,4核3.4 GHz

●運行內存:8 GB DDR3

●硬盤:120 GB固態(tài)

操作系統(tǒng):Win 7 64bit

● IDE:Visual Studio 2005標準版

主板上有一個空閑的PCIe Gen2 x8插槽,我們就使用該插槽來插數(shù)字化儀板卡。此時,德思特的TS-M4i板卡的流式傳輸可以達到滿速,約3.4 GB/s(不考慮數(shù)據(jù)處理的情況下)。

四、軟件實現(xiàn)

測試軟件使用純C++編寫,并基于德思特流式傳輸示例。數(shù)字化儀板卡通過外部觸發(fā)采集,板卡會自動在每個觸發(fā)事件后獲取一段數(shù)據(jù)。數(shù)據(jù)會先存儲在板載內存中,然后通過分散聚集式式DMA直接傳輸?shù)絇C的運行內存,并在運行內存中進行累積,進而執(zhí)行塊平均操作。我們針對不同的配置方式和優(yōu)化策略進行了測試,來看看分別能達到什么樣的性能水平。

摘錄出來的一小段源代碼顯示了多線程版本的主求和循環(huán),這正是軟件處理的關鍵部分,也是決定速度的部分。

wKgaombC5k-AUwNyAAEEz4WWJ6k232.png

以下列表提供了具體實現(xiàn)各個方面的一些信息和備注:

●數(shù)據(jù)段大?。菏盏接|發(fā)事件后將獲取數(shù)據(jù)的樣本點數(shù)量

●平均次數(shù):對于一個數(shù)據(jù)段,在算法重置前,整個過程中需要執(zhí)行多少次平均前的累加操作。

●通知大小:硬件生成中斷所需的數(shù)據(jù)量。該參數(shù)決定了整個平均循環(huán)的速度。如果通知大小大于數(shù)據(jù)段大小,則會在一次中斷中傳輸多個數(shù)據(jù)段的內容,這將減少線程通信和中斷處理的額外開銷。

●緩沖區(qū)大?。篋MA傳輸?shù)哪繕司彌_區(qū)整體大小。在我們的實驗中,這個緩沖區(qū)固定等于通知大小的16倍。

●觸發(fā)速率:作為外部觸發(fā)的信號發(fā)生器的信號重復頻率。在結果表格中,我們給出的是在不填滿(溢出)緩沖區(qū)的情況下可以達到的最大觸發(fā)速率。

●線程數(shù):為了加快求和過程,我們對該任務進行并行化優(yōu)化,將其分割成多個不同的軟件線程。如果線程為1,則表示求和過程不使用額外線程,而是直接在主循環(huán)中直接執(zhí)行。

● CPU負載:由于平均過程是用軟件完成的,具體來說就是CPU進行了所有的工作。幸好現(xiàn)代CPU往往包含多個內核,我們實際上可以輕松地在它們之間共享工作任務。

● SSE/SSE2指令:乍一看,這些命令似乎非常適合并行化求和過程,并似乎可以在不需要任何線程編程的情況下加快軟件的速度。但不幸的是,SSE命令集都是基于相同類型的數(shù)據(jù)的,而由于獲取的數(shù)據(jù)是8bit寬度,而平均緩沖區(qū)是32位寬,因此在本例中無法利用該指令集進行加速。

五、效果和比較

所有的測量都是使用一個采樣率高達5GS/s、垂直分辨率為8位,并且?guī)в型獠坑|發(fā)通道的數(shù)字化儀進行的。我們在表格中還列出了不同的程序配置以對比效果差異。

wKgaombC5maAF01pAAQeKZV7m6E451.png

通過普通(性能偏低的)PC在時域上進行塊平均的性能對比

六、新方法:使用CUDA進行平均運算

2018年11月,我們推出了一些使用SCAPP(通過CUDA訪問數(shù)據(jù)和并行處理)選項進行塊平均的示例,適用于非常高速的數(shù)據(jù)處理。其基本概念與前文所述相同,即數(shù)據(jù)由數(shù)字化儀采集并通過PCIe總線連續(xù)傳輸。不同之處在于,平均值的計算操作不是由CPU完成,而是在GPU中完成。GPU解決方案的一個主要優(yōu)點在于,GPU本身就是為并行計算而設計,這使GPU成為各種類型的塊平均運算的理想選擇。

在實現(xiàn)上,SCAPP允許用戶直接將數(shù)據(jù)傳送到GPU,這使用了RDMA(遠程直接內存存?。┘夹g,然后可以在GPU上執(zhí)行高速時域和頻域信號的平均,并突破通常在CPU和FPGA中出現(xiàn)的數(shù)據(jù)長度或算力限制。

比如,TS-M4i.2220數(shù)字化儀可以以2.5 GS/s的速度連續(xù)采樣信號,我們可以做到在不丟失樣品點的情況下,進行長達數(shù)秒的平均運算。類似地,我們還有14位垂直分辨率的TS-M4i.4451數(shù)字化儀可以以450 MS/s的速度同時對四個通道的信號進行同一功能的采樣。數(shù)字化儀板卡還提供了靈活的觸發(fā)、捕獲和讀出模式設置,從而使它們能夠在觸發(fā)速率極高的情況采回原始信號,進而做平均處理。相比之下,F(xiàn)PGA方案需要最高性能級別的FPGA來同時滿足數(shù)據(jù)拉取和平均運算,而GPU方案則可以輕松跑滿數(shù)字化儀的全速,即使是使用入門級GPU也不會成為瓶頸。

以下表格展示了使用GPU,并在和之前表格中板卡參數(shù)相同的情況下的測試結果:

wKgZombC5oKACl7dAAFaeh2w29c622.png

在時域上使用GPU進行塊平均的測試結果

這些結果是在使用一張Quadro P2000 GPU獲得的。如表所示,數(shù)據(jù)段大小和通知大小并未限制性能,我們遇到唯一限制的瓶頸是GPU內存(顯存)。

七、使用GPU進行頻域平均

在需要進行頻域平均的情況下,也建議使用GPU,因為GPU允許比FPGA方案更大的平均塊大小。頻域的平均運算過程包含兩個步驟,一個是針對塊數(shù)據(jù)的FFT運算,另一個是對FFT結果求和(然后取平均)。其中FFT計算在處理能力方面要求非常高,因此對于頻率域平均而言,除了FPGA外,GPU是唯一的可行方案,CPU并不適合在高速下進行FFT轉換。

以下表格顯示了使用最大采樣率為500 MS/s的TS-M4i.4451數(shù)字化儀(4通道,14位垂直分辨率)的一些測試結果。最終表明該方案能高效地實現(xiàn)無間隙數(shù)據(jù)采集,將每個塊中的原始數(shù)據(jù)轉換為對應電壓值,然后再轉換至頻率域做平均。

wKgaombC5qKAbB6FAAHqegEJdTs560.png

使用GPU進行頻率域塊平均的測試結果

八、結論

如上述結果所示,只要重復率不算太高,得益于PCIe總線的高速數(shù)據(jù)傳輸率,使用基于CPU的軟件在進行塊平均時,可以實現(xiàn)比FPGA更大的總數(shù)據(jù)段大小,從而平均更長時間的樣本;而使用GPU時,更是可以達到PCIe總線傳輸所限制的上限速度。對于需要處理更高重復觸發(fā)率的情況,會對總線傳輸速度提出更高的要求,此時基于FPGA硬件的塊平均仍將是最佳選擇。

上述測試程序也可以提供給您,以便您自己進行重復測試,或者作為實現(xiàn)其他軟件程序的基礎。其中GPU示例是SCAPP軟件選項的一部分,在選購后,德思特的客戶可按照NDA協(xié)議使用。

總的來說,通知大小設為1 MByte時,可獲得最佳性能。具體執(zhí)行的平均次數(shù)對測試性能并沒有明顯的影響。因為復制結果段和清除結果緩沖所需的時間相對于樣本求和運算而言微不足道。

由于在同時采集多個通道時,整個的數(shù)據(jù)處理和求和過程并沒有本質區(qū)別,因此只需等價成一個把所有數(shù)據(jù)都合并到一起的新通道即可(等效采樣率= 每通道采樣率 × 通道數(shù))。以下設置對應的最大觸發(fā)速率完全相同:

●1通道5 GS/s @ 數(shù)據(jù)段大小S1

●2通道2.5 GS/s @ 數(shù)據(jù)段大小S1/2

●4通道1.25 GS/s @ 數(shù)據(jù)段大小S1/4

將采樣速度降低到2.5 GS/s時,可以在理論上使軟件針對1個通道執(zhí)行平均運算的速度最大化。對于1 M樣本點的數(shù)據(jù)段大小,外加死區(qū)長度為160個樣本點時,理論上的最大觸發(fā)速率為:(2.5 GS/s) / (1 MS+ 160 S) = 2.38 kHz。

注意,這確實會明顯低于單純采集時的最大觸發(fā)速率:2.9 kHz @ 5 GS/s。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1664

    文章

    22509

    瀏覽量

    639591
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5283

    瀏覽量

    136105
  • 數(shù)字化儀

    關注

    0

    文章

    161

    瀏覽量

    18600
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    睿萊體測“體質寶”——桂花網(wǎng)藍牙網(wǎng)關M1000賦能兒童運動表現(xiàn)數(shù)字化

    傳統(tǒng)藍牙傳輸距離短、連接數(shù)少、依賴固定網(wǎng)絡的核心痛點。 睿萊體測“體質寶”則將兒童運動表現(xiàn)全面數(shù)字化、可視、游戲。 機構實現(xiàn)降本增效、專業(yè)
    發(fā)表于 04-10 11:56

    基于openEuler平臺的CPU、GPUFPGA異構加速實戰(zhàn)

    隨著 AI、視頻處理、加密和高性能計算需求的增長,單一 CPU 已無法滿足低延遲、高吞吐量的計算需求。openEuler 作為面向企業(yè)和云端的開源操作系統(tǒng),在 多樣算力支持 方面表現(xiàn)出色,能夠高效調度 CPU、GPU、
    的頭像 發(fā)表于 04-08 11:02 ?938次閱讀
    基于openEuler平臺的CPU、<b class='flag-5'>GPU</b>與<b class='flag-5'>FPGA</b>異構<b class='flag-5'>加速</b>實戰(zhàn)

    捕捉量子比特信號:數(shù)字化在可編程硅基量子處理器測試中的應用

    荷蘭代爾夫特理工大學在可編程硅基雙量子比特處理器測試中,采用M4i.44xx系列數(shù)字化采集極低溫下的量子態(tài)讀出信號。該設備將調理后的電壓信
    的頭像 發(fā)表于 03-24 17:21 ?1091次閱讀
    捕捉量子比特信號:<b class='flag-5'>數(shù)字化</b><b class='flag-5'>儀</b>在可編程硅基量子<b class='flag-5'>處理</b>器測試中的應用

    數(shù)字化的基礎是什么

    、用戶交互等渠道持續(xù)收集結構(如數(shù)據(jù)庫記錄)和非結構數(shù)據(jù)(如文本、圖像、視頻)。 數(shù)據(jù)存儲與管理 :依賴數(shù)據(jù)庫、數(shù)據(jù)倉庫、云存儲等技術實現(xiàn)高效存儲,并通過數(shù)據(jù)治理框架確保質量、安全
    的頭像 發(fā)表于 02-04 17:53 ?1327次閱讀

    光伏電站數(shù)字化智能運維系統(tǒng)如何驅動高效運維?

    技術的深度融合,實現(xiàn)光伏電站從“被動維護”到“主動智能”的運維模式轉變,推動了能源管理的精細化與可持續(xù)。 光伏電站數(shù)字化智能運維系統(tǒng)的應用,以分層構建技術架構,實現(xiàn)數(shù)據(jù)采集、傳輸、
    的頭像 發(fā)表于 01-09 13:32 ?259次閱讀
    光伏電站<b class='flag-5'>數(shù)字化</b>智能運維系統(tǒng)如何驅動<b class='flag-5'>高效</b>運維?

    TVP70025I:高性能視頻與圖形數(shù)字化器的全面解析

    TVP70025I:高性能視頻與圖形數(shù)字化器的全面解析 在當今數(shù)字化的時代,視頻和圖形處理技術的發(fā)展日新月異。對于電子工程師而言,選擇一款性能卓越、功能豐富的
    的頭像 發(fā)表于 12-25 16:45 ?511次閱讀

    數(shù)字化轉型浪潮下,有人智能設備管理系統(tǒng)助力企業(yè)高效升級

    在工業(yè)互聯(lián)網(wǎng)加速滲透的今天, 數(shù)字化轉型 已成為企業(yè)突破增長瓶頸、提升核心競爭力的必答題。設備作為生產經(jīng)營的核心載體,其管理水平直接決定企業(yè)數(shù)字化落地的深度 —— 有人物聯(lián)網(wǎng)設備健康管
    的頭像 發(fā)表于 12-25 14:10 ?600次閱讀

    光伏場站無人機巡檢系統(tǒng)如何助力光伏電站實現(xiàn)數(shù)字化

    數(shù)字化的有效途徑。系統(tǒng)不僅可利用多維度數(shù)據(jù)采集,來構建數(shù)字資產基礎,同時還能結合智能分析與診斷,挖掘數(shù)據(jù)價值。通過全生命周期管理的應用,有效驅動光伏電站運維模式變革,實現(xiàn)從 “人工巡檢
    的頭像 發(fā)表于 12-11 15:55 ?707次閱讀
    光伏場站無人機巡檢系統(tǒng)如何助力光伏電站<b class='flag-5'>實現(xiàn)</b><b class='flag-5'>數(shù)字化</b>?

    工業(yè)數(shù)字化如何促進新質生產力發(fā)展

    據(jù)等新一代信息技術為引擎,推動技術群體突破與集成應用。例如,制造業(yè)數(shù)字化轉型為這些技術提供了“藍?!眻鼍?,加速其迭代升級: 生產方式變革 :通過數(shù)字孿生技術構建虛實映射系統(tǒng),
    的頭像 發(fā)表于 10-24 15:47 ?513次閱讀

    電子行業(yè)如何通過MES系統(tǒng)實現(xiàn)數(shù)字化升級

    對電子行業(yè)而言,萬界星空MES系統(tǒng)是實現(xiàn)數(shù)字化升級的核心運營平臺。它通過將人、機、料、法、環(huán)等生產要素數(shù)字化并互聯(lián)互通,構建了一個透明、高效、敏捷、可追溯的
    的頭像 發(fā)表于 09-29 12:09 ?704次閱讀

    數(shù)字孿生可視系統(tǒng)構建行業(yè)數(shù)字化智能管理生態(tài)!

    數(shù)字孿生可視系統(tǒng)具備豐富的模型組件,包括二維平面組件及3D模型組件,可根據(jù)用戶需求進行定制。數(shù)字孿生可視系統(tǒng)在行業(yè)數(shù)字化升級、
    的頭像 發(fā)表于 09-19 11:45 ?886次閱讀
    <b class='flag-5'>數(shù)字</b>孿生可視<b class='flag-5'>化</b>系統(tǒng)構建行業(yè)<b class='flag-5'>數(shù)字化</b>智能管理生態(tài)!

    Spectrum推出多通道GHz數(shù)字化,最高支持12通道

    Spectrum儀器今日宣布推出全新旗艦數(shù)字化產品。該系列設備具備12位分辨率,最高可支持6通道10 GS/s或12通道5 GS/s的高速數(shù)據(jù)采集。新型DN6.33x數(shù)字化
    的頭像 發(fā)表于 09-17 17:35 ?1029次閱讀

    安科瑞智能網(wǎng)關支撐企業(yè)能源數(shù)字化轉型的核心設備?

    ,助力客戶平均降低能耗 15%-25%,為企業(yè)能源數(shù)字化轉型提供核心支撐。 ? 網(wǎng)關技術迭代:從連接到邊緣處理? 安科瑞 ANet 系列網(wǎng)關圍繞 “
    的頭像 發(fā)表于 09-15 11:03 ?655次閱讀
    安科瑞智能網(wǎng)關支撐企業(yè)能源<b class='flag-5'>數(shù)字化</b>轉型的核心設備?

    Brother全新發(fā)布兩款網(wǎng)絡掃描,助力企業(yè)加速邁入數(shù)字化辦公新生態(tài)

    ,以高效流暢的使用體驗滿足辦公用戶對工作效率的更佳追求,助力企業(yè)加速邁入數(shù)字化辦公新生態(tài)。 Brother推出的新款掃描ADS-2750W 與 ADS-3350W
    的頭像 發(fā)表于 08-25 13:46 ?685次閱讀
    Brother全新發(fā)布兩款網(wǎng)絡掃描<b class='flag-5'>儀</b>,助力企業(yè)<b class='flag-5'>加速</b>邁入<b class='flag-5'>數(shù)字化</b>辦公新生態(tài)

    基于FPGA的壓縮算法加速實現(xiàn)

    本設計中,計劃實現(xiàn)對文件的壓縮及解壓,同時優(yōu)化壓縮中所涉及的信號處理和計算密集型功能,實現(xiàn)對其的加速處理。本設計的最終目標是證明在充分并行
    的頭像 發(fā)表于 07-10 11:09 ?2619次閱讀
    基于<b class='flag-5'>FPGA</b>的壓縮算法<b class='flag-5'>加速</b><b class='flag-5'>實現(xiàn)</b>
    衡阳县| 青冈县| 高尔夫| 安西县| 辽阳市| 岗巴县| 红桥区| 庆云县| 布尔津县| 阳山县| 黄梅县| 乳源| 潞西市| 理塘县| 临澧县| 东宁县| 泰来县| 广灵县| 南澳县| 家居| 长岭县| 平和县| 翼城县| 黎川县| 元朗区| 巴马| 玉龙| 远安县| 福鼎市| 岳阳市| 柳林县| 武安市| 芦山县| 绥棱县| 八宿县| 苏尼特左旗| 锡林浩特市| 乌拉特后旗| 新河县| 大荔县| 鄂州市|