日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TensorRT極致推理加速,望塵科技打造新一代實時AI體育全場景多維重構(gòu)引擎

NVIDIA英偉達企業(yè)解決方案 ? 來源:未知 ? 2022-12-01 22:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深圳望塵科技公司擁有國內(nèi)領(lǐng)先的 AI 視覺算法團隊和實時渲染引擎,十年來一直專注于體育游戲與其相關(guān) AI 視覺技術(shù)的研發(fā),積累了巨量的球員角色數(shù)據(jù)庫,不僅有所有在國際足聯(lián)注冊的 2 萬名職業(yè)球員精確到厘米的球員體型、骨長、BMI、體脂肌肉比等數(shù)據(jù),還有數(shù)千名頂級球員高精度的 3D 模型,幾乎全球所有主要球場的高精度模型。




基于這些高質(zhì)量結(jié)構(gòu)化的數(shù)據(jù),Arena4D 可將捕捉結(jié)果在實時渲染引擎中以接近照片級真實的質(zhì)量渲染,用完全自由的鏡頭特效和運鏡方式實現(xiàn)前所未有的震撼體驗。


Arena4D 空間追蹤識別及數(shù)據(jù)處理

面臨算力挑戰(zhàn)


  • 球員和球的運動速度快,姿態(tài)變化大,且衣服外貌相似性較大,難以使用行業(yè)通用的 MOT 算法進行高質(zhì)量的追蹤和姿態(tài)識別。

  • 即使是 4k 圖像,球員和球在圖像中太小,追蹤困難。

  • 多臺高清攝像頭每幀圖像需上傳到顯卡進行實時轉(zhuǎn)碼、降噪等前處理工作,數(shù)據(jù)吞吐量較大。

  • 基于神經(jīng)網(wǎng)絡的計算流水線,需要實時進行多個視角、多個運動員的追蹤、識別、姿態(tài)估計與降噪計算。

  • 在多個 AI 模型級聯(lián)計算流水線中,每個 AI 模型之間的數(shù)據(jù)處理與拷貝占用了大量的時間。


NVIDIA AI 計算平臺為Arena4D

實現(xiàn)全流程GPU加速提供算力支持


基于以上挑戰(zhàn),望塵科技選擇了采用 NVIDIA AI 計算平臺來提供支持,使用后給研發(fā)和項目落地帶來了巨大的支持和提升。


1、基于 GalaSports 體育游戲渲染生成巨量的合成數(shù)據(jù),在 NVIDIA 數(shù)據(jù)中心 GPU 上進行加速訓練。首先在有 GT 的合成數(shù)據(jù)上訓練基礎(chǔ)網(wǎng)絡,然后再在手工標注的真實數(shù)據(jù)上進行 finetune。


2、Arena4D 采用了 NVIDIA TensorRT 推理加速引擎,TensorRT 首先對神經(jīng)網(wǎng)絡進行量化處理,然后再優(yōu)化、合并算子,最后經(jīng)過 Batch 化,推理處理速度較原來提升了 4-12 倍,能高效地處理多路攝像頭 4k 高清數(shù)據(jù),實時提取球員的 3D Pose 和外貌特征并進行匹配計算。


3、將原有基于 CPU 運行的數(shù)據(jù)拷貝,圖像格式轉(zhuǎn)換,圖像 crop/resize 等耗時較多的操作流水線,利用 CUDA 進行實現(xiàn),完全切換到 GPU 處理,比起 CPU 實現(xiàn)的方案,加速 50~100 倍。


4、針對體育場景中運動員速度快、運動幅度大、圖像中尺寸小的特點,改進了網(wǎng)絡結(jié)構(gòu)和算子,使其適合體育場這種稀疏變化,追蹤角色小的場景;提升了 MOT 算法,通過多個視圖的 fusion 網(wǎng)絡對 2D 追蹤結(jié)果進行 finetune,實現(xiàn)多視圖在 3D 空間的追蹤。


圖1:整體流程

圖片來源及所屬:Galasports 望塵科技


5、針對神經(jīng)網(wǎng)絡流水線的計算延遲問題,首先根據(jù)體育比賽的使用場景與相機視角對模型結(jié)構(gòu)進行了優(yōu)化,根據(jù)不同體育類型的相機機位和球場尺度,設計了專門針對特定比賽的識別網(wǎng)絡,大大降低了網(wǎng)絡的復雜度;基于連續(xù)幀的姿態(tài)計算骨長度和 BMI 等球員特征,在數(shù)據(jù)庫中進行匹配提升識別準確率;針對多相機從內(nèi)存到顯存大量數(shù)據(jù)拷貝 IObound 問題,使用 CUDA 多流技術(shù)實現(xiàn)了內(nèi)存拷貝與數(shù)據(jù)處理并行化,降低了 overhead,4 路4k 相機數(shù)據(jù)的拷貝與轉(zhuǎn)碼從 50ms 減少到 30ms;然后使用量化工具對網(wǎng)絡進行 fp16/int8(QAT) 量化加速,最后使用 NVIDIA TensorRT 針對 NVIDIA 數(shù)據(jù)中心 GPU 編譯,在 NVIDIA 數(shù)據(jù)中心 GPU 上能達到最優(yōu)性能的模型。


圖2:計算延遲解決思路

圖片來源及所屬:Galasports 望塵科技


6、整個流水線經(jīng)過 TensorRT 編譯運行在 NVIDIA 數(shù)據(jù)中心 GPU 上,每路視頻信號由一張 GPU 進行實時計算,最后在 CPU 中對多路計算結(jié)果降噪融合。最終,以足球場場景為例,追蹤目標為 1 個足球 + 22 名球員 + 3 名教練的位置與骨骼,在一張 NVIDIA 數(shù)據(jù)中心 GPU 設備上我們實現(xiàn)了平均 50ms/幀的速度,在二張 NVIDIA 數(shù)據(jù)中心 GPU 設備上能達到平均 30ms/幀的速度,整個流水線比原型提升了 18 倍。


使用了 NVIDIA TensorRT 推理加速引擎NVIDIA 數(shù)據(jù)中心計算卡,Arena4D 整個流水線可實時運行,進一步提升了用戶使用體驗,為擴展 AI 體育方向的其他業(yè)務、甚至是 XR 場景的加入打下了良好的基礎(chǔ)。


NVIDIA 助力望塵科技

打造新一代實時 AI 體育全場景多維重構(gòu)引擎


Arena4D 通過 NVIDIA TensorRT 等技術(shù),實現(xiàn)了多視圖在 3D 空間的追蹤、提升了識別骨長度和 BMI 等球員特征的準確率、完成了內(nèi)存拷貝與數(shù)據(jù)處理的并行化、改進了網(wǎng)絡結(jié)構(gòu)和算子使其適合體育場的稀疏變化,最終實現(xiàn)全流程 GPU 加速,速度提升超過 50~100 倍。


AI 體育行業(yè)是最受關(guān)注的人工智能應用領(lǐng)域之一,傳統(tǒng)的體育企業(yè)也開始擁抱科技,紛紛引入人工智能產(chǎn)業(yè)。一個集技術(shù)、人才與場景優(yōu)勢的科技企業(yè)必須與一個優(yōu)秀的合作伙伴一起積極開拓和長期發(fā)展。NVIDIA 提供的 GPU 解決方案,解決了深度學習機器學習的技術(shù)難題,使得望塵科技在 AI 體育領(lǐng)域能夠持續(xù)不斷地創(chuàng)新產(chǎn)品,拓寬 AI 應用場景,為觀眾和球迷提供新時代的數(shù)字化全新觀賽體驗。


NVIDIA 初創(chuàng)加速計劃


望塵科技是 NVIDIA 初創(chuàng)加速計劃 (NVIDIA Inception) 會員企業(yè)。NVIDIA 初創(chuàng)加速計劃為免費會員制、旨在培養(yǎng)顛覆行業(yè)格局的優(yōu)秀創(chuàng)業(yè)公司。該計劃聯(lián)合國內(nèi)外知名的風投機構(gòu),創(chuàng)業(yè)孵化器,創(chuàng)業(yè)加速器,行業(yè)合作伙伴以及科技創(chuàng)業(yè)媒體等,打造創(chuàng)業(yè)加速生態(tài)系統(tǒng)。能夠提供產(chǎn)品折扣,技術(shù)支持,市場宣傳,融資對接,業(yè)務推薦等一系列服務,加速創(chuàng)業(yè)公司的發(fā)展。


想獲得 NVIDIA 初創(chuàng)加速生態(tài)助力?掃描下方二維碼,僅需一分鐘填寫意向申請表單,獲得快速聯(lián)系。



原文標題:TensorRT極致推理加速,望塵科技打造新一代實時AI體育全場景多維重構(gòu)引擎

文章出處:【微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4118

    瀏覽量

    99669

原文標題:TensorRT極致推理加速,望塵科技打造新一代實時AI體育全場景多維重構(gòu)引擎

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    HM博學谷狂野AI大模型第四期

    ,為開發(fā)者提供了把打開 AI 黑盒的鑰匙。從 Transformer 的矩陣運算到分布式訓練的工程調(diào)度,再到推理加速極致優(yōu)化,這是
    發(fā)表于 05-01 17:30

    黑馬-Java+AI新版V16零基礎(chǔ)就業(yè)班百度云網(wǎng)盤下載+Java+AI全棧開發(fā)工程師

    傳統(tǒng)開發(fā)升級,Java+AI 融合開發(fā)精講——構(gòu)建下一代企業(yè)級智能應用的技術(shù)棧重塑 在人工智能加速滲透至各行各業(yè)的當下,Java 開發(fā)者正面臨個關(guān)鍵轉(zhuǎn)折點:要么被動旁觀
    發(fā)表于 05-01 11:29

    使用NORDIC AI的好處

    原始傳感器數(shù)據(jù),可顯著降低功耗、延長電池壽命。[Edge AI 概述; Nordic Edge AI 技術(shù)頁] 降低云依賴與時延 直接在設備上做推理,很多決策可以“本地實時”完成,
    發(fā)表于 01-31 23:16

    曦望發(fā)布新一代推理GPU芯片,單位Token推理成本降低90%

    已突破萬片。 ? 啟望S3是專為大模型推理打造的定制化GPGPU芯片。在典型推理場景下,它的整體性價比較上一代提升超10倍。在算力與存儲設計
    的頭像 發(fā)表于 01-28 17:38 ?9795次閱讀

    云巨頭算力戰(zhàn)升級!微軟新一代3nm AI推理芯片性能提升30%,落地數(shù)據(jù)中心

    據(jù)外媒報道,微軟發(fā)布新一代人工智能芯片Maia 200,這款芯片有望成為英偉達旗艦處理器以及云服務競爭對手亞馬遜、谷歌同類產(chǎn)品的替代選擇。微軟稱,這款芯片是為 AI 推理規(guī)?;渴?b class='flag-5'>打造
    的頭像 發(fā)表于 01-27 12:29 ?1w次閱讀
    云巨頭算力戰(zhàn)升級!微軟<b class='flag-5'>新一代</b>3nm <b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片性能提升30%,落地數(shù)據(jù)中心

    算力密度翻倍!江原D20加速卡發(fā)布,卡雙芯重構(gòu)AI推理標桿

    的關(guān)鍵技術(shù)瓶頸。 ? 在此背景下,江原科技推出采用自研AI芯片的AI加速卡江原D10,并在今年5月實現(xiàn)量產(chǎn)交付。在大算力AI芯片全流程國產(chǎn)化產(chǎn)業(yè)鏈實現(xiàn)首次突破后,11月11日,江原科技
    的頭像 發(fā)表于 11-14 08:21 ?1.1w次閱讀
    算力密度翻倍!江原D20<b class='flag-5'>加速</b>卡發(fā)布,<b class='flag-5'>一</b>卡雙芯<b class='flag-5'>重構(gòu)</b><b class='flag-5'>AI</b><b class='flag-5'>推理</b>標桿

    NVIDIA TensorRT LLM 1.0推理框架正式上線

    TensorRT LLM 作為 NVIDIA 為大規(guī)模 LLM 推理打造推理框架,核心目標是突破 NVIDIA 平臺上的推理性能瓶頸。為實
    的頭像 發(fā)表于 10-21 11:04 ?1466次閱讀

    【內(nèi)測活動同步開啟】這么小?這么強?新一代大模型MCP開發(fā)板來啦!

    【內(nèi)測活動同步開啟】這么???這么強?新一代大模型MCP開發(fā)板來啦! 聆思全新一代六合芯片「LS26系列」,搭載WIFI / BLE & BT / NPU,與「小聆AI」強強
    發(fā)表于 09-25 11:47

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    ②Transformer引擎③NVLink Switch系統(tǒng)④機密計算⑤HBM FPGA: 架構(gòu)的主要特點:可重構(gòu)邏輯和路由,可以快速實現(xiàn)各種不同形式的神經(jīng)網(wǎng)絡加速。 ASIC: 介紹了幾種ASIC
    發(fā)表于 09-12 16:07

    積算科技上線赤兔推理引擎服務,創(chuàng)新解鎖FP8大模型算力

    的模型輕量化部署方案。用戶通過遠程算力平臺預置的模型鏡像與AI工具,僅需50%的GPU算力即可解鎖大模型推理、企業(yè)知識庫搭建、智能體開發(fā),加速大模型在智能問答、報告生成、客服助手、智能體等典型行業(yè)
    的頭像 發(fā)表于 07-30 21:44 ?1080次閱讀

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡智能診斷邁向 “自愈”時代

    模態(tài)的技術(shù)特性,DeepSeek正加速推動AI在金融、政務、科研及網(wǎng)絡智能化等關(guān)鍵領(lǐng)域的深度應用。 信而泰:AI推理引擎賦能網(wǎng)絡智能診斷新范
    發(fā)表于 07-16 15:29

    如何在魔搭社區(qū)使用TensorRT-LLM加速優(yōu)化Qwen3系列模型推理部署

    TensorRT-LLM 作為 NVIDIA 專為 LLM 推理部署加速優(yōu)化的開源庫,可幫助開發(fā)者快速利用最新 LLM 完成應用原型驗證與產(chǎn)品部署。
    的頭像 發(fā)表于 07-04 14:38 ?2477次閱讀

    PTR54L15系列低功耗無線多協(xié)議模組

    PTR54L15系列多協(xié)議無線模組,基于Nordic新一代nRF54L15平臺打造,以超低功耗、高性能和多協(xié)議支持為核心,為智能家居、工業(yè)自動化、可穿戴設備等場景提供了站式解決方案。
    發(fā)表于 06-28 21:23

    廣和通發(fā)布新一代AI語音智能體FiboVista

    近日,2025火山引擎Force原動力大會正式開幕。廣和通發(fā)布新一代AI語音智能體FiboVista,并已率先應用于車聯(lián)網(wǎng),成為智能駕駛的“用車伙伴”和“出行伴侶”。通過創(chuàng)新AI大模型
    的頭像 發(fā)表于 06-17 09:22 ?1453次閱讀

    AI驅(qū)動智慧交通:加速應用場景落地

    智慧交通與人工智能的深度融合正在催生新一代交通生態(tài)系統(tǒng),這種融合不僅體現(xiàn)在技術(shù)層面的創(chuàng)新突破,更在于重構(gòu)了整個交通產(chǎn)業(yè)的運行邏輯和價值鏈條。AI技術(shù)作為智慧交通的核心引擎,通過算法、算
    的頭像 發(fā)表于 06-06 14:12 ?793次閱讀
    息烽县| 辉县市| 阜新| 横山县| 新宁县| 霍邱县| 黔江区| 玉田县| 堆龙德庆县| 通州市| 山东省| 郴州市| 黎川县| 邵阳市| 衢州市| 随州市| 锦屏县| 麻城市| 瑞安市| 屯门区| 上栗县| 开平市| 米泉市| 白城市| 卢氏县| 迭部县| 来安县| 怀远县| 宁陵县| 铜陵市| 济宁市| 三明市| 南涧| 青海省| 海安县| 昔阳县| 双柏县| 昌宁县| 原阳县| 定日县| 阿尔山市|