日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Triton系列文章:開發(fā)資源說明

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-11-09 16:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大部分要學(xué)習(xí) Triton 推理服務(wù)器的入門者,都會(huì)被搜索引擎或網(wǎng)上文章引導(dǎo)至官方的https://developer.nvidia.com/nvidia-triton-inference-server處(如下截圖),然后從 “Get Started” 直接安裝服務(wù)器與用戶端軟件、創(chuàng)建基礎(chǔ)的模型倉、執(zhí)行一些最基本的范例。

075dc9d0-5f58-11ed-8abf-dac502259ad0.png

這條路徑雖然能在很短時(shí)間內(nèi)跑起 Triton 的應(yīng)用,但在未掌握整個(gè)應(yīng)用架構(gòu)之前便貿(mào)然執(zhí)行,反倒容易讓初學(xué)者陷入迷失的狀態(tài),因此建議初學(xué)者最好先對(duì) Triton 項(xiàng)目有比較更完整的了解之后,再執(zhí)行前面的 “Get Started” 就會(huì)更容易掌握項(xiàng)目的精髓。

要獲得比較完整的 Triton 技術(shù)資料,就得到項(xiàng)目開源倉里去尋找。與 NVIDIA 其他放在 https://github.com/NVIDIA或https://github.com/NVIDIA-AI-IOT的項(xiàng)目不同,Triton 項(xiàng)目有獨(dú)立的開源倉,位置在https://github.com/triton-inference-server,進(jìn)入開源倉后會(huì)看到如下截屏的內(nèi)容:

0777b1f6-5f58-11ed-8abf-dac502259ad0.png

下面列出四大部分的技術(shù)資源:

1. Getting Start(新手上路):

這里提供三個(gè)鏈接,比較重要的是 “Quick Start(快速啟動(dòng))” 的部分,提供以下三個(gè)步驟就能輕松執(zhí)行 Triton 的基礎(chǔ)示范:

(1) Create a Model Repository(創(chuàng)建模型倉)

(2) Launch Triton(啟動(dòng)Triton服務(wù)器與用戶端)

(3) Send an Inference Request(提交推理要求)

2. Production Documentation(生產(chǎn)文件):

這里最重要的是 “server documents on GitHub” 鏈接,點(diǎn)進(jìn)去后會(huì)進(jìn)入整個(gè) Triton 項(xiàng)目中最完整的技術(shù)文件中心(如下圖),除 Installation 與 Getting Started 屬于入門范疇,其余 User Guide、API Guide、Additional Resources 與 Customization Guide 等四個(gè)部分,都是 Triton 推理服務(wù)器非常重要的技術(shù)內(nèi)容。

079daa00-5f58-11ed-8abf-dac502259ad0.png

因此這個(gè)部分可以算得上是學(xué)習(xí) Triton 服務(wù)器的最重要資源。

例如點(diǎn)擊 “User Guide” 之后,就會(huì)看到以下所條例的執(zhí)行步驟:

Creating a Model Repository

Writing a Model Configuration

Buillding a Model Pipeline

Managing Model Availablity

Collecting Server Metrics

Supporting Custom Ops/layers

Using the Client API

Analyzing Performance

Deploying on edge (Jetson)

3. Examples(范例):

這里的范例,比較重要的是指向https://github.com/NVIDIA/DeepLearningExamples鏈接,列出針對(duì) NVIDIA Tensor Core 計(jì)算單元的深度學(xué)習(xí)模型列表,包括計(jì)算機(jī)視覺、NLP 自然語言處理、推薦系統(tǒng)、語音轉(zhuǎn)文字 / 文字轉(zhuǎn)語音、圖形神經(jīng)網(wǎng)絡(luò)、時(shí)間序列等各種神經(jīng)網(wǎng)絡(luò)模型細(xì)節(jié),包括網(wǎng)絡(luò)結(jié)構(gòu)與相關(guān)參數(shù)的內(nèi)容。

對(duì)于未來要在 Triton 服務(wù)器上,對(duì)于所使用的網(wǎng)絡(luò)后端進(jìn)行性能優(yōu)化或者創(chuàng)建新的后端,會(huì)有很大的助益,但是對(duì)于初學(xué)者來說是相對(duì)艱澀的,因此現(xiàn)階段先不做深入的說明與示范。

4. Feedback(反饋):

這里會(huì)鏈接到https://github.com/triton-inference-server/server/issues問題中心,是 Triton 項(xiàng)目中最重要的技術(shù)問題解決資源之一,后面執(zhí)行過程中所遇到的問題,都可以先到這里來查看是否有人已經(jīng)提出?如果沒有的話,也可以在這里提交自己所遇到的問題,項(xiàng)目負(fù)責(zé)人會(huì)提供合適的回復(fù)。

以上第 2、4 兩項(xiàng)資源,對(duì)初學(xué)者來說會(huì)有最大的幫助。接著看一下項(xiàng)目里 “釘?。≒inned)” 的 6 個(gè)倉(如下圖),是比較重要的基礎(chǔ)部分,涵蓋了 Triton 架構(gòu)圖中的主要板塊。

07cfb18a-5f58-11ed-8abf-dac502259ad0.png

主要內(nèi)容如下:

1. server 倉:

這里集成整個(gè)項(xiàng)目的主要內(nèi)容,包括幾部分:

(1)deploy(部署):提供在阿里巴巴、亞馬遜等云資源的部署方式,以及基于 NVIDIA Fleet 指令集、GKE(Google kubernets Engine)、k8s、Helm 等應(yīng)用平臺(tái)的各種部署方法;

(2)docker(容器):修正一些創(chuàng)建容器腳本的錯(cuò)誤;

(3)docs(使用說明):就是前面 “生產(chǎn)文件(Production Documentation)” 的內(nèi)容,這里不重復(fù)贅述;

(4)qa(質(zhì)量優(yōu)化):由于 Triton 推理服務(wù)器有非常多優(yōu)化的環(huán)節(jié),在這個(gè)目錄下提供上百個(gè)不同狀況的優(yōu)化測(cè)試腳本;

(5)src(源代碼):目錄下存放整個(gè) Triton 推理服務(wù)器的開源代碼(.cc)、頭文件(.h)與編譯腳本(CMakeLists.txt);

(6)其他代碼與腳本

2. core 倉:

此存儲(chǔ)庫包含實(shí)現(xiàn) Triton 核心功能的庫的源代碼和標(biāo)頭。核心庫可以如下所述構(gòu)建,并通過其 CAPI 直接使用。為了有用,核心庫必須與一個(gè)或多個(gè)后端配對(duì)。您可以在后端回購中了解有關(guān)后端的更多信息。

3. backend 倉:

提供創(chuàng)建 Triton 服務(wù)器后端(backend)的源代碼、腳本與工具?!昂蠖恕?是用來執(zhí)行不同深度學(xué)習(xí)模型的管理模塊,以深度學(xué)習(xí)框架進(jìn)行封裝,例如 PyTorch、Tensorflow、ONNX Runtime 與 TensorRT 等等,用戶也可以為了性能目的,自行定義 C / C++ 封裝方式。

4. client 倉:

提供 Triton 用戶端的 C++ / Python / Java 開發(fā)接口、能生成適用于不同編程語言的 GRPC 開發(fā)接口的 protoc 編譯器,以及對(duì)應(yīng)的用戶端范例;

5. model_analyzer 倉:

深度學(xué)習(xí)模型(model)是 Triton 推理服務(wù)器的最基礎(chǔ)組成元件,因此對(duì)分析模型的計(jì)算與內(nèi)存需求是服務(wù)器性能的一項(xiàng)關(guān)鍵功能。這個(gè) model_analyzer 模型分析工具是一種 CLI 工具,這款新工具可以自動(dòng)化地從數(shù)百種組合中為 AI 模型選擇最佳配置,以實(shí)現(xiàn)最優(yōu)性能,同時(shí)確保應(yīng)用程序所需的服務(wù)質(zhì)量,能幫助開發(fā)人員更好地了解不同配置中的權(quán)衡,并選擇能夠最大化 Triton 的性能配置;

6. model_navigator 倉:

這個(gè) model_navigator 模型導(dǎo)航器是一種能夠自動(dòng)將模型從源移動(dòng)到最佳格式和配置的工具,支持將模型從源導(dǎo)出為所有可能的格式,并應(yīng)用 Triton 服務(wù)器的后端優(yōu)化。使用模型分析器能找到最佳的模型配置,匹配提供的約束條件并優(yōu)化性能。

以上是 Triton 開源項(xiàng)目里比較核心的 6 個(gè)倉,另外還有 20 多個(gè)代碼倉,其中大約 15 個(gè)是項(xiàng)目提供的后端(backend)擴(kuò)充應(yīng)用,例如 tensorrt_backend、fil_backend、square_backend 等等,以及一些額外的管理工具,并且不斷增加中。

本系列后面的內(nèi)容都會(huì)基于這個(gè) server 倉的 docs 目錄下的內(nèi)容為主,按部就班地帶著讀者循序漸進(jìn)創(chuàng)建與調(diào)試 Triton 推理服務(wù)器的運(yùn)作環(huán)境。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5696

    瀏覽量

    110142
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    14

    文章

    10371

    瀏覽量

    91774

原文標(biāo)題:NVIDIA Triton 系列文章(3):開發(fā)資源說明

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    芯科科技發(fā)布Simplicity SDK for Zephyr開發(fā)資源

    的質(zhì)量保證、可靠性和先進(jìn)的嵌入式無線連接開發(fā)的支持相結(jié)合。我們還特別制作了Simplicity SDK for Zephyr開發(fā)流程的網(wǎng)站資源,以協(xié)助采用芯科科技無線SoC產(chǎn)品的開發(fā)
    的頭像 發(fā)表于 03-31 15:26 ?902次閱讀

    借助NVIDIA CUDA Tile IR后端推進(jìn)OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計(jì)目標(biāo)是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的一大優(yōu)勢(shì)是允許開發(fā)者基于其構(gòu)建自定義的 DS
    的頭像 發(fā)表于 02-10 10:31 ?550次閱讀

    NVIDIA全新開放物理AI模型和框架加速人形機(jī)器人開發(fā)

    本文是洞悉 Omniverse 系列文章。“洞悉 Omniverse”重點(diǎn)介紹開發(fā)者、3D 從業(yè)者與企業(yè)如何使用 OpenUSD 和 NVIDIA Omniverse 的最新進(jìn)展從根本上變革他們的工作流程。
    的頭像 發(fā)表于 02-06 15:36 ?825次閱讀

    NVIDIA 推出 Alpamayo 系列開源 AI 模型與工具,加速安全可靠的推理型輔助駕駛汽車開發(fā)

    新聞?wù)?: l NVIDIA 率先發(fā)布為應(yīng)對(duì)輔助駕駛長尾場景挑戰(zhàn)而設(shè)計(jì)的開源視覺-語言-動(dòng)作推理模型(Reasoning VLA);NVIDIA Alpamayo 系列還包含賦能輔助駕駛汽車
    的頭像 發(fā)表于 01-06 09:40 ?530次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Alpamayo <b class='flag-5'>系列</b>開源 AI 模型與工具,加速安全可靠的推理型輔助駕駛汽車<b class='flag-5'>開發(fā)</b>

    NVIDIA Jetson系列開發(fā)者套件助力打造面向未來的智能機(jī)器人

    NVIDIA Jetson AGX Thor、AGX Orin 以及 Jetson Orin Nano Super 開發(fā)者套件,助力打造面向未來的智能機(jī)器人。
    的頭像 發(fā)表于 12-13 10:20 ?3387次閱讀

    利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測(cè)試與驗(yàn)證數(shù)據(jù)生成。借助 NVIDIA Omniverse 庫和 Cosmos,
    的頭像 發(fā)表于 12-01 09:25 ?1486次閱讀

    面向科學(xué)仿真的開放模型系列NVIDIA Apollo正式發(fā)布

    用于加速工業(yè)和計(jì)算工程的開放模型系列 NVIDIA Apollo 于近日舉行的 SC25 大會(huì)上正式發(fā)布。
    的頭像 發(fā)表于 11-25 11:15 ?7.4w次閱讀

    NVIDIA DRIVE AGX Thor開發(fā)者套件重磅發(fā)布

    這款由 NVIDIA DriveOS 7 驅(qū)動(dòng)的開發(fā)者套件能夠幫助開發(fā)者們打造出更安全的智能汽車和交通解決方案。
    的頭像 發(fā)表于 09-04 11:20 ?1641次閱讀

    NVIDIA Omniverse Extension開發(fā)秘籍

    NVIDIA Omniverse 是一個(gè)模塊化平臺(tái),使用高級(jí) API 和微服務(wù)來構(gòu)建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 應(yīng)用。OpenUSD 功能強(qiáng)大的 3D 框架與 NVIDIA RTX 用于視覺渲
    的頭像 發(fā)表于 08-22 15:52 ?3881次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse Extension<b class='flag-5'>開發(fā)</b>秘籍

    芯科科技Arduino開發(fā)資源重大更新

    Silicon Labs (芯科科技)近期于在線技術(shù)社群中發(fā)布了面向Arduino Core和Matter庫的重大更新,帶來了兩個(gè)關(guān)鍵突破:全面支持Matter 1.4標(biāo)準(zhǔn),以及人工智能和機(jī)器學(xué)習(xí)(AI/ML)無線共存(Wireless Coexistence),從而實(shí)現(xiàn)更強(qiáng)的連接能力、更廣泛的設(shè)備支持。
    的頭像 發(fā)表于 08-20 15:51 ?1148次閱讀

    NVIDIA桌面GPU系列擴(kuò)展新產(chǎn)品

    NVIDIA 桌面 GPU 系列擴(kuò)展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell GPU,可提高工程、內(nèi)容創(chuàng)作和 3D 可視化等應(yīng)用的性能。
    的頭像 發(fā)表于 08-18 11:50 ?1681次閱讀

    方寸之間構(gòu)筑系統(tǒng)級(jí)可靠性,納芯微發(fā)布國產(chǎn)首款高性能 2 線制霍爾開關(guān) MT72xx系列

    納芯微發(fā)布國內(nèi)首款2線制霍爾開關(guān)MT72xx系列,具有卓越EMC性能、豐富極性選擇和高集成設(shè)計(jì),滿足車規(guī)標(biāo)準(zhǔn),適用于車身電子和域控制器長線束場景,能減少線束數(shù)量與成本,提升系統(tǒng)可靠性,還配備全套開發(fā)資源,助力客戶縮短項(xiàng)目周期。
    的頭像 發(fā)表于 06-27 16:56 ?1058次閱讀

    使用NVIDIA Triton和TensorRT-LLM部署TTS應(yīng)用的最佳實(shí)踐

    針對(duì)基于 Diffusion 和 LLM 類別的 TTS 模型,NVIDIA Triton 和 TensorRT-LLM 方案能顯著提升推理速度。在單張 NVIDIA Ada Lovelace
    的頭像 發(fā)表于 06-12 15:37 ?2107次閱讀
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Triton</b>和TensorRT-LLM部署TTS應(yīng)用的最佳實(shí)踐

    NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了機(jī)器人仿真參考應(yīng)用 NVIDIA Isaac Sim 和機(jī)器人學(xué)習(xí)框架 NVIDIA Isaac Lab 的更新,以加速各種形態(tài)機(jī)器人的
    的頭像 發(fā)表于 05-28 10:06 ?2441次閱讀

    芯科科技助力藍(lán)牙Mesh設(shè)備開發(fā)

    藍(lán)牙Mesh 1.1是藍(lán)牙技術(shù)聯(lián)盟(Bluetooth SIG)發(fā)布的最新標(biāo)準(zhǔn)版本,Silicon Labs(芯科科技)作為開發(fā)和實(shí)施藍(lán)牙Mesh標(biāo)準(zhǔn)的主要貢獻(xiàn)者之一,特別制作了藍(lán)牙Mesh開發(fā)流程頁面,以幫助開發(fā)人員快速了解新
    的頭像 發(fā)表于 05-16 13:51 ?1519次閱讀
    芯科科技助力藍(lán)牙Mesh設(shè)備<b class='flag-5'>開發(fā)</b>
    陵水| 仁布县| 桓台县| 资中县| 哈密市| 尼勒克县| 武定县| 庆元县| 景洪市| 嘉善县| 佛学| 海丰县| 龙江县| 罗定市| 巢湖市| 丹阳市| 长顺县| 乾安县| 山西省| 新河县| 曲麻莱县| 外汇| 定襄县| 镇雄县| 林口县| 织金县| 衡山县| 东平县| 峡江县| 剑阁县| 乌鲁木齐县| 博爱县| 永善县| 乐都县| 阿克苏市| 阿勒泰市| 安图县| 扬州市| 尚志市| 威海市| 定西市|