日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Triton 系列文章(13):模型與調(diào)度器-3

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:未知 ? 2023-02-03 04:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前面兩篇文章,已經(jīng)將 Triton 的“無(wú)狀態(tài)模型”、“有狀態(tài)模型”與標(biāo)準(zhǔn)調(diào)度器的動(dòng)態(tài)批量處理器與序列批量處理器的使用方式,做了較完整的說(shuō)明。 大部分的實(shí)際應(yīng)用都不是單純的推理模型就能完成服務(wù)的需求,需要形成前后關(guān)系的工作流水線(xiàn)。例如一個(gè)二維碼掃描的應(yīng)用,除了需要第一關(guān)的二維碼識(shí)別模型之外,后面可能還得將識(shí)別出來(lái)的字符傳遞給語(yǔ)句識(shí)別的推理模型、關(guān)鍵字搜索引擎等功能,最后找到用戶(hù)所需要的信息,反饋給提出需求的用戶(hù)端。 本文的內(nèi)容要說(shuō)明 Triton 服務(wù)器形成工作流水線(xiàn)的“集成推理”功能,里面包括“集成模型(ensemble model)”“集成調(diào)度器(ensemble scheduler)”兩個(gè)部分。下面是個(gè)簡(jiǎn)單的推理流水線(xiàn)示意圖,目的是對(duì)請(qǐng)求的輸入圖像最終反饋“圖像分類(lèi)”與“語(yǔ)義分割”兩個(gè)推理結(jié)果: 6bce43b4-a33b-11ed-bfe3-dac502259ad0.png 當(dāng)接收到集成模型的推斷請(qǐng)求時(shí),集成調(diào)度器將:
  1. 確認(rèn)請(qǐng)求中的“IMAGE”張量映射到預(yù)處理模型中的輸入“RAW_IMAGE”。
  2. 檢查集合中的模型,并向預(yù)處理模型發(fā)送內(nèi)部請(qǐng)求,因?yàn)樗璧乃休斎霃埩慷家丫途w。
  3. 識(shí)別內(nèi)部請(qǐng)求的完成,收集輸出張量并將內(nèi)容映射到“預(yù)處理圖像”,這是集成中已知的唯一名稱(chēng)。
  4. 將新收集的張量映射到集合中模型的輸入。在這種情況下,“classification_model”和“segmentation_model”的輸入將被映射并標(biāo)記為就緒。
  5. 檢查需要新收集的張量的模型,并向輸入就緒的模型發(fā)送內(nèi)部請(qǐng)求,在本例中是分類(lèi)模型和分割模型。請(qǐng)注意,響應(yīng)將根據(jù)各個(gè)模型的負(fù)載和計(jì)算時(shí)間以任意順序排列。
  6. 重復(fù)步驟 3-5,直到不再發(fā)送內(nèi)部請(qǐng)求,然后用集成輸出名稱(chēng)的張量去響應(yīng)推理請(qǐng)求。
整個(gè)流水線(xiàn)使用 3 個(gè)模型,并進(jìn)行以下三個(gè)處理步驟:
  1. 使用 image_prepoecess_model 模型,將原始圖像處理成preprocessed_image 數(shù)據(jù);
  2. 將 preprocessed_image 數(shù)據(jù)傳遞給 classification_model 模型,執(zhí)行圖像分類(lèi)推理,最終返回“CLASSIFICATION”結(jié)果;
  3. 將 preprocessed_image 數(shù)據(jù)傳遞給 segmentation_model 模型,執(zhí)行語(yǔ)義分割推理計(jì)算,最終返回“SEGMENTATION”結(jié)果;
在執(zhí)行過(guò)程中,推理服務(wù)器必須支持以下的功能,才能將多種推理模型集成一個(gè)或多個(gè)工作流水線(xiàn),去執(zhí)行完整的工作流程:
  • 支持一個(gè)或多個(gè)模型的流水線(xiàn)以及這些模型之間輸入和輸出張量的連接;
  • 處理多個(gè)模型的模型拼接或數(shù)據(jù)流,例如“數(shù)據(jù)處理->推理->數(shù)據(jù)后處理”等;
  • 收集每個(gè)步驟中的輸出張量,并根據(jù)規(guī)范將其作為其他步驟的輸入張量;
  • 所集成的模型能繼承所涉及模型的特征,在請(qǐng)求方的元數(shù)據(jù)必須符合集成中的模型;
為了實(shí)現(xiàn)的推理流水線(xiàn)功能,Triton 服務(wù)器使用集成模型與集成調(diào)度器的配合,來(lái)完成這類(lèi)工作流水線(xiàn)的搭建管理。接著就執(zhí)行以下步驟來(lái)創(chuàng)建一個(gè)流水線(xiàn)所需要的配套內(nèi)容:
  1. 在模型倉(cāng)里為流水線(xiàn)創(chuàng)建一個(gè)新的“組合模型”文件夾,例如為“ensemble_model”;
  2. 在目路下創(chuàng)建新的 config.pbtxt,并且使用“platform: "ensemble"”來(lái)定義這個(gè)模型要執(zhí)行集成功能;
  3. 定義集成模型:
無(wú)論工作流水線(xiàn)中調(diào)用多少個(gè)模型,Triton 服務(wù)器都將這樣的組合視為一個(gè)模型,與其他模型配置一樣,需要定義輸入與輸出節(jié)點(diǎn)的張量類(lèi)型與尺度。 以上面示例圖中的要求,這個(gè)集成模型有一個(gè)名為“IMAGE”的輸入節(jié),與兩個(gè)名為“CLASSIFICATION”“SEGMENTATION”的輸出節(jié)點(diǎn),至于數(shù)據(jù)類(lèi)型與張量維度內(nèi)容,就得根據(jù)實(shí)際使用的模型去匹配。這部分配置的參考內(nèi)容如下:
name:"ensemble_model"
platform: "ensemble"
max_batch_size: 1
input [
  {
    name: "IMAGE"
    data_type: TYPE_STRING
    dims: [ 1 ]
  }
]
output [
  {
    name: "CLASSIFICATION"
    data_type: TYPE_FP32
    dims: [ 1000 ]
  },
  {
    name: "SEGMENTATION"
    data_type: TYPE_FP32
    dims: [ 3, 224, 224 ]
  }
]
從這個(gè)內(nèi)容中可以看出,Triton 服務(wù)器將這個(gè)集成模型視為一個(gè)獨(dú)立模型。 4. 定義模型的集成調(diào)度器:這部分使用“ensemble_scheduling”來(lái)調(diào)動(dòng)集成調(diào)度器,將使用到模型與數(shù)據(jù)形成完整的交互關(guān)系。 在上面示例圖中,灰色區(qū)塊所形成的工作流水線(xiàn)中,使用到 image_prepoecess_model、classification_model、segmentation_model 三個(gè)模型,以及 preprocessed_image 數(shù)據(jù)在模型中進(jìn)行傳遞。 下面提供這部分的范例配置內(nèi)容,一開(kāi)始使用“ensemble_scheduling”來(lái)調(diào)用集成調(diào)度器,里面再用“step”來(lái)定義模組之間的執(zhí)行關(guān)系,透過(guò)模型的“input_map”“output_map”“key:value”對(duì)的方式,串聯(lián)起模型之間的交互動(dòng)作:
ensemble_scheduling{
  step [
    {
      model_name: "image_preprocess_model"
      model_version: -1
      input_map {
        key: "RAW_IMAGE"
        value: "IMAGE"
      }
      output_map {
        key: "PREPROCESSED_OUTPUT"
        value: "preprocessed_image"
      }
    },
    {
      model_name: "classification_model"
      model_version: -1
      input_map {
        key: "FORMATTED_IMAGE"
        value: "preprocessed_image"
      }
      output_map {
        key: "CLASSIFICATION_OUTPUT"
        value: "CLASSIFICATION"
      }
    },
    {
      model_name: "segmentation_model"
      model_version: -1
      input_map {
        key: "FORMATTED_IMAGE"
        value: "preprocessed_image"
      }
      output_map {
        key: "SEGMENTATION_OUTPUT"
        value: "SEGMENTATION"
      }
    }
  ]
}
這里簡(jiǎn)單說(shuō)明一下工作流程: (1) 模型 image_preprocess_model 接收外部輸入的 IMAGE 數(shù)據(jù),進(jìn)行圖像預(yù)處理任務(wù),輸出 preprocessed_image 數(shù)據(jù);(2) 模型 classification_model 的輸入為 preprocessed_image,表示這個(gè)模型的工作是在 image_preprocess_model 之后的任務(wù),執(zhí)行的推理輸出為 CLASSIFICATION;(3) 模型 segmentation_model 的輸入為 preprocessed_image,表示這個(gè)模型的工作是在 image_preprocess_model 之后的任務(wù),執(zhí)行的退輸出為 SEGMENTATION;(4) 上面兩步驟可以看出 classification_model 與 segmentation_model 屬于分支的同級(jí)模型,與上面工作流圖中的要求一致。 完成以上的步驟,就能用集成模型與集成調(diào)度器的搭配,來(lái)創(chuàng)建一個(gè)完整的推理工作流任務(wù),相當(dāng)簡(jiǎn)單。 不過(guò)這類(lèi)集成模型中,還有以下幾個(gè)需要注意的重點(diǎn):
  • 這是 Triton 服務(wù)器用來(lái)執(zhí)行用戶(hù)定義模型流水線(xiàn)的抽象形式,由于沒(méi)有與集成模型關(guān)聯(lián)的物理實(shí)例,因此不能為其指定 instance_group 字段;
  • 不過(guò)集成模型內(nèi)容所組成的個(gè)別模型(例如image_preprocess_model),可以在其配置文件中指定 instance_group,并在集成接收到多個(gè)請(qǐng)求時(shí)單獨(dú)支持并行執(zhí)行。
  • 由于集成模型將繼承所涉及模型的特性,因此在請(qǐng)求起點(diǎn)的元數(shù)據(jù)(本例為“IMAGE”)必須符合集成中的模型,如果其中一個(gè)模型是有狀態(tài)模型,那么集成模型的推理請(qǐng)求應(yīng)該包含有狀態(tài)模型中提到的信息,這些信息將由調(diào)度器提供給有狀態(tài)模型。
總的來(lái)說(shuō),Triton 服務(wù)器提供的集成功能還是相對(duì)容易理解與操作的,只要大家留意模型之間所傳遞的數(shù)據(jù)張量格式與尺度,就能輕松搭建起這樣的推理工作流,去面對(duì)實(shí)際環(huán)境中更多變的使用需求。


原文標(biāo)題:NVIDIA Triton 系列文章(13):模型與調(diào)度器-3

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4116

    瀏覽量

    99668

原文標(biāo)題:NVIDIA Triton 系列文章(13):模型與調(diào)度器-3

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA 擴(kuò)展開(kāi)放模型系列,推動(dòng)代理式、物理和醫(yī)療 AI 下一階段發(fā)展

    新聞?wù)?●NVIDIA Nemotron 3 全模態(tài)理解模型 (Omni-understanding Models) 為 AI 智能體提供動(dòng)力 ,使其能夠?qū)崿F(xiàn)自然對(duì)話(huà)、復(fù)雜推理和高級(jí)視覺(jué)能力
    的頭像 發(fā)表于 03-17 09:18 ?548次閱讀
    <b class='flag-5'>NVIDIA</b> 擴(kuò)展開(kāi)放<b class='flag-5'>模型</b><b class='flag-5'>系列</b>,推動(dòng)代理式、物理和醫(yī)療 AI 下一階段發(fā)展

    NVIDIA Jetson模型賦能AI在邊緣端落地

    開(kāi)源生成式 AI 模型不再局限于數(shù)據(jù)中心,而是開(kāi)始深入到現(xiàn)實(shí)世界的各種機(jī)器中。從 Orin 到 Thor,NVIDIA Jetson 系列正在成為運(yùn)行 NVIDIA Nemotron、
    的頭像 發(fā)表于 03-16 16:27 ?683次閱讀
    <b class='flag-5'>NVIDIA</b> Jetson<b class='flag-5'>模型</b>賦能AI在邊緣端落地

    借助NVIDIA CUDA Tile IR后端推進(jìn)OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計(jì)目標(biāo)是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的一大優(yōu)勢(shì)是允許開(kāi)發(fā)者基于其構(gòu)建自定義的 DS
    的頭像 發(fā)表于 02-10 10:31 ?560次閱讀

    NVIDIA 推出 Nemotron 3 系列開(kāi)放模型

    新聞?wù)?● Nemotron 3 系列開(kāi)放模型包含 Nano、Super 和 Ultra 三種規(guī)模,具有極高的效率和領(lǐng)先的精度,適用于代理式 AI 應(yīng)用開(kāi)發(fā)。 ● Nemotron 3
    的頭像 發(fā)表于 12-16 09:27 ?869次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Nemotron <b class='flag-5'>3</b> <b class='flag-5'>系列</b>開(kāi)放<b class='flag-5'>模型</b>

    NVIDIA攜手Mistral AI發(fā)布全新開(kāi)源大語(yǔ)言模型系列

    全新 Mistral 3 系列涵蓋從前沿級(jí)到緊湊型模型,針對(duì) NVIDIA 平臺(tái)進(jìn)行了優(yōu)化,助力 Mistral AI 實(shí)現(xiàn)云到邊緣分布式智能愿景。
    的頭像 發(fā)表于 12-13 09:58 ?1496次閱讀

    NVIDIA推動(dòng)面向數(shù)字與物理AI的開(kāi)源模型發(fā)展

    NVIDIA 發(fā)布一系列涵蓋語(yǔ)音、安全與輔助駕駛領(lǐng)域的全新 AI 工具,其中包括面向移動(dòng)出行領(lǐng)域的行業(yè)級(jí)開(kāi)源視覺(jué)-語(yǔ)言-動(dòng)作推理模型(Reasoning VLA) NVIDIA DRI
    的頭像 發(fā)表于 12-13 09:50 ?1586次閱讀

    利用NVIDIA Cosmos開(kāi)放世界基礎(chǔ)模型加速物理AI開(kāi)發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開(kāi)放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測(cè)試與驗(yàn)證數(shù)據(jù)生成。借助 NVID
    的頭像 發(fā)表于 12-01 09:25 ?1494次閱讀

    面向科學(xué)仿真的開(kāi)放模型系列NVIDIA Apollo正式發(fā)布

    用于加速工業(yè)和計(jì)算工程的開(kāi)放模型系列 NVIDIA Apollo 于近日舉行的 SC25 大會(huì)上正式發(fā)布。
    的頭像 發(fā)表于 11-25 11:15 ?7.4w次閱讀

    NVIDIA ACE現(xiàn)已支持開(kāi)源Qwen3-8B小語(yǔ)言模型

    為助力打造實(shí)時(shí)、動(dòng)態(tài)的 NPC 游戲角色,NVIDIA ACE 現(xiàn)已支持開(kāi)源 Qwen3-8B 小語(yǔ)言模型(SLM),可實(shí)現(xiàn) PC 游戲中的本地部署。
    的頭像 發(fā)表于 10-29 16:59 ?1460次閱讀

    NVIDIA開(kāi)源Audio2Face模型及SDK

    NVIDIA 現(xiàn)已開(kāi)源 Audio2Face 模型與 SDK,讓所有游戲和 3D 應(yīng)用開(kāi)發(fā)者都可以構(gòu)建并部署帶有先進(jìn)動(dòng)畫(huà)的高精度角色。NVIDIA 開(kāi)源 Audio2Face 的訓(xùn)練框
    的頭像 發(fā)表于 10-21 11:11 ?1039次閱讀
    <b class='flag-5'>NVIDIA</b>開(kāi)源Audio2Face<b class='flag-5'>模型</b>及SDK

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準(zhǔn)確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?2058次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2推理<b class='flag-5'>模型</b>發(fā)布

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 開(kāi)源其物理 AI 平臺(tái) NVIDIA Cosmos 中的關(guān)鍵模型——NVIDIA Cosmos Reason-1-7B。這款先進(jìn)的多模態(tài)大
    的頭像 發(fā)表于 07-09 10:17 ?1042次閱讀

    使用NVIDIA Triton和TensorRT-LLM部署TTS應(yīng)用的最佳實(shí)踐

    針對(duì)基于 Diffusion 和 LLM 類(lèi)別的 TTS 模型,NVIDIA Triton 和 TensorRT-LLM 方案能顯著提升推理速度。在單張 NVIDIA Ada Love
    的頭像 發(fā)表于 06-12 15:37 ?2118次閱讀
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Triton</b>和TensorRT-LLM部署TTS應(yīng)用的最佳實(shí)踐

    NVIDIA RTX 5880 Ada與Qwen3系列模型實(shí)測(cè)報(bào)告

    近日,阿里巴巴通義千問(wèn)團(tuán)隊(duì)正式推出新一代開(kāi)源大語(yǔ)言模型——Qwen3 系列,該系列包含 6 款 Dense 稠密模型和 2 款 MoE 混合
    的頭像 發(fā)表于 05-09 15:05 ?4733次閱讀
    <b class='flag-5'>NVIDIA</b> RTX 5880 Ada與Qwen<b class='flag-5'>3</b><b class='flag-5'>系列</b><b class='flag-5'>模型</b>實(shí)測(cè)報(bào)告

    NVIDIA使用Qwen3系列模型的最佳實(shí)踐

    阿里巴巴近期發(fā)布了其開(kāi)源的混合推理大語(yǔ)言模型 (LLM) 通義千問(wèn) Qwen3,此次 Qwen3 開(kāi)源模型系列包含兩款混合專(zhuān)家
    的頭像 發(fā)表于 05-08 11:45 ?3248次閱讀
    <b class='flag-5'>NVIDIA</b>使用Qwen<b class='flag-5'>3</b><b class='flag-5'>系列</b><b class='flag-5'>模型</b>的最佳實(shí)踐
    常山县| 遵义县| 湄潭县| 鄂托克前旗| 上思县| 本溪| 拉萨市| 长宁区| 凉山| 九寨沟县| 高邑县| 上杭县| 汕尾市| 天峻县| 聂拉木县| 丰镇市| 航空| 朝阳区| 高陵县| 安福县| 中西区| 祁东县| 景德镇市| 泽库县| 怀化市| 江源县| 蕲春县| 莎车县| 沛县| 时尚| 敦煌市| 张掖市| 房产| 灵山县| 余姚市| 黎平县| 晋中市| 拜泉县| 同江市| 克东县| 策勒县|