国产AV综合网,一区二区久久久久av

前面兩篇文章，已經(jīng)將 Triton 的“無(wú)狀態(tài)模型”、“有狀態(tài)模型”與標(biāo)準(zhǔn)調(diào)度器的動(dòng)態(tài)批量處理器與序列批量處理器的使用方式，做了較完整的說(shuō)明。大部分的實(shí)際應(yīng)用都不是單純的推理模型就能完成服務(wù)的需求，需要形成前后關(guān)系的工作流水線(xiàn)。例如一個(gè)二維碼掃描的應(yīng)用，除了需要第一關(guān)的二維碼識(shí)別模型之外，后面可能還得將識(shí)別出來(lái)的字符傳遞給語(yǔ)句識(shí)別的推理模型、關(guān)鍵字搜索引擎等功能，最后找到用戶(hù)所需要的信息，反饋給提出需求的用戶(hù)端。本文的內(nèi)容要說(shuō)明 Triton 服務(wù)器形成工作流水線(xiàn)的“集成推理”功能，里面包括“集成模型（ensemble model）”與“集成調(diào)度器（ensemble scheduler）”兩個(gè)部分。下面是個(gè)簡(jiǎn)單的推理流水線(xiàn)示意圖，目的是對(duì)請(qǐng)求的輸入圖像最終反饋“圖像分類(lèi)”與“語(yǔ)義分割”兩個(gè)推理結(jié)果：

當(dāng)接收到集成模型的推斷請(qǐng)求時(shí)，集成調(diào)度器將：

確認(rèn)請(qǐng)求中的“IMAGE”張量映射到預(yù)處理模型中的輸入“RAW_IMAGE”。
檢查集合中的模型，并向預(yù)處理模型發(fā)送內(nèi)部請(qǐng)求，因?yàn)樗璧乃休斎霃埩慷家丫途w。
識(shí)別內(nèi)部請(qǐng)求的完成，收集輸出張量并將內(nèi)容映射到“預(yù)處理圖像”，這是集成中已知的唯一名稱(chēng)。
將新收集的張量映射到集合中模型的輸入。在這種情況下，“classification_model”和“segmentation_model”的輸入將被映射并標(biāo)記為就緒。
檢查需要新收集的張量的模型，并向輸入就緒的模型發(fā)送內(nèi)部請(qǐng)求，在本例中是分類(lèi)模型和分割模型。請(qǐng)注意，響應(yīng)將根據(jù)各個(gè)模型的負(fù)載和計(jì)算時(shí)間以任意順序排列。
重復(fù)步驟 3-5，直到不再發(fā)送內(nèi)部請(qǐng)求，然后用集成輸出名稱(chēng)的張量去響應(yīng)推理請(qǐng)求。

整個(gè)流水線(xiàn)使用 3 個(gè)模型，并進(jìn)行以下三個(gè)處理步驟：

使用 image_prepoecess_model 模型，將原始圖像處理成preprocessed_image 數(shù)據(jù)；
將 preprocessed_image 數(shù)據(jù)傳遞給 classification_model 模型，執(zhí)行圖像分類(lèi)推理，最終返回“CLASSIFICATION”結(jié)果；
將 preprocessed_image 數(shù)據(jù)傳遞給 segmentation_model 模型，執(zhí)行語(yǔ)義分割推理計(jì)算，最終返回“SEGMENTATION”結(jié)果；

在執(zhí)行過(guò)程中，推理服務(wù)器必須支持以下的功能，才能將多種推理模型集成一個(gè)或多個(gè)工作流水線(xiàn)，去執(zhí)行完整的工作流程：

支持一個(gè)或多個(gè)模型的流水線(xiàn)以及這些模型之間輸入和輸出張量的連接；
處理多個(gè)模型的模型拼接或數(shù)據(jù)流，例如“數(shù)據(jù)處理->推理->數(shù)據(jù)后處理”等；
收集每個(gè)步驟中的輸出張量，并根據(jù)規(guī)范將其作為其他步驟的輸入張量；
所集成的模型能繼承所涉及模型的特征，在請(qǐng)求方的元數(shù)據(jù)必須符合集成中的模型；

為了實(shí)現(xiàn)的推理流水線(xiàn)功能，Triton 服務(wù)器使用集成模型與集成調(diào)度器的配合，來(lái)完成這類(lèi)工作流水線(xiàn)的搭建管理。接著就執(zhí)行以下步驟來(lái)創(chuàng)建一個(gè)流水線(xiàn)所需要的配套內(nèi)容：

在模型倉(cāng)里為流水線(xiàn)創(chuàng)建一個(gè)新的“組合模型”文件夾，例如為“ensemble_model”；
在目路下創(chuàng)建新的 config.pbtxt，并且使用“platform: "ensemble"”來(lái)定義這個(gè)模型要執(zhí)行集成功能；
定義集成模型：

無(wú)論工作流水線(xiàn)中調(diào)用多少個(gè)模型，Triton 服務(wù)器都將這樣的組合視為一個(gè)模型，與其他模型配置一樣，需要定義輸入與輸出節(jié)點(diǎn)的張量類(lèi)型與尺度。以上面示例圖中的要求，這個(gè)集成模型有一個(gè)名為“IMAGE”的輸入節(jié)，與兩個(gè)名為“CLASSIFICATION”與“SEGMENTATION”的輸出節(jié)點(diǎn)，至于數(shù)據(jù)類(lèi)型與張量維度內(nèi)容，就得根據(jù)實(shí)際使用的模型去匹配。這部分配置的參考內(nèi)容如下：

name:"ensemble_model"
platform: "ensemble"
max_batch_size: 1
input [
  {
    name: "IMAGE"
    data_type: TYPE_STRING
    dims: [ 1 ]
  }
]
output [
  {
    name: "CLASSIFICATION"
    data_type: TYPE_FP32
    dims: [ 1000 ]
  },
  {
    name: "SEGMENTATION"
    data_type: TYPE_FP32
    dims: [ 3, 224, 224 ]
  }
]

從這個(gè)內(nèi)容中可以看出，Triton 服務(wù)器將這個(gè)集成模型視為一個(gè)獨(dú)立模型。 4. 定義模型的集成調(diào)度器：這部分使用“ensemble_scheduling”來(lái)調(diào)動(dòng)集成調(diào)度器，將使用到模型與數(shù)據(jù)形成完整的交互關(guān)系。在上面示例圖中，灰色區(qū)塊所形成的工作流水線(xiàn)中，使用到 image_prepoecess_model、classification_model、segmentation_model 三個(gè)模型，以及 preprocessed_image 數(shù)據(jù)在模型中進(jìn)行傳遞。下面提供這部分的范例配置內(nèi)容，一開(kāi)始使用“ensemble_scheduling”來(lái)調(diào)用集成調(diào)度器，里面再用“step”來(lái)定義模組之間的執(zhí)行關(guān)系，透過(guò)模型的“input_map”與“output_map”的“key:value”對(duì)的方式，串聯(lián)起模型之間的交互動(dòng)作：

ensemble_scheduling{
  step [
    {
      model_name: "image_preprocess_model"
      model_version: -1
      input_map {
        key: "RAW_IMAGE"
        value: "IMAGE"
      }
      output_map {
        key: "PREPROCESSED_OUTPUT"
        value: "preprocessed_image"
      }
    },
    {
      model_name: "classification_model"
      model_version: -1
      input_map {
        key: "FORMATTED_IMAGE"
        value: "preprocessed_image"
      }
      output_map {
        key: "CLASSIFICATION_OUTPUT"
        value: "CLASSIFICATION"
      }
    },
    {
      model_name: "segmentation_model"
      model_version: -1
      input_map {
        key: "FORMATTED_IMAGE"
        value: "preprocessed_image"
      }
      output_map {
        key: "SEGMENTATION_OUTPUT"
        value: "SEGMENTATION"
      }
    }
  ]
}

這里簡(jiǎn)單說(shuō)明一下工作流程： (1) 模型 image_preprocess_model 接收外部輸入的 IMAGE 數(shù)據(jù)，進(jìn)行圖像預(yù)處理任務(wù)，輸出 preprocessed_image 數(shù)據(jù)；(2) 模型 classification_model 的輸入為 preprocessed_image，表示這個(gè)模型的工作是在 image_preprocess_model 之后的任務(wù)，執(zhí)行的推理輸出為 CLASSIFICATION；(3) 模型 segmentation_model 的輸入為 preprocessed_image，表示這個(gè)模型的工作是在 image_preprocess_model 之后的任務(wù)，執(zhí)行的退輸出為 SEGMENTATION；(4) 上面兩步驟可以看出 classification_model 與 segmentation_model 屬于分支的同級(jí)模型，與上面工作流圖中的要求一致。完成以上的步驟，就能用集成模型與集成調(diào)度器的搭配，來(lái)創(chuàng)建一個(gè)完整的推理工作流任務(wù)，相當(dāng)簡(jiǎn)單。不過(guò)這類(lèi)集成模型中，還有以下幾個(gè)需要注意的重點(diǎn)：

這是 Triton 服務(wù)器用來(lái)執(zhí)行用戶(hù)定義模型流水線(xiàn)的抽象形式，由于沒(méi)有與集成模型關(guān)聯(lián)的物理實(shí)例，因此不能為其指定 instance_group 字段；
不過(guò)集成模型內(nèi)容所組成的個(gè)別模型（例如image_preprocess_model），可以在其配置文件中指定 instance_group，并在集成接收到多個(gè)請(qǐng)求時(shí)單獨(dú)支持并行執(zhí)行。
由于集成模型將繼承所涉及模型的特性，因此在請(qǐng)求起點(diǎn)的元數(shù)據(jù)（本例為“IMAGE”）必須符合集成中的模型，如果其中一個(gè)模型是有狀態(tài)模型，那么集成模型的推理請(qǐng)求應(yīng)該包含有狀態(tài)模型中提到的信息，這些信息將由調(diào)度器提供給有狀態(tài)模型。

總的來(lái)說(shuō)，Triton 服務(wù)器提供的集成功能還是相對(duì)容易理解與操作的，只要大家留意模型之間所傳遞的數(shù)據(jù)張量格式與尺度，就能輕松搭建起這樣的推理工作流，去面對(duì)實(shí)際環(huán)境中更多變的使用需求。

原文標(biāo)題：NVIDIA Triton 系列文章（13）：模型與調(diào)度器-3

文章出處：【微信公眾號(hào)：NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴