日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用遷移學(xué)習(xí)定制人工智能深度學(xué)習(xí)模型

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:About Tanay Varshney, ? 2022-04-01 09:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從頭開(kāi)始創(chuàng)建一個(gè)新的人工智能深度學(xué)習(xí)模型是一個(gè)非常耗費(fèi)時(shí)間和資源的過(guò)程。解決這個(gè)問(wèn)題的一個(gè)常見(jiàn)方法是采用遷移學(xué)習(xí)。為了使這一過(guò)程更加簡(jiǎn)單,NVIDIA TAO Toolkit,它可以將工程時(shí)間框架從 80 周縮短到 8 周。 TAO 工具包支持計(jì)算機(jī)視覺(jué)和對(duì)話 AI ( ASR 和 NLP )用例。

在本文中,我們將介紹以下主題:

安裝 TAO 工具包并訪問(wèn)預(yù)訓(xùn)練模型

微調(diào)預(yù)訓(xùn)練語(yǔ)音轉(zhuǎn)錄模型

將微調(diào)模型導(dǎo)出到 NVIDIA Riva

跟隨 download the Jupyter notebook。

安裝 TAO 工具包并下載預(yù)訓(xùn)練模型

在安裝 TAO 工具包之前,請(qǐng)確保您的系統(tǒng)上安裝了以下組件:

Python [3 。 6 。 9]

docker ce 》 19 。 03 。 5

nvidia-DOCKR2 3 。 4 。 0-1

有關(guān)安裝 nvidia docker 和 docker 的更多信息,請(qǐng)參閱Prerequisites。您可以使用 pip 安裝 TAO 工具包。我們建議使用virtual environment以避免版本沖突。

安裝完成后,下一步是獲得一些經(jīng)過(guò)預(yù)訓(xùn)練的模型。 NVIDIA 提供了許多人工智能或機(jī)器學(xué)習(xí)模型,不僅在對(duì)話人工智能領(lǐng)域,而且在 NGC 或 NVIDIA GPU 云上的廣泛領(lǐng)域。 NGC 目錄是一套精心策劃的 GPU 優(yōu)化軟件,用于 AI 、 HPC 和可視化。

要從 NGC 下載資源,請(qǐng)使用NGC API key登錄注冊(cè)表。您可以免費(fèi)創(chuàng)建和使用一個(gè)。

圖 1 。獲取 NGCAPI 密鑰

CitriNet是由 NVIDIA 構(gòu)建的最先進(jìn)的自動(dòng)語(yǔ)音識(shí)別( ASR )模型,可用于生成語(yǔ)音轉(zhuǎn)錄。您可以從Speech to Text English Citrinet型號(hào)卡下載此型號(hào)。

為了提供流暢的體驗(yàn),工具包在后臺(tái)下載并運(yùn)行 Docker 容器,使用前面提到的規(guī)范文件。所有細(xì)節(jié)都隱藏在 TAO 啟動(dòng)器中。您可以通過(guò)定義 JSON 文件~/.tao_mounts.json來(lái)指定裝載 Docker 容器的首選位置。您可以在Jupyter notebook中找到裝載文件。

這樣,您就安裝了 TAO 工具包,下載了一個(gè)經(jīng)過(guò)預(yù)訓(xùn)練的 ASR 模型,并指定了 TAO 工具包啟動(dòng)器的安裝點(diǎn)。在下一節(jié)中,我們將討論如何使用 TAO 工具包在您選擇的數(shù)據(jù)集上微調(diào)此模型。

微調(diào)模型

使用 TAO 工具包微調(diào)模型包括三個(gè)步驟:

下載規(guī)范文件。

預(yù)處理數(shù)據(jù)集。

使用超參數(shù)進(jìn)行微調(diào)。

圖 3 顯示了微調(diào)模型所需的步驟。

圖 2 。 TAO 工具包工作流

步驟 1 :下載規(guī)范文件

NVIDIA TAO Toolkit 是一種低代碼或無(wú)代碼的解決方案,通過(guò)規(guī)范文件簡(jiǎn)化模型的培訓(xùn)或微調(diào)。通過(guò)這些文件,您可以自定義特定于模型的參數(shù)、培訓(xùn)師參數(shù)、優(yōu)化器和所用數(shù)據(jù)集的參數(shù)??梢詫⑦@些規(guī)范文件下載到先前裝載的文件夾:

以下是 TAO 工具包附帶的 YAML 文件。有關(guān)更多信息,請(qǐng)參閱Downloading Sample Spec Files。

create_tokenizer.yaml

dataset_convert_an4.yaml

dataset_convert_en.yaml

dataset_convert_ru.yaml

evaluate.yaml

export.yaml

finetune.yaml

infer_onnx.yaml

infer.yaml

train_citrinet_256.yaml

train_citrinet_bpe.yaml

這些規(guī)范文件可供自定義和使用。從預(yù)處理和模型評(píng)估到推理和導(dǎo)出模型,都有相應(yīng)的功能。這使您能夠完成開(kāi)發(fā)或定制模型的過(guò)程,而無(wú)需構(gòu)建復(fù)雜的代碼庫(kù)。下載等級(jí)庫(kù)文件后,現(xiàn)在可以繼續(xù)預(yù)處理數(shù)據(jù)。

步驟 2 :預(yù)處理數(shù)據(jù)集

在本演練中,您將使用CMU’s AN4 Dataset,這是一個(gè)小型普查數(shù)據(jù)集,其中包含地址、數(shù)字和其他個(gè)人信息的記錄。這與客戶支持對(duì)話中對(duì)話的初始步驟所需的轉(zhuǎn)錄類型類似。具有類似內(nèi)容的較大自定義數(shù)據(jù)集可用于實(shí)際應(yīng)用程序。

您可以直接下載和解壓縮 AN4 數(shù)據(jù)集,或使用以下命令:

TAO 工具包培訓(xùn)和微調(diào)模塊期望數(shù)據(jù)以特定格式呈現(xiàn)??梢允褂?dataset _ convert 命令完成此預(yù)處理。我們將 AN4 和 Mozilla 的通用語(yǔ)音數(shù)據(jù)集的規(guī)范文件與 TAO 啟動(dòng)器一起打包。您可以在步驟 1 中定義的目錄中找到這些規(guī)范文件。

這些清單文件(圖 3 )包含在后面的步驟中使用的以下信息:

音頻文件的路徑

每個(gè)文件的持續(xù)時(shí)間

每個(gè)文件的文字內(nèi)容

圖 3 。已處理清單文件的結(jié)構(gòu)

此命令將音頻文件轉(zhuǎn)換為 WAV 文件,并生成訓(xùn)練和測(cè)試清單文件。

在大多數(shù)情況下,您都會(huì)進(jìn)行預(yù)處理,但 CitriNet 模型是一個(gè)特例。它需要以子詞標(biāo)記化的形式進(jìn)行進(jìn)一步處理,為文本創(chuàng)建子詞詞匯表。這與 Jasper 或 QuartzNet 不同,因?yàn)樵谒鼈兊那闆r下,詞匯表中只有單個(gè)字符被視為元素。在 CitriNet 中,子字可以是一個(gè)或多個(gè)字符。這可以使用以下命令完成:

到目前為止,您已經(jīng)建立了一個(gè)工具,為諸如遷移學(xué)習(xí)之類的復(fù)雜問(wèn)題提供低代碼或無(wú)代碼解決方案。您已經(jīng)下載了一個(gè)預(yù)訓(xùn)練的模型,將音頻文件處理為必要的格式,并執(zhí)行了標(biāo)記化。您使用的命令不到 10 個(gè)?,F(xiàn)在,所有必要的細(xì)節(jié)都已散列出來(lái),您可以繼續(xù)微調(diào)模型。

步驟 3 :使用超參數(shù)進(jìn)行微調(diào)

正如在前面的步驟中所做的那樣,您正在與規(guī)范文件交互。有關(guān)更多信息,請(qǐng)參閱Creating an Experiment Spec File。如果要調(diào)整 FFT 窗口大小的大小,可以指定幾乎所有內(nèi)容,從特定于訓(xùn)練的參數(shù)(如優(yōu)化器)到特定于數(shù)據(jù)集的參數(shù),再到模型配置本身。

是否要更改學(xué)習(xí)速率和調(diào)度程序,或者在詞匯表中添加新字符?無(wú)需打開(kāi)代碼庫(kù)并對(duì)其進(jìn)行掃描以進(jìn)行更改。所有這些定制都很容易獲得,并可在整個(gè)團(tuán)隊(duì)中共享。這減少了在嘗試新想法和分享結(jié)果以及模型配置方面的摩擦,從而提高了準(zhǔn)確性。

以下是如何微調(diào)數(shù)據(jù)集:

最后,要繼續(xù),請(qǐng)根據(jù)需要修改規(guī)范文件并運(yùn)行以下命令。此命令使用先前下載的數(shù)據(jù)集微調(diào)下載的模型。有關(guān)更多信息,請(qǐng)參閱Fine-Tuning the Model。

在對(duì)模型進(jìn)行微調(diào)或培訓(xùn)后,自然會(huì)評(píng)估模型并評(píng)估是否需要進(jìn)一步微調(diào)。為此, NVIDIA 為evaluate your model和run inference提供了功能。

將微調(diào)模型導(dǎo)出到 Riva

在生產(chǎn)環(huán)境中部署模型會(huì)帶來(lái)一系列挑戰(zhàn)。為此,您可以使用NVIDIA Riva,一種 GPU 加速 AI 語(yǔ)音 SDK 來(lái)開(kāi)發(fā)實(shí)時(shí)轉(zhuǎn)錄和虛擬助理等應(yīng)用程序。

Riva 使用其他 NVIDIA 產(chǎn)品:

NVIDIA Triton Inference Server用于簡(jiǎn)化大規(guī)模生產(chǎn)中模型的部署。

NVIDIA TensorRT用于通過(guò)優(yōu)化 NVIDIA GPU s 的模型來(lái)加速模型并提供更好的推理性能。

如果您對(duì)使用本演練中微調(diào)的模型感興趣,可以使用以下命令將其導(dǎo)出到 Riva 。

在下一篇文章中,我們將介紹如何安裝 NVIDIA Riva 在生產(chǎn)環(huán)境中部署這些模型,以及如何使用NGC Catalog中的眾多模型之一。

關(guān)于作者

About Tanay Varshney

Tanay Varshney 是 NVIDIA 的一名深入學(xué)習(xí)的技術(shù)營(yíng)銷工程師,負(fù)責(zé)廣泛的 DL 軟件產(chǎn)品。他擁有紐約大學(xué)計(jì)算機(jī)科學(xué)碩士學(xué)位,專注于計(jì)算機(jī)視覺(jué)、數(shù)據(jù)可視化和城市分析的橫斷面。

About Sirisha Rella

Sirisha Rella 是 NVIDIA 的技術(shù)產(chǎn)品營(yíng)銷經(jīng)理,專注于計(jì)算機(jī)視覺(jué)、語(yǔ)音和基于語(yǔ)言的深度學(xué)習(xí)應(yīng)用。 Sirisha 獲得了密蘇里大學(xué)堪薩斯城分校的計(jì)算機(jī)科學(xué)碩士學(xué)位,是國(guó)家科學(xué)基金會(huì)大學(xué)習(xí)中心的研究生助理。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5706

    瀏覽量

    110154
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50388

    瀏覽量

    267145
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    人工智能深度學(xué)習(xí)系統(tǒng)班13期

    人工智能深度學(xué)習(xí)13期:零基礎(chǔ)轉(zhuǎn)行AI高薪不用走彎路 站在2026年的當(dāng)下,人工智能的浪潮已經(jīng)徹底重塑了全球就業(yè)市場(chǎng)的版圖。對(duì)于程序員而言,這既是前所未有的職業(yè)危機(jī),也是實(shí)現(xiàn)階層躍遷的
    的頭像 發(fā)表于 05-07 16:46 ?144次閱讀

    人工智能-Python深度學(xué)習(xí)進(jìn)階與應(yīng)用技術(shù):工程師高培解讀

    深度學(xué)習(xí)的工程化落地,早已不是紙上談兵的事。從卷積神經(jīng)網(wǎng)絡(luò)到Transformer,從目標(biāo)檢測(cè)到大模型私有化部署,技術(shù)棧不斷延伸,工程師面臨的知識(shí)體系也越來(lái)越龐雜?,F(xiàn)根據(jù)中際賽威工程師培訓(xùn)老師的一份
    的頭像 發(fā)表于 04-21 11:01 ?407次閱讀
    <b class='flag-5'>人工智能</b>-Python<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>進(jìn)階與應(yīng)用技術(shù):工程師高培解讀

    嵌入式人工智能課程(華清遠(yuǎn)見(jiàn))

    嵌入式 AI 編譯器優(yōu)化:華清遠(yuǎn)見(jiàn)課程,解鎖極致端側(cè)性能 隨著人工智能從云端全面向邊緣側(cè)和終端側(cè)下沉,“萬(wàn)物智聯(lián)”的時(shí)代已經(jīng)悄然到來(lái)。然而,在這股浪潮背后,隱藏著一個(gè)巨大的技術(shù)鴻溝:在算力受限
    發(fā)表于 04-16 18:47

    人工智能多模態(tài)與視覺(jué)大模型開(kāi)發(fā)實(shí)戰(zhàn) - 2026必會(huì)

    視覺(jué)大模型特訓(xùn):從原理到部署一站式學(xué)會(huì) 在科技飛速發(fā)展的當(dāng)下,視覺(jué)大模型已成為人工智能領(lǐng)域的一顆璀璨明星,廣泛應(yīng)用于安防監(jiān)控、自動(dòng)駕駛、醫(yī)療影像分析等眾多領(lǐng)域,深刻改變著我們的生活與工作方式。如今
    發(fā)表于 04-15 16:06

    智能檢測(cè)】基于AI深度學(xué)習(xí)與飛拍技術(shù)的影像測(cè)量系統(tǒng):實(shí)現(xiàn)高效精準(zhǔn)的全自動(dòng)光學(xué)檢測(cè)與智能制造數(shù)據(jù)閉環(huán)

    內(nèi)容概要:文檔內(nèi)容介紹了中圖儀器(Chotest)影像測(cè)量?jī)x融合人工智能深度學(xué)習(xí)與飛拍技術(shù)的自動(dòng)化檢測(cè)解決方案。系統(tǒng)通過(guò)AI深度學(xué)習(xí)實(shí)現(xiàn)
    發(fā)表于 03-31 17:11

    人工智能與機(jī)器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    人工智能和機(jī)器學(xué)習(xí)問(wèn)世以來(lái),多個(gè)在線領(lǐng)域的數(shù)字化格局迎來(lái)了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競(jìng)爭(zhēng)優(yōu)勢(shì),而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 02-04 14:44 ?719次閱讀

    機(jī)器學(xué)習(xí)深度學(xué)習(xí)中需避免的 7 個(gè)常見(jiàn)錯(cuò)誤與局限性

    無(wú)論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見(jiàn)錯(cuò)誤。如果對(duì)這些錯(cuò)誤置之不
    的頭像 發(fā)表于 01-07 15:37 ?371次閱讀
    機(jī)器<b class='flag-5'>學(xué)習(xí)</b>和<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個(gè)常見(jiàn)錯(cuò)誤與局限性

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹這對(duì)開(kāi)發(fā)人員意味著什么,以及使用 Neuton 模型如何改進(jìn)您的開(kāi)發(fā)和終端
    發(fā)表于 08-31 20:54

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    應(yīng)用場(chǎng)景。從數(shù)據(jù)采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實(shí)訓(xùn),讓你深度體驗(yàn)AI技術(shù)的魅力 。 四、九門課程全覆蓋,滿足多元學(xué)習(xí)需求 對(duì)于高校教學(xué)或者技術(shù)
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    應(yīng)用場(chǎng)景。從數(shù)據(jù)采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實(shí)訓(xùn),讓你深度體驗(yàn)AI技術(shù)的魅力 。 四、九門課程全覆蓋,滿足多元學(xué)習(xí)需求 對(duì)于高校教學(xué)或者技術(shù)
    發(fā)表于 08-07 14:23

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級(jí)芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競(jìng)爭(zhēng)對(duì)手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文
    發(fā)表于 07-31 11:38

    人工智能學(xué)習(xí)17問(wèn):從入門到避坑,新手最關(guān)心的問(wèn)題全在這

    問(wèn):學(xué)人工智能,光看書(shū)就行?答:不行。AI是“練出來(lái)”的,不是“看出來(lái)”的。書(shū)能教理論,但寫(xiě)代碼、調(diào)模型、解決實(shí)際問(wèn)題的能力,必須靠動(dòng)手練。利用學(xué)習(xí)平臺(tái)把書(shū)本知識(shí)拆解成可操作的步驟,跟著練3次,比看
    的頭像 發(fā)表于 07-30 14:18 ?868次閱讀
    <b class='flag-5'>人工智能</b><b class='flag-5'>學(xué)習(xí)</b>17問(wèn):從入門到避坑,新手最關(guān)心的問(wèn)題全在這

    人工智能技術(shù)的現(xiàn)狀與未來(lái)發(fā)展趨勢(shì)

    人工智能技術(shù)的現(xiàn)狀與未來(lái)發(fā)展趨勢(shì) ? ? 近年來(lái),人工智能(AI)技術(shù)迅猛發(fā)展,深刻影響著各行各業(yè)。從計(jì)算機(jī)視覺(jué)到自然語(yǔ)言處理,從自動(dòng)駕駛到醫(yī)療診斷,AI的應(yīng)用場(chǎng)景不斷擴(kuò)展,推動(dòng)社會(huì)向智能化方向邁進(jìn)
    的頭像 發(fā)表于 07-16 15:01 ?2372次閱讀

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能模型重塑教育與社會(huì)發(fā)展的當(dāng)下,無(wú)論是探索未來(lái)職業(yè)方向,還是更新技術(shù)儲(chǔ)備,掌握大模型知識(shí)都已成為新時(shí)代的必修課。從職場(chǎng)上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的
    發(fā)表于 07-04 11:10

    邊緣計(jì)算如何顛覆人工智能變革

    2025年以來(lái),DeepSeek發(fā)布的大模型熱度居高不下,再次點(diǎn)燃了全球?qū)?b class='flag-5'>人工智能的無(wú)限熱情。深度學(xué)習(xí)模型以指數(shù)級(jí)速度膨脹,性能不斷突破極限
    的頭像 發(fā)表于 05-30 09:29 ?1187次閱讀
    廊坊市| 襄城县| 吴忠市| 阿坝县| 崇义县| 阿城市| 漠河县| 罗田县| 漳平市| 龙川县| 江陵县| 鄂尔多斯市| 偏关县| 平顶山市| 永吉县| 香河县| 赫章县| 韶山市| 蕉岭县| 德兴市| 时尚| 通海县| 长春市| 广平县| 江西省| 于田县| 柘城县| 同江市| 灵璧县| 隆昌县| 图木舒克市| 金湖县| 兴国县| 璧山县| 台北县| 漯河市| 西宁市| 双鸭山市| 岳阳市| 阿图什市| 贡觉县|