日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用NVIDIA NeMo生成高質(zhì)量的語(yǔ)音識(shí)別標(biāo)簽

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:NVIDIA ? 2022-04-27 09:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

使用 NVIDIA NeMo 和 標(biāo)簽工作室 中的自動(dòng)語(yǔ)音識(shí)別( ASR )模型處理音頻數(shù)據(jù)時(shí),可以節(jié)省時(shí)間并產(chǎn)生更準(zhǔn)確的結(jié)果。

NVIDIA NeMo 提供了可重用的神經(jīng)模塊,使得創(chuàng)建新的神經(jīng)網(wǎng)絡(luò)架構(gòu)變得容易,包括 ASR 的預(yù)構(gòu)建模塊和現(xiàn)成模型。借助 NVIDIA NeMo 的強(qiáng)大功能,您可以從預(yù)訓(xùn)練語(yǔ)音識(shí)別模型中獲得音頻轉(zhuǎn)錄。添加 labelstudio 及其開(kāi)源數(shù)據(jù)標(biāo)記功能,您可以進(jìn)一步提高轉(zhuǎn)錄質(zhì)量。

解決方案

poYBAGJomUSASBfSAAAy2POsRYU582.jpg

圖 1 使用 Label Studio 和 NeMo 注釋和更正轉(zhuǎn)錄本的 ASR 工作流。

按照本文中的步驟使用 Label Studio 設(shè)置 NVIDIA NeMo ASR ,以生成高質(zhì)量的音頻轉(zhuǎn)錄本。

連接 NVIDIA NeMo 模型,在 Label Studio 中自動(dòng)轉(zhuǎn)錄音頻文件。

設(shè)置音頻轉(zhuǎn)錄項(xiàng)目。

從 Label Studio 驗(yàn)證和導(dǎo)出修訂的音頻轉(zhuǎn)錄本。

微調(diào) NeMo ASR 模型與修改后的音頻轉(zhuǎn)錄從標(biāo)簽工作室。

先決條件

開(kāi)始之前,請(qǐng)確保您擁有以下資源:

音頻數(shù)據(jù)文件。 此音頻 MIG 可以是客戶(hù)服務(wù)電話(huà)、電話(huà)訂單、銷(xiāo)售對(duì)話(huà)的錄音,也可以是其他與人交談的錄音。音頻文件必須采用以下文件格式之一:

WAV

AIFF

MP3

AU

FLAC

已安裝 Label Studio 。 在本地計(jì)算機(jī)或云服務(wù)器上使用首選方法安裝 Label Studio 。有關(guān)更多信息,請(qǐng)參閱 Label Studio 文檔中的 Quickstart 。

NeMo 工具箱已安裝

免費(fèi)音頻數(shù)據(jù)

如果您沒(méi)有任何音頻數(shù)據(jù),可以使用示例數(shù)據(jù)集或歷史音頻數(shù)據(jù)集:

LJ 語(yǔ)音數(shù)據(jù)集 是非小說(shuō)類(lèi)書(shū)籍段落的公共域數(shù)據(jù)集。

Librispeech 還提供了一個(gè) 基于開(kāi)放 SLR 的開(kāi)源 ASR 語(yǔ)料庫(kù) 。

您可以使用許多其他 ASR 數(shù)據(jù)集。有關(guān)詳細(xì)信息,請(qǐng)參閱 數(shù)據(jù)集 – 簡(jiǎn)介 。您還可以使用國(guó)會(huì)圖書(shū)館網(wǎng)站上的公共域錄音集,如 美國(guó)棒球運(yùn)動(dòng)員訪(fǎng)談錄 。

確定要轉(zhuǎn)錄的音頻后,就可以開(kāi)始處理它了。

安裝 Label Studio ML 后端

安裝 Label Studio 后,請(qǐng)安裝 Label Studio 機(jī)器學(xué)習(xí)后端。從命令行運(yùn)行以下命令:

git clone https://github.com/heartexlabs/label-studio-ml-backend 

設(shè)置環(huán)境:

cd label-studio-ml-backend

# Install label-studio-ml and its dependencies
pip install -U -e .

# Install the nemo example dependencies
pip install -r label_studio_ml/examples/requirements.txt

連接 NVIDIA NeMo 模型,在 Label Studio 中自動(dòng)轉(zhuǎn)錄音頻文件

要使用預(yù)先訓(xùn)練的 ASR 模型的預(yù)測(cè)對(duì)數(shù)據(jù)進(jìn)行預(yù)標(biāo)記,請(qǐng)?jiān)?Label Studio 中將 NeMo 工具箱設(shè)置為機(jī)器學(xué)習(xí)后端。 Label Studio 機(jī)器學(xué)習(xí)后端允許您使用預(yù)先訓(xùn)練的模型來(lái)預(yù)標(biāo)記數(shù)據(jù)。

Label Studio 包括使用 利用 NGC 云中的 NeMo 開(kāi)發(fā)的預(yù)訓(xùn)練 QuartzNet15x5 模型 的 一個(gè)例子 ,但是如果另一個(gè)模型更適合,您可以用您的數(shù)據(jù)設(shè)置一個(gè)不同的模型。有關(guān)更多信息,請(qǐng)參閱 NeMo 提供的 ASR 型號(hào)列表 。

在命令行中,將 NeMo 設(shè)置為機(jī)器學(xué)習(xí)后端,并使用該模型啟動(dòng)一個(gè)新的 Label Studio 項(xiàng)目。

安裝 NeMo 工具箱 在 Docker 容器中或使用 pip 。

下載 NeMo ASR 模型。提供的 Label Studio 示例腳本從 NGC 云下載預(yù)先訓(xùn)練的 QuartzNet 模型。要使用不同的模型,請(qǐng)從 NGC 下載該模型。

從命令行啟動(dòng) Label Studio 機(jī)器學(xué)習(xí)后端。

label-studio-ml init my_model --from label_studio_ml/examples/nemo/asr.py

啟動(dòng)機(jī)器學(xué)習(xí)后端。默認(rèn)情況下,模型在本地主機(jī)上以端口 9090 啟動(dòng)。

label-studio-ml start my_model

用模型啟動(dòng) Label Studio 。

label-studio start my_project --ml-backends http://localhost:9090

設(shè)置音頻轉(zhuǎn)錄項(xiàng)目

啟動(dòng) Label Studio 后,導(dǎo)入音頻數(shù)據(jù)并設(shè)置正確的模板來(lái)配置標(biāo)簽。 VZX19 是自動(dòng)語(yǔ)音識(shí)別的最佳選擇,它使音頻數(shù)據(jù)的注釋變得容易。

打開(kāi) Label Studio ,導(dǎo)入數(shù)據(jù),然后選擇模板。

選擇 Import 并以純文本或 JSON 文件的形式導(dǎo)入音頻數(shù)據(jù),這些文件引用在線(xiàn)存儲(chǔ)(如 Amazon S3 )中托管的音頻文件的有效 url 。

2 從 Tasks 列表中,選擇 Settings 。

3 在 標(biāo)簽界面 選項(xiàng)卡上,瀏覽模板并選擇 自動(dòng)語(yǔ)音識(shí)別 模板。

4 選擇 Save 。

驗(yàn)證并輸出模型預(yù)測(cè)

作為注釋器,檢查任務(wù)界面上音頻數(shù)據(jù)的任務(wù)并驗(yàn)證。如有必要,糾正 NeMo 語(yǔ)音模型預(yù)測(cè)的轉(zhuǎn)錄本。

從 Label Studio 中的任務(wù)列表中,選擇 Label 。

對(duì)于每個(gè)音頻樣本,聆聽(tīng)音頻并回顧 NeMo 模型產(chǎn)生的轉(zhuǎn)錄,作為預(yù)標(biāo)記過(guò)程的一部分。

如果成績(jī)單中有任何單詞不正確,請(qǐng)更新。

保存對(duì)成績(jī)單的更改。選擇 Submit 提交成績(jī)單并查看下一個(gè)音頻樣本。

接下來(lái),按照 NVIDIA NVIDIA 文檔中的 NeMo ASR 集合 所述,以 NeMo 模型所期望的正確格式從 Label Studio 導(dǎo)出完成的音頻轉(zhuǎn)錄本。

要導(dǎo)出完成的音頻,請(qǐng)執(zhí)行以下操作:

從 Label Studio 中的任務(wù)列表中,選擇 Export 。

選擇名為 ASR_MANIFEST 的音頻轉(zhuǎn)錄 JSON 格式。

有關(guān) Label Studio 中可用導(dǎo)出格式的詳細(xì)信息,請(qǐng)參閱 從 Label Studio 導(dǎo)出結(jié)果 。

使用高質(zhì)量的成績(jī)單來(lái)微調(diào)您的 ML 模型

當(dāng)您處理完音頻并調(diào)整完轉(zhuǎn)錄的文本后,剩下的是音頻轉(zhuǎn)錄本,您可以用來(lái)重新培訓(xùn) NeMo 中包含的 ASR 模型。 Label Studio 生成與 NeMo 培訓(xùn)完全兼容的注釋。

要更新 QuartzNet 模型檢查點(diǎn),您可以在幾行代碼中完成,從頭開(kāi)始訓(xùn)練模型,或者使用 PyTorch Lightning 。例子也可以在 NeMo Jupyter 筆記本中找到。

通過(guò)同時(shí)使用 Label Studio 和 NeMo ,您可以節(jié)省從頭開(kāi)始處理每個(gè)音頻文件的時(shí)間 NeMo 可以立即為您提供高度準(zhǔn)確的預(yù)測(cè),而 Label Studio 可以幫助您實(shí)現(xiàn)完美的預(yù)測(cè) 今天就試試 !

關(guān)于作者

Nikolai Liubimov是Heartex的CTO。 完成博士學(xué)位后 他在CS擔(dān)任機(jī)器學(xué)習(xí)研究員,后來(lái)進(jìn)入該行業(yè),并花了10年的時(shí)間將深度學(xué)習(xí)技術(shù)應(yīng)用于現(xiàn)實(shí)世界中的問(wèn)題。 這項(xiàng)經(jīng)驗(yàn)為當(dāng)前缺少哪些工具提供了寶貴的見(jiàn)解,從而創(chuàng)建了一家初創(chuàng)公司來(lái)幫助數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)工程團(tuán)隊(duì)構(gòu)建和改進(jìn)其ML模型。

Sarah Moir是Heartex的產(chǎn)品內(nèi)容和教育主管,為Heartex的數(shù)據(jù)注釋和標(biāo)簽解決方案撰寫(xiě)文檔,博客文章和教育教程。 薩拉(Sarah)在過(guò)去的八年中一直是數(shù)據(jù)和安全領(lǐng)域的技術(shù)作家,并且對(duì)數(shù)據(jù)分析,機(jī)器學(xué)習(xí)和編寫(xiě)充滿(mǎn)熱情。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5696

    瀏覽量

    110144
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7842

    瀏覽量

    93498
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    14

    文章

    10377

    瀏覽量

    91777
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    高質(zhì)量RAG系統(tǒng)的五個(gè)核心設(shè)計(jì)要點(diǎn)

    檢索增強(qiáng)生成(Retrieval-Augmented Generation, RAG)已成為構(gòu)建大模型應(yīng)用的標(biāo)準(zhǔn)架構(gòu)。然而,大多數(shù)RAG系統(tǒng)在設(shè)計(jì)初期會(huì)因?yàn)楹雎院诵脑O(shè)計(jì)原則而在實(shí)際部署中暴露嚴(yán)重問(wèn)題。本文從工程實(shí)踐角度出發(fā),梳理高質(zhì)量RAG系統(tǒng)的5個(gè)核心設(shè)計(jì)要點(diǎn)。
    的頭像 發(fā)表于 04-24 14:42 ?203次閱讀

    嵌入式C語(yǔ)言高質(zhì)量編程:從“能用”到“卓越”的跨越

    只有掌握了嵌入式C硬核的技術(shù),才能夠鑄就工業(yè)級(jí)高質(zhì)量的代碼。
    的頭像 發(fā)表于 03-13 10:18 ?252次閱讀
    嵌入式C語(yǔ)言<b class='flag-5'>高質(zhì)量</b>編程:從“能用”到“卓越”的跨越

    聲智科技亮相2026海淀區(qū)經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展大會(huì)

    近日,海淀區(qū)高質(zhì)量發(fā)展大會(huì)隆重召開(kāi)。聲智科技作為深耕聲學(xué)AI模型技術(shù)創(chuàng)新及AI全棧產(chǎn)品商業(yè)化落地的AI應(yīng)用標(biāo)桿企業(yè)受邀出席大會(huì)。聲智科技不僅致力于突破物理AI技術(shù)的“天花板“,更通過(guò)硬核終端的規(guī)?;a(chǎn)出,將技術(shù)勢(shì)能轉(zhuǎn)化為高質(zhì)量發(fā)展的產(chǎn)值動(dòng)能。
    的頭像 發(fā)表于 03-04 17:42 ?1696次閱讀

    鴻利智匯榮獲2025年度廣州花都高質(zhì)量發(fā)展“蛟龍榜”科技創(chuàng)新企業(yè)獎(jiǎng)

    日前,廣州市花都區(qū)召開(kāi)高質(zhì)量發(fā)展大會(huì),認(rèn)真落實(shí)全省、全市高質(zhì)量發(fā)展大會(huì)部署要求,堅(jiān)持以經(jīng)濟(jì)建設(shè)為中心,奮力在“十五五”開(kāi)局之年展現(xiàn)新作為、拼出新氣象。會(huì)上,花都區(qū)為2025年高質(zhì)量發(fā)展企業(yè)頒發(fā)獎(jiǎng)項(xiàng),鴻利智匯集團(tuán)股份有限公司作為科
    的頭像 發(fā)表于 03-04 14:09 ?527次閱讀

    廣電計(jì)量榮獲番禺區(qū)高質(zhì)量發(fā)展企業(yè)服務(wù)先進(jìn)集體

    2月26日,緊隨全省、全市“新春第一會(huì)”的腳步,廣州市番禺區(qū)高質(zhì)量發(fā)展大會(huì)在龍沙港召開(kāi)。大會(huì)深入貫徹落實(shí)省、市高質(zhì)量發(fā)展大會(huì)部署要求,以“奮力實(shí)施第二個(gè)‘萬(wàn)畝千億’產(chǎn)業(yè)攻城拔寨,工商并舉打造番禺先進(jìn)
    的頭像 發(fā)表于 02-28 16:46 ?1945次閱讀

    廣汽集團(tuán)召開(kāi)2026年高質(zhì)量發(fā)展大會(huì)

    2月26日,廣汽集團(tuán)2026年高質(zhì)量發(fā)展大會(huì)在番禺總部召開(kāi)。會(huì)議全面?zhèn)鬟_(dá)貫徹省市高質(zhì)量發(fā)展大會(huì)精神,系統(tǒng)部署2026年高質(zhì)量發(fā)展重點(diǎn)工作,動(dòng)員全體干部員工以“開(kāi)工即開(kāi)戰(zhàn)、起步即沖刺”的奮斗姿態(tài),奮力
    的頭像 發(fā)表于 02-28 14:34 ?753次閱讀

    廣電計(jì)量創(chuàng)新服務(wù)體系助力商業(yè)航天高質(zhì)量發(fā)展

    近日,國(guó)家航天局正式印發(fā)《推進(jìn)商業(yè)航天高質(zhì)量安全發(fā)展行動(dòng)計(jì)劃(2025—2027年)》(以下簡(jiǎn)稱(chēng)《行動(dòng)計(jì)劃》),明確將商業(yè)航天納入國(guó)家航天發(fā)展總體布局,提出到2027年實(shí)現(xiàn)產(chǎn)業(yè)規(guī)模顯著壯大、創(chuàng)新活力
    的頭像 發(fā)表于 11-27 17:22 ?1480次閱讀

    PCBA工程師必看:高質(zhì)量BOM的5個(gè)‘隱形規(guī)則’

    一站式PCBA加工廠家今天為大家講講PCBA加工中高質(zhì)量BOM要求有哪些?PCBA加工中高質(zhì)量BOM的5大核心要素。在PCBA加工中,高質(zhì)量的物料清單(BOM)是保障生產(chǎn)零失誤的核心工具。它不
    的頭像 發(fā)表于 10-17 09:18 ?1206次閱讀

    躍昉科技出席2025橫琴粵澳深度合作區(qū)企業(yè)高質(zhì)量發(fā)展大會(huì)

    8月29日,橫琴粵澳深度合作區(qū)企業(yè)高質(zhì)量發(fā)展大會(huì)暨“育苗培優(yōu)”計(jì)劃啟動(dòng)儀式在橫琴隆重舉行。
    的頭像 發(fā)表于 09-02 16:15 ?1058次閱讀

    索尼重載設(shè)備的高質(zhì)量遠(yuǎn)程制作方案和應(yīng)用(2)

    索尼的遠(yuǎn)程制作可以被稱(chēng)之為制作級(jí)的高質(zhì)量遠(yuǎn)程制作,或重載設(shè)備的高質(zhì)量遠(yuǎn)程制作,遠(yuǎn)程設(shè)備結(jié)合常規(guī)系統(tǒng)設(shè)備,提供和本地制作類(lèi)似的制作級(jí)高質(zhì)量圖像,延續(xù)電視臺(tái)/制作公司的設(shè)備特點(diǎn)和優(yōu)勢(shì)。
    的頭像 發(fā)表于 08-21 15:56 ?1449次閱讀
    索尼重載設(shè)備的<b class='flag-5'>高質(zhì)量</b>遠(yuǎn)程制作方案和應(yīng)用(2)

    索尼重載設(shè)備的高質(zhì)量遠(yuǎn)程制作方案和應(yīng)用(1)

    最近的各地體育活動(dòng)中,索尼提供了多種產(chǎn)品和系統(tǒng)方案進(jìn)行測(cè)試和使用,其中將攝像機(jī)用于轉(zhuǎn)播場(chǎng)地的集中式遠(yuǎn)程制作方式是常用方式。索尼專(zhuān)業(yè)解決方案突出制作級(jí)質(zhì)量的優(yōu)勢(shì),具有圖像高質(zhì)量,低碼率,低延時(shí)特點(diǎn),能提供不一樣的高質(zhì)量遠(yuǎn)程制作。
    的頭像 發(fā)表于 08-21 15:55 ?1110次閱讀
    索尼重載設(shè)備的<b class='flag-5'>高質(zhì)量</b>遠(yuǎn)程制作方案和應(yīng)用(1)

    大模型時(shí)代,如何推進(jìn)高質(zhì)量數(shù)據(jù)集建設(shè)?

    高質(zhì)量數(shù)據(jù)集,即具備高價(jià)值、高密度、標(biāo)準(zhǔn)化特征的數(shù)據(jù)集合。 在AI領(lǐng)域,高質(zhì)量數(shù)據(jù)集地位舉足輕重,如同原油經(jīng)煉化成為汽油驅(qū)動(dòng)汽車(chē),海量原始數(shù)據(jù)需轉(zhuǎn)化為高質(zhì)量數(shù)據(jù)集,才能助力大模型精準(zhǔn)掌握數(shù)據(jù)特征
    的頭像 發(fā)表于 08-21 13:58 ?1026次閱讀

    從芯片到主板,科技創(chuàng)新實(shí)現(xiàn)高質(zhì)量發(fā)展

    數(shù)字化時(shí)代,科技的迅猛發(fā)展深刻影響著各個(gè)領(lǐng)域。從芯片到主板的集成,生動(dòng)展現(xiàn)了科技創(chuàng)新如何成為推動(dòng)高質(zhì)量發(fā)展的核心動(dòng)力。
    的頭像 發(fā)表于 07-26 16:26 ?1018次閱讀

    新能源變革之路,要建在“高質(zhì)量”的路基上

    高質(zhì)量”是能源革命的前提與基座
    的頭像 發(fā)表于 06-24 11:42 ?2666次閱讀
    新能源變革之路,要建在“<b class='flag-5'>高質(zhì)量</b>”的路基上

    淺析:數(shù)字經(jīng)濟(jì)時(shí)代,高質(zhì)量數(shù)據(jù)集對(duì)AI產(chǎn)業(yè)帶來(lái)哪些新的變化

    大模型技術(shù)不斷取得突破,其中大規(guī)模高質(zhì)量訓(xùn)練數(shù)據(jù)的投入,起到了關(guān)鍵作用,也進(jìn)一步將?“以數(shù)據(jù)為中心的人工智能”?推向一個(gè)新階段。從早期簡(jiǎn)單的圖像識(shí)別、語(yǔ)音識(shí)別,到如今復(fù)雜的自然語(yǔ)言處理
    的頭像 發(fā)表于 05-09 15:10 ?1233次閱讀
    荥阳市| 开鲁县| 宁波市| 体育| 福清市| 张家界市| 昆山市| 镇康县| 突泉县| 中西区| 卢龙县| 巴楚县| 北宁市| 三都| 红原县| 开封市| 阿巴嘎旗| 大埔区| 廊坊市| 蓬安县| 连江县| 会同县| 长乐市| 咸宁市| 亚东县| 奉化市| 东海县| 玉山县| 从江县| 昌图县| 温州市| 伊春市| 枣阳市| 梅河口市| 新疆| 双牌县| 汝阳县| 成安县| 万安县| 长白| 鹤峰县|