日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用Riva和NeMo Megatron構(gòu)建語音AI

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:About Siddharth Sharm ? 2022-03-31 15:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

上周, NVIDIA GTC 2022 宣布了對 Riva 的重大更新。 Riva 是一個用于構(gòu)建語音 AI 應(yīng)用程序的 SDK ,以及一個付費的 Riva 企業(yè)產(chǎn)品。 NeMo Megatron 是一個用于訓(xùn)練大型語言模型的框架,它的幾項關(guān)鍵更新也已宣布。

Riva 2.0 通用性

Riva 為跨多種語言的實時自動語音識別( ASR )和文本到語音( TTS )技能提供了世界級的準確性,并且可以部署在 prem 上、任何云中。 Snap 、 T-Mobile 、 RingCentral 和 Kore 等行業(yè)領(lǐng)導(dǎo)者。 ai 在客戶服務(wù)中心應(yīng)用程序、轉(zhuǎn)錄和虛擬助理中使用 Riva 。

最新的 Riva 版本包括:

ASR 有多種語言:英語、西班牙語、德語、俄語和普通話。

高質(zhì)量的 TTS 語音可定制獨特的語音字體。

使用 TAO Toolkit 或 NVIDIA NeMo 進行特定于領(lǐng)域的定制,在口音、領(lǐng)域和國家特定術(shù)語方面具有無與倫比的準確性。

支持在云端、 prem 和嵌入式平臺上運行。

Riva-Controllable-TTS-Demo-GTC-Spring.gif

Riva-Controllable-TTS-Demo-GTC-Spring.gif

圖 1:NVIDIA Riva 可控文本到語音使得使用 SSML 標簽可以輕松調(diào)整音調(diào)和速度。

手機上嘗試 Riva 自動語音識別 Riva 產(chǎn)品頁面 。

Defined.ai 與 NVIDIA 合作,為希望購買跨語言、域和錄音類型的語音培訓(xùn)和驗證數(shù)據(jù)的企業(yè)提供一個順暢的工作流程。可在 此處 中找到針對 NVIDIA 開發(fā)人員的 DefinedCrowd 數(shù)據(jù)集示例。

下載 RIVA ,它是免費的NVIDIA 開發(fā)人員的成員從 NGC 免費。

Riva 企業(yè)

NVIDIA 還推出了 Riva Enterprise ,這是一款付費產(chǎn)品,面向在NVIDIA 專家的業(yè)務(wù)標準支持下大規(guī)模部署 Riva 的企業(yè)。

好處包括:

在任何云和 prem 平臺上不受限制地使用 ASR 和 TTS 服務(wù)。

在當?shù)貭I業(yè)時間與NVIDIA 人工智能專家聯(lián)系,獲取有關(guān)配置和性能的指導(dǎo)。

為維護控制和升級計劃提供長期支持。

優(yōu)先訪問新版本和功能。

Riva Enterprise 在 NVIDIA Launchpad 上提供免費試用版,供企業(yè)評估并制作應(yīng)用程序原型。

Riva launchpad 上的 Enterprise 包括引導(dǎo)實驗室,用于:

與實時語音 AI API 交互。

將語音 AI 功能添加到對話 AI 應(yīng)用程序中。

在自定義數(shù)據(jù)上微調(diào)語音 AI 管道以獲得更高的準確性。

申請 用于您的 Riva 企業(yè)試用。

通過 對話人工智能解謎 GTC 課程了解有關(guān)如何構(gòu)建、優(yōu)化和部署語音 AI 應(yīng)用程序的更多信息。

NeMo Megatron

NVIDIA 宣布了新的更新 NVIDIA NeMo Megatron ,這是一個培訓(xùn)大型語言模型( LLM )的框架,其參數(shù)高達數(shù)萬億。基于 Megatron paper 的創(chuàng)新, NeMo Megatron 的研究機構(gòu)和企業(yè)可以培訓(xùn)任何 LLM ,以實現(xiàn)融合。 NeMo Megatron 提供數(shù)據(jù)預(yù)處理、并行(數(shù)據(jù)、張量和管道)、編排和調(diào)度,以及自動精度自適應(yīng)。

它包括經(jīng)過徹底測試的配方、流行的 LLM 架構(gòu)實現(xiàn),以及組織快速開始 LLM 之旅所需的工具。

瑞典,法學博士。 com 、 Naver 和佛羅里達大學是 Nvidia 技術(shù)的早期采用者,用于建立大型語言模型。

最新版本包括:

Hyperparameter tuning tool 會根據(jù)客戶需求和基礎(chǔ)設(shè)施限制自動創(chuàng)建配方。

T5 和 mT5 車型的參考配方。

支持在云上培訓(xùn) LLM ,從 Azure 開始。

分布式數(shù)據(jù)預(yù)處理腳本,縮短端到端培訓(xùn)時間。

關(guān)于作者

About Siddharth Sharma:

Siddharth Sharma 是NVIDIA 加速計算的高級技術(shù)營銷經(jīng)理。在加入NVIDIA 之前, Siddharth 是 Mathworks Simulink 和 Stateflow 的產(chǎn)品營銷經(jīng)理,與汽車和航空航天公司密切合作,采用基于模型的設(shè)計來創(chuàng)建控制軟件。

About Gordana Neskovic:

Gordana Neskovic 是AI/DL產(chǎn)品營銷團隊的成員,負責 NVIDIA Maxine。在加入 NVIDIA 之前,Gordana曾在VMware、Wells Fargo、Pinterest、SFO-ITT和KLA Tencor擔任過各種產(chǎn)品營銷、數(shù)據(jù)科學家、AI架構(gòu)師和工程職位。她擁有博士學位。圣塔 Clara 大學,塞爾維亞貝爾格萊德大學電氣工程碩士和學士學位。

About Sirisha Rella:

Sirisha Rella 是 NVIDIA 的技術(shù)產(chǎn)品營銷經(jīng)理,專注于計算機視覺、語音和基于語言的深度學習應(yīng)用。 Sirisha 獲得了密蘇里大學堪薩斯城分校的計算機科學碩士學位,是國家科學基金會大學習中心的研究生助理。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5696

    瀏覽量

    110144
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41370

    瀏覽量

    302744
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA與Google Cloud攜手推進代理式與物理AI發(fā)展

    NVIDIA Blackwell GPU 以及由 NVIDIA Nemotron 和 NeMo 提供支持、基于 Gemini Enterprise Agent Platform 的代理式 AI構(gòu)建
    的頭像 發(fā)表于 04-27 15:35 ?415次閱讀

    485AI語音識別模塊:多路語音控制,實現(xiàn)安防設(shè)備語音聯(lián)動

    485AI語音識別模塊憑借工業(yè)級的RS485總線通信與離線/在線AI語音識別能力,應(yīng)用場景非常廣泛,粗略劃分可覆蓋超10大領(lǐng)域、數(shù)十種細分場景,核心集中在工業(yè)自動化、智能樓宇、智慧農(nóng)業(yè)
    的頭像 發(fā)表于 04-22 15:17 ?159次閱讀

    一文了解語音AI的運作方式

    語音 AI 是對話式 AI 的一個子集,包括可將人類語音轉(zhuǎn)換為文本的自動語音識別 (ASR) 和文本轉(zhuǎn)
    的頭像 發(fā)表于 02-27 16:10 ?550次閱讀
    一文了解<b class='flag-5'>語音</b><b class='flag-5'>AI</b>的運作方式

    AI語音模組】自制小智管家?安信可Ai-WV01-32S測試體驗

    項目名:默語小智管家 模組支持: 安信可科技 AI語音模組 作者:安信可論壇用戶 molun 這兩年, AI 硬件又卷起來了。 ? 語音助手、AI
    的頭像 發(fā)表于 11-19 16:06 ?928次閱讀
    【<b class='flag-5'>AI</b><b class='flag-5'>語音</b>模組】自制小智管家?安信可<b class='flag-5'>Ai</b>-WV01-32S測試體驗

    教你做“會說話”的小熊貓!AI語音對講DIY教程來啦

    新品預(yù)告: Ai-WV01-32S 是由安信可科技設(shè)計的一款可接入 小智AI 智能體 的微型語音交互模組,該模組搭載BL602和VB6824芯片作為核心處理器,專為 輕量級智能語音場景
    的頭像 發(fā)表于 09-30 15:24 ?1135次閱讀
    教你做“會說話”的小熊貓!<b class='flag-5'>AI</b><b class='flag-5'>語音</b>對講DIY教程來啦

    唯創(chuàng)知音AI語音交互芯片與模組介紹

    AI語音交互已經(jīng)成為智能產(chǎn)品的基礎(chǔ)配置,比如常見的AI玩具、智能家居、帶AI功能的藍牙音響,還有汽車的智能車機和智能穿戴設(shè)備等。唯創(chuàng)知音順應(yīng)市場趨勢推出了WT2606A系列的
    的頭像 發(fā)表于 09-17 15:51 ?989次閱讀
    唯創(chuàng)知音<b class='flag-5'>AI</b><b class='flag-5'>語音</b>交互芯片與模組介紹

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應(yīng)用

    靈感的過程中發(fā)揮關(guān)鍵作用。五、AI實現(xiàn)諾貝爾獎級別的科學發(fā)現(xiàn) 這想法這能夠大膽的。 1、AI科學家的構(gòu)建 全自主科學實驗室需要哪些部分: ①自動實驗設(shè)備 ②流程管理系統(tǒng) ③數(shù)據(jù)處理和
    發(fā)表于 09-17 11:45

    豆包/DeepSeek/小智AI全接入!這款AI語音開發(fā)板,配網(wǎng)即用超省心!

    AiPi-PalChatV2 可接入小智AI 或 火山引擎 AiPi-PalChatV2 是安信可推出的一款高性能語音交互開發(fā)板,可接入 小智AI 或 火山引擎 ,專為智能語音場景而設(shè)
    的頭像 發(fā)表于 09-09 17:21 ?1854次閱讀
    豆包/DeepSeek/小智<b class='flag-5'>AI</b>全接入!這款<b class='flag-5'>AI</b><b class='flag-5'>語音</b>開發(fā)板,配網(wǎng)即用超省心!

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    想到,除了研究大腦的抽象數(shù)學模型外,能否拋棄傳統(tǒng)的芯片實現(xiàn)方式,以化學物質(zhì)和生物組件、材料及相關(guān)現(xiàn)象來構(gòu)建人工神經(jīng)網(wǎng)絡(luò)或提取其功能來用于AI處理,甚至直接生物體來實現(xiàn)AI功能,這就是
    發(fā)表于 09-06 19:12

    Votee AI借助NVIDIA技術(shù)加速方言小語種LLM開發(fā)

    Votee AI 利用 NVIDIA 的 GPU 硬件、NeMo Curator 數(shù)據(jù)處理軟件、NeMo Framework 模型訓(xùn)練框架及 Auto Configurator 優(yōu)化工具,高效
    的頭像 發(fā)表于 08-20 14:21 ?1050次閱讀

    輕松配置小智AI語音開發(fā)板,安信可IOT小程序功能更新

    安信可科技:安信可發(fā)布的 AI 語音開發(fā)板,可以通過配套的小程序,完成網(wǎng)絡(luò)配置、音色選擇等多項配置,無需復(fù)雜代碼,輕松實現(xiàn)AI語音體驗。 用戶:COOL!怎么
    的頭像 發(fā)表于 08-19 17:46 ?1570次閱讀
    輕松配置小智<b class='flag-5'>AI</b><b class='flag-5'>語音</b>開發(fā)板,安信可IOT小程序功能更新

    智芯科AI語音芯片賦能智能開關(guān)新體驗

    在智能家居不斷革新的浪潮中,真正“可落地、可量產(chǎn)”的語音交互方案仍然稀缺。而我們,一顆自主可控的AI語音芯片,讓智能開關(guān)從此告別網(wǎng)絡(luò)依賴,做到離線喚醒、毫秒響應(yīng)、無懼口音。
    的頭像 發(fā)表于 08-04 16:25 ?1446次閱讀

    小智AI正式授權(quán)!安信可小安派語音AI開發(fā)板更新啦

    安信可正式推出 語音AI開發(fā)板—— AiPi-PalChatV1 為毛絨玩具、桌搭機器人、 陪伴手辦注入更有溫度的AI對話體驗! ? AiPi-PalChatV1 是一款接入了小智AI
    的頭像 發(fā)表于 07-15 15:06 ?1105次閱讀
    小智<b class='flag-5'>AI</b>正式授權(quán)!安信可小安派<b class='flag-5'>語音</b><b class='flag-5'>AI</b>開發(fā)板更新啦

    最新人工智能硬件培訓(xùn)AI基礎(chǔ)入門學習課程參考2025版(離線AI語音視覺識別篇)

    端側(cè)離線 AI 智能硬件作為 AI 技術(shù)的重要載體之一,憑借其無需依賴網(wǎng)絡(luò)即可實現(xiàn)智能功能的特性,在一些網(wǎng)絡(luò)條件受限或?qū)?shù)據(jù)隱私有較高要求的場景中,發(fā)揮著不可或缺的作用。本章基于CSK6大模型語音
    發(fā)表于 07-04 11:14

    東軟:以數(shù)據(jù)價值化為破局點 AI構(gòu)建城市新基礎(chǔ)設(shè)施

    數(shù)字經(jīng)濟創(chuàng)新生態(tài)的戰(zhàn)略布局與實踐成果。 數(shù)據(jù)作為新型生產(chǎn)要素,是數(shù)字經(jīng)濟的基礎(chǔ),是民生改善的基石,是產(chǎn)業(yè)創(chuàng)新的動力,也是城市發(fā)展的關(guān)鍵。東軟以數(shù)據(jù)價值化為破局點,將數(shù)字技術(shù)創(chuàng)新與產(chǎn)業(yè)創(chuàng)新深度融合, 數(shù)據(jù)和AI構(gòu)建城市新基礎(chǔ)設(shè)施
    的頭像 發(fā)表于 06-18 14:31 ?761次閱讀
    务川| 稻城县| 云南省| 墨竹工卡县| 东乌珠穆沁旗| 舞阳县| 普定县| 淮南市| 谢通门县| 利川市| 东山县| 顺平县| 吴江市| 柳州市| 海原县| 汾阳市| 师宗县| 桦南县| 遂溪县| 张家港市| 汝州市| 三亚市| 平昌县| 泰和县| 苏州市| 萍乡市| 建阳市| 马关县| 南阳市| 称多县| 土默特左旗| 军事| 黄石市| 睢宁县| 南部县| 济南市| 革吉县| 潼南县| 遵义市| 武隆县| 饶平县|