日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用Riva自定義文本創(chuàng)建語音界面

星星科技指導員 ? 來源:NVIDIA ? 作者:About Gordana Neskovi ? 2022-03-31 16:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA 在 Riva 中發(fā)布了西班牙語、德語和俄語的世界級語音到文本模型,為企業(yè)在全球部署語音 AI 應用提供了動力。此外,企業(yè)現在可以使用 Riva 的可定制文本到語音管道創(chuàng)建富有表現力的語音界面。

NVIDIA Riva 是一款 GPU 加速語音 AI SDK ,用于開發(fā)實時應用程序,如實時字幕、向基于文本的聊天機器人添加語音,以及在呼叫中心生成實時轉錄。為了便于實施, Riva 在 NGC 目錄中提供了高度精確的預訓練模型。

和 TAO 工具包 ,這些模型可以為任何行業(yè)定制,包括電信、金融、統一通信即服務和醫(yī)療保健。開發(fā)者可以使用 Riva 開箱即用地部署這些模型。它們經過優(yōu)化,可以在云、數據中心和邊緣在不到 300 毫秒的時間內實時運行。

Riva 發(fā)布亮點包括

西班牙語、德語和俄語的世界級語音識別技能。

可定制的文本到語音管道,用于表達性互動。

TAO 工具包的低代碼微調工作流。

多種語言的自動語音識別

從呼叫中心到虛擬助手,每一個對話人工智能應用程序都嚴重依賴于自動語音識別。企業(yè)可以通過 Riva 英語、西班牙語、德語和俄語的自動語音識別在全球范圍內擴展這些應用程序。

圖 1:NVIDIA Riva 世界級的自動語音識別系統有英語、西班牙語、德語和俄語版本。

非英語自動語音識別模型是在各種開源數據集(如 Mozilla Common Voice )以及私有數據集上訓練的。 Riva 開發(fā)自動語音識別模型是為了提供開箱即用的準確度,并作為適應行業(yè)、行話、方言甚至嘈雜環(huán)境的良好起點。在流行的評估數據集上,這些模型在多個行業(yè)應用中提供了世界級的準確性。

可定制的文本到語音管道

為了讓客戶享受逼真的對話,語音應用程序必須提供類似人類的表情。使用 FASTROPE ,NVIDIA 語音 AI 研究小組創(chuàng)建的新模型 Riva 幫助開發(fā)者定制文本到語音管道并創(chuàng)建表達性語音接口。例如,在推理過程中,開發(fā)人員可以使用 SSML 標簽改變語音音調和速度。

圖 2:NVIDIA Riva 提供了可定制的文本到語音管道,用于更具表現力的交互。

最新的最先進的模型,比如里瓦的 Fastpitch ,幫助文本到語音管道的運行速度比市場上其他競爭對手快幾倍。

關于作者

About Gordana Neskovic

Gordana Neskovic 是AI/DL產品營銷團隊的成員,負責 NVIDIA Maxine。在加入 NVIDIA 之前,Gordana曾在VMware、Wells Fargo、Pinterest、SFO-ITT和KLA Tencor擔任過各種產品營銷、數據科學家、AI架構師和工程職位。她擁有博士學位。圣塔 Clara 大學,塞爾維亞貝爾格萊德大學電氣工程碩士和學士學位。

About Sirisha Rella

Sirisha Rella 是 NVIDIA 的技術產品營銷經理,專注于計算機視覺、語音和基于語言的深度學習應用。 Sirisha 獲得了密蘇里大學堪薩斯城分校的計算機科學碩士學位,是國家科學基金會大學習中心的研究生助理。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5696

    瀏覽量

    110142
  • AI
    AI
    +關注

    關注

    91

    文章

    41326

    瀏覽量

    302707
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    使用Python/MyHDL創(chuàng)建自定義FPGA IP

    使用 Python/MyHDL 創(chuàng)建自定義 FPGA IP,與 Vivado 集成,并通過 PYNQ 進行控制——實現軟件上的簡單硬件設計。
    的頭像 發(fā)表于 04-09 09:53 ?293次閱讀
    使用Python/MyHDL<b class='flag-5'>創(chuàng)建</b><b class='flag-5'>自定義</b>FPGA IP

    MCUXpresso SDK創(chuàng)建自定義清單

    by standardizing SDK configurations. 本指南將介紹創(chuàng)建和使用自定義清單來定制 MCUXpresso SDK 設置的過程,確保您的開發(fā)環(huán)境針對性能和可維護性進行優(yōu)化
    發(fā)表于 04-07 07:11

    極海APM32F427如何實現自定義USB HID設備與PC進行通信

    最近需要使用到 APM32F427 枚舉成Custom HID設備進行用戶自定義通信,但是官方的例程只有提供的HID枚舉為鼠標或者鍵盤類型的設備。這里記錄一下,怎么使用Geehy官方的USB中間件,實現自定義的USB HID設備進行用戶通信。
    的頭像 發(fā)表于 03-30 09:30 ?2801次閱讀
    極海APM32F427如何實現<b class='flag-5'>自定義</b>USB HID設備與PC進行通信

    如何為 Vision Five 2 編譯自定義 Linux 內核?

    Vision Five 2 的 Debian 用戶指南只提供了半頁關于如何編譯自己的內核的相當稀疏的內容。僅從該文檔中,我無法制作我的自定義內核。那里的信息似乎相當不完整。如果有人能提供一些
    發(fā)表于 02-24 07:44

    電能質量監(jiān)測裝置可自定義監(jiān)測時段嗎?

    電能質量監(jiān)測裝置普遍支持自定義監(jiān)測時段,現代中高端裝置還具備分時差異化監(jiān)測與靈活觸發(fā)能力,可按時間、事件或混合策略定制采集與存儲,兼顧精度、效率與存儲成本。 一、自定義監(jiān)測時段的核心實現方式 1.
    的頭像 發(fā)表于 12-10 16:49 ?1187次閱讀

    無圖形界面模式下自定義檢查工具的應用

    此前文章已介紹 ANSA 中的自定義檢查工具。本文將探討該功能在無圖形界面(No-GUI)模式下的應用,旨在滿足標準化工作流程的需求,適用于需要高度自動化的前處理場景。通過集成自定義檢查,用戶可實現工作流程的高效自動化運行。
    的頭像 發(fā)表于 11-30 14:13 ?804次閱讀
    無圖形<b class='flag-5'>界面</b>模式下<b class='flag-5'>自定義</b>檢查工具的應用

    采用匯編指示符來使用自定義指令

    具體實現 1、采用.word .half .dword等匯編指示符直接插入自定義指令,這種方法需要自己指定寄存器。其中.word為插入一個字的數據即32位,.half為插入半字即16位
    發(fā)表于 10-28 06:02

    零代碼實現茶吧機自定義語音控制定制

    零代碼實現茶吧機自定義語音控制定制 前言 茶吧機集成離線語音控制,核心是通過自然語音交互替代手動操作實現全方位體驗升級 —— 既無需起身即可完成燒水、調溫等操作,省去傳統多步按鍵調試的
    的頭像 發(fā)表于 10-17 16:43 ?1474次閱讀
    零代碼實現茶吧機<b class='flag-5'>自定義</b><b class='flag-5'>語音</b>控制定制

    如何使用SDK進行自定義音頻播放功能

    在上一篇文章安信可離線語音模組 VC-01、VC-02 系列教程 【二次開發(fā)篇】自定義音頻替換失敗過程中,簡要概述了res_build_tool.py 文件, 其主要的作用就是將音頻文件進行轉換,從而使編譯固件的時候能夠將音頻文件編譯到BIN中,然后在各項事件觸發(fā)的時候實
    的頭像 發(fā)表于 09-25 15:52 ?4467次閱讀
    如何使用SDK進行<b class='flag-5'>自定義</b>音頻播放功能

    LOTO示波器自定義解碼功能—CANFD解碼

    LOTO示波器軟件更新了自定義解碼功能,并在bilibili上傳了演示視頻,視頻鏈接: https://www.bilibili.com/video/BV1wq3ezjEjQ
    的頭像 發(fā)表于 07-11 10:34 ?1225次閱讀
    LOTO示波器<b class='flag-5'>自定義</b>解碼功能—CANFD解碼

    大彩講堂:VisualTFT軟件如何自定義圓形進度條

    VisualTFT軟件如何自定義圓形進度條
    的頭像 發(fā)表于 07-07 17:10 ?1983次閱讀
    大彩講堂:VisualTFT軟件如何<b class='flag-5'>自定義</b>圓形進度條

    KiCad 中的自定義規(guī)則(KiCon 演講)

    設計規(guī)則 展開,重點探討了 那些復雜卻強大的特性。 由于這些規(guī)則本質上是基于文本表達的,需要用戶細致入微的理解。演講的 核心目標 是引導用戶有效實施這些規(guī)則,從而 規(guī)避布線問題、提升制造良率,并優(yōu)化設計流程 。 討論 始于對自定義設計規(guī)則的
    的頭像 發(fā)表于 06-16 11:17 ?2613次閱讀
    KiCad 中的<b class='flag-5'>自定義</b>規(guī)則(KiCon 演講)

    HarmonyOS應用自定義鍵盤解決方案

    自定義鍵盤是一種替換系統默認鍵盤的解決方案,可實現鍵盤個性化交互。允許用戶結合業(yè)務需求與操作習慣,對按鍵布局進行可視化重構、設置多功能組合鍵位,使輸入更加便捷和舒適。在安全防護層面,自定義鍵盤可以
    的頭像 發(fā)表于 06-05 14:19 ?2673次閱讀

    Skydel25.4發(fā)布:解鎖自定義星座,增強C波段與干擾模擬能力

    在GNSS模擬技術持續(xù)迭代的浪潮中,Skydel邁出創(chuàng)新一步,正式發(fā)布25.4.0版本及后續(xù)修復版本25.4.1。本次更新的核心突破在于引入了強大的自定義星座功能,賦予用戶前所未有的自由度,可創(chuàng)建包含多達400顆衛(wèi)星的專屬星座,突破傳統測試限制。
    的頭像 發(fā)表于 06-03 10:14 ?946次閱讀
    Skydel25.4發(fā)布:解鎖<b class='flag-5'>自定義</b>星座,增強C波段與干擾模擬能力

    如何使用自定義設置回調函數?

    你好,我正在嘗試編寫自己的自定義設置回調函數,并使用 fastEnum=false。 是否有任何代碼示例或資料可供我參考? void CyU3PUsbRegisterSetupCallback
    發(fā)表于 05-21 06:11
    南和县| 阜新| 盐边县| 玉树县| 汉川市| 吉林省| 安义县| 阳曲县| 梅州市| 邮箱| 达孜县| 阳原县| 积石山| 淮滨县| 双流县| 曲水县| 浙江省| 紫云| 伊宁市| 吴忠市| 延安市| 渝中区| 陆川县| 卢氏县| 公主岭市| 新源县| 德格县| 八宿县| 客服| 衡东县| 阿克| 瑞丽市| 阳原县| 逊克县| 建始县| 南充市| 若尔盖县| 龙川县| 富裕县| 桐城市| 游戏|