日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何讓神經聲碼器高效地用于序列到序列聲學模型

ss ? 來源:IT創(chuàng)事記 ? 作者:IT創(chuàng)事記 ? 2021-01-07 16:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

往往在放下手機之后你才會意識到,電話那頭的客服其實是個機器人;或者準確地說,是“一位”智能客服。

沒錯,今天越來越多的工作正在被交給人工智能技術去完成,文本轉語音(TTS,Text To Speech)就是其中非常成熟的一部分。它的發(fā)展,決定了今天我們聽到的許多“人聲”,是如此地逼真,以至于和真人發(fā)聲無異。

除了我們接觸最多的智能客服,智能家居中的語音助手、可以服務聽障人士的無障礙播報,甚至是新聞播報和有聲朗讀等服務,事實上都基于TTS這項技術。它是人機對話的一部分——簡單地說,就是讓機器說人話。

它被稱為同時運用語言學和心理學的杰出之作。不過在今天,當我們稱贊它的杰出時,更多的是因為它在在線語音生成中表現(xiàn)出的高效。

要提升語音合成效率當然不是一件容易的事。這里的關鍵是如何讓神經聲碼器高效地用于序列到序列聲學模型,來提高TTS質量。

科學家已經開發(fā)出了很多這樣的神經網絡聲碼器,例如WaveNet、Parallel WaveNet、WaveRNN、LPCNet 和 Multiband WaveRNN等,它們各有千秋。

WaveNet聲碼器可以生成高保真音頻,但在計算上它那巨大的復雜性,限制了它在實時服務中的部署;

LPCNet聲碼器利用WaveRNN架構中語音信號處理的線性預測特性,可在單個處理器內核上生成超實時的高質量語音;但可惜,這對在線語音生成任務而言仍不夠高效。

科學家們希望TTS能夠在和人的“交流”中,達到讓人無感的順暢——不僅是語調上的熱情、親切,或冷靜;更要“毫無”延遲。

新的突破出現(xiàn)在騰訊。騰訊 AI Lab(人工智能實驗室)和云小微目前已經率先開發(fā)出了一款基于WaveRNN多頻帶線性預測的全新神經聲碼器FeatherWave。經過測試,這款高效高保真神經聲碼器可以幫助用戶顯著提高語音合成效率。

英特爾的工程團隊也參與到了這項開發(fā)工作中。他們把面向第三代英特爾至強可擴展處理器所做的優(yōu)化進行了全面整合,并采用了英特爾深度學習加速技術(英特爾 DL Boost)中全新集成的 16 位 Brain Floating Point (bfloat16) 功能。

bfloat16是一個精簡的數(shù)據(jù)格式,與如今的32位浮點數(shù)(FP32)相比,bfloat16只通過一半的比特數(shù)且僅需對軟件做出很小程度的修改,就可達到與FP32同等水平的模型精度;與半浮點精度 (FP16) 相比,它可為深度學習工作負載提供更大的動態(tài)范圍;與此同時,它無需使用校準數(shù)據(jù)進行量化/去量化操作,因此比 INT8 更方便。這些優(yōu)勢不僅讓它進一步提升了模型推理能力,還讓它能為模型訓練提供支持。

事實上,英特爾至強可擴展處理器本就是專為運行復雜的人工智能工作負載而設計的。借助英特爾深度學習加速技術,英特爾志強可擴展處理器將嵌入式 AI 性能提升至新的高度。目前,此種處理器現(xiàn)已支持英特爾高級矢量擴展 512 技術(英特爾AVX-512 技術)和矢量神經網絡指令 (VNNI)。

在騰訊推出的全新神經聲碼器FeatherWave 聲碼器中,就應用了這些優(yōu)化技術。

FeatherWave 聲碼器框圖

利用英特爾AVX-512技術和bfloat16指令,騰訊的科學家們確保了GRU模塊和Dense運算符中粗略部分/精細部分的所有SGEMV計算都使用512位矢量進行矢量化,并采用bfloat16點積指令;對于按元素逐個加/乘等運算以及其他非線性激活,都使用最新的英特爾AVX-512 指令運行。

在最終都性能測試中,通過優(yōu)化,相同質量水平(MOS4.5)的文本轉語音速度比FP32提升了高達1.54倍。

此外,騰訊還以 GAN 和 Parallel WaveNet (PWaveNet)為基礎,推出了一種改進后的模型,并基于第三代英特爾至強可擴展處理器對模型性能進行了優(yōu)化,最終使性能與采用FP32相比提升了高達1.89倍,同時質量水平仍保持不變 (MOS4.4)。

騰訊在TTS領域的進展顯示出了人工智能領域的一個趨勢,那就是科學家們越來越多開始利用英特爾深度學習加速技術在CPU平臺上開展工作。

就像騰訊在針對TTS的探索中獲得了性能提升那樣,第二代和第三代英特爾至強可擴展處理器在集成了加速技術后,已經顯著提升了人工智能工作負載的性能。

在更廣泛的領域內,我們已經能夠清楚地看到這種變化——在效率表現(xiàn)上,由于針對常見人工智能軟件框架,如TensorFlow和PyTorch、庫和工具所做的優(yōu)化,CPU平臺可以幫助保持較高的性能功耗比和性價比。

尤其是擴展性上,用戶在設計系統(tǒng)時可以利用如英特爾以太網700系列,和英特爾傲騰內存存儲技術,來優(yōu)化網絡和內存配置。這樣一來,他們就可以在充分利用現(xiàn)有硬件投資的情況下,輕松擴展人工智能訓練的工作負載,獲得更高的吞吐量,甚至處理巨大的數(shù)據(jù)集。

不止于處理器平臺本身,英特爾目前在面向人工智能優(yōu)化的軟件,以及市場就緒型人工智能解決方案兩個維度,都建立起了差異化的市場優(yōu)勢。

例如在軟件方面,英特爾2019年2月進行的 OpenVINO/ResNet50 INT8 性能測試顯示,使用 OpenVINO或TensorFlow和英特爾深度學習加速技術時,人工智能推理性能可提高多達 3.75 倍。

今天,英特爾已經攜手解決方案提供商,構建了一系列的精選解決方案。這些方案預先進行了配置,并對工作負載進行了優(yōu)化。這就包括了如基于人工智能推理的英特爾精選解決方案,以及面向在面向在Apache Spark上運行的BigDL的英特爾精選解決方案等。

這些變化和方案的出現(xiàn)對于那些希望能從整體業(yè)務視角,去觀察人工智能進展的機構或企業(yè)的管理層顯然也很有意義——如果只通過優(yōu)化,就能在一個通用平臺上完成所有人工智能的探索和落地,那么投資的價值就能夠實現(xiàn)最大化。

許多企業(yè)做出了這樣的選擇,GE醫(yī)療就是其中一家。作為GE集團旗下的醫(yī)療健康業(yè)務部門,它構建了一個人工智能醫(yī)學影像部署架構。

通過采用英特爾至強可擴展處理器,和英特爾固態(tài)盤,以及多項英特爾關鍵技術——例如英特爾深度學習開發(fā)工具包,和面向深度神經網絡的英特爾數(shù)學核心函數(shù)庫等;GE醫(yī)療收獲了未曾預料到的成果:

這一解決方案最終比基礎解決方案的推理速度提升了多達14倍,且超過了GE原定推理目標5.9倍。

責任編輯:xj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    214

    文章

    31587

    瀏覽量

    224188
  • 神經網絡
    +關注

    關注

    42

    文章

    4845

    瀏覽量

    108298
  • 智能化
    +關注

    關注

    15

    文章

    5273

    瀏覽量

    60359
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    序列建模標準具和FABRY-PéROT諧振

    光學標準具用于各種應用,例如在光譜學和激光諧振領域。標準具的基本結構僅僅包括一對平面平行的透明板,并可以形成一個眾所周知的Fabry-Pérot諧振,它通常用于光譜和/或角度選擇
    發(fā)表于 05-08 08:08

    探秘DS1990A:高效序列號iButton的使用指南

    探秘DS1990A:高效序列號iButton的使用指南 在電子設計領域,精確的自動識別技術至關重要。DS1990A序列號iButton作為一種堅固耐用的數(shù)據(jù)載體,在自動識別方面表現(xiàn)出色。今天,我們
    的頭像 發(fā)表于 04-01 15:20 ?153次閱讀

    深度解析DS1830/A復位序列:特性、操作與應用

    深度解析DS1830/A復位序列:特性、操作與應用 在電子系統(tǒng)設計中,復位序列是確保系統(tǒng)穩(wěn)定啟動和可靠運行的關鍵組件。今天我們就來深入探討DALLAS SEMICONDUCTOR(
    的頭像 發(fā)表于 02-28 15:10 ?310次閱讀

    JSON:簡潔代碼高效搞定序列化與反序列

    面對頻繁的數(shù)據(jù)交互需求,用最簡方式實現(xiàn)JSON序列化與反序列化已成為開發(fā)者必備技能,借助主流庫,輕松實現(xiàn)零負擔數(shù)據(jù)轉換。JSON(JavaScriptObjectNotation)是一種輕量級
    的頭像 發(fā)表于 02-25 19:04 ?292次閱讀
    JSON:簡潔代碼<b class='flag-5'>高效</b>搞定<b class='flag-5'>序列</b>化與反<b class='flag-5'>序列</b>化

    【ioqueue】 IO序列化操作全解析

    。 一、概述 ioqueue 模塊提供了 IO 序列操作的功能,可以通過硬件定時精確控制 GPIO 的操作時序。 注意事項: 對于 Air700EXX 系列、Air780EXX 系列、Air8000 系列模組,硬件定時有如下
    的頭像 發(fā)表于 02-24 19:22 ?266次閱讀
    【ioqueue】 IO<b class='flag-5'>序列</b>化操作全解析

    極簡代碼,搞定JSON序列化與反序列

    LuatOS開發(fā)中,使用以下兩個函數(shù)高效處理JSON數(shù)據(jù)。 1.1 ?兩個關鍵函數(shù) 1)json.encode(obj,t) 功能是將Lua對象序列化為
    的頭像 發(fā)表于 02-23 21:46 ?485次閱讀
    極簡代碼,搞定JSON<b class='flag-5'>序列</b>化與反<b class='flag-5'>序列</b>化

    脈沖序列幅值的提取

    請教各位大佬,如圖這種脈沖序列,怎么把每個脈沖的幅值提取出來? *附件:脈沖序列幅值提取.rar
    發(fā)表于 02-09 11:35

    深入解析LM2512A:高性能RGB顯示接口序列

    深入解析LM2512A:高性能RGB顯示接口序列 在電子設備的顯示領域,如何高效、穩(wěn)定地傳輸高質量的圖像數(shù)據(jù)是一個關鍵問題。TI的LM2512A作為一款專門的移動像素鏈路(MPL - 1)24位
    的頭像 發(fā)表于 12-26 11:30 ?640次閱讀

    一文讀懂LSTM與RNN:從原理到實戰(zhàn),掌握序列建模核心技術

    在AI領域,文本翻譯、語音識別、股價預測等場景都離不開序列數(shù)據(jù)處理。循環(huán)神經網絡(RNN)作為最早的序列建模工具,開創(chuàng)了“記憶歷史信息”的先河;而長短期記憶網絡(LSTM)則通過創(chuàng)新設計,突破
    的頭像 發(fā)表于 12-09 13:56 ?1978次閱讀
    一文讀懂LSTM與RNN:從原理到實戰(zhàn),掌握<b class='flag-5'>序列</b>建模核心技術

    ATA-D60090功率放大器在時間調制序列生成中的應用

    利用計算機生成波束掃描所需的的波束掃描的時間編碼序列。根據(jù)時間編碼序列,任意信號發(fā)生產生的方波信號通過功率放大器產生控制電壓信號。
    的頭像 發(fā)表于 11-30 14:27 ?550次閱讀
    ATA-D60090功率放大器在時間調制<b class='flag-5'>序列</b>生成中的應用

    脈沖神經元模型的硬件實現(xiàn)

    實現(xiàn)。所以現(xiàn)有的大部分 SNN 加速的硬件實現(xiàn)上都采用LIF模型。 如圖所示,設計的 SNN 神經核整體架構如圖所示。 神經核主要由 LIF
    發(fā)表于 10-24 08:27

    小白學大模型:國外主流大模型匯總

    )領域。論文的核心是提出了一種名為Transformer的全新模型架構,它完全舍棄了以往序列模型(如循環(huán)神經網絡RNNs和卷積神經網絡CNN
    的頭像 發(fā)表于 08-27 14:06 ?1226次閱讀
    小白學大<b class='flag-5'>模型</b>:國外主流大<b class='flag-5'>模型</b>匯總

    TPS38700S-Q1多通道電壓序列發(fā)生技術解析

    Texas Instruments TPS38700S-Q1集成式多通道電壓序列發(fā)生配有窗口看門狗、I^2^C可編程,采用24引腳4mm x 4mm VQFN封裝。該多通道電壓序列發(fā)生
    的頭像 發(fā)表于 08-18 15:50 ?1201次閱讀
    TPS38700S-Q1多通道電壓<b class='flag-5'>序列</b>發(fā)生<b class='flag-5'>器</b>技術解析

    TPS38700-Q1 電源供應序列總結

    計,可與多通道電壓監(jiān)控連接。該器件默認為預編程的OTP選項,但I2C可以根據(jù)需要對上電和斷電序列、看門狗設置和序列時序選項進行重新編程。
    的頭像 發(fā)表于 08-18 15:17 ?1072次閱讀
    TPS38700-Q1 電源供應<b class='flag-5'>序列</b><b class='flag-5'>器</b>總結

    VirtualLab Fusion應用:多反射系統(tǒng)的非序列建模

    序列光學系統(tǒng),特別是那些非序列性來自組件內部多次內部反射的系統(tǒng),具有一系列特定的挑戰(zhàn)。將這樣的系統(tǒng)分解成一個順序等價的系統(tǒng)通常非常不方便,而且總是不切實際的。因此,擁有一個穩(wěn)定的非序列建模策略
    發(fā)表于 06-12 08:49
    靖州| 滨海县| 乌兰浩特市| 德化县| 耿马| 四川省| 永福县| 原阳县| 隆化县| 东宁县| 新绛县| 西乡县| 福建省| 巴中市| 灵丘县| 东明县| 呈贡县| 临夏市| 海城市| 绩溪县| 平邑县| 新蔡县| 秭归县| 永平县| 威信县| 沙田区| 泸水县| 宜宾市| 玉林市| 荆门市| 姜堰市| 健康| 泸水县| 长汀县| 丰原市| 洛宁县| 绵竹市| 福建省| 鹤山市| 栾城县| 陵川县|