日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

百度端對端語音識別專利揭秘

汽車玩家 ? 來源: 愛集微 ? 作者: 愛集微 ? 2020-01-08 11:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

百度公司提出的端對端神經網絡模型來進行語音識別,成功的代替了手工工程化部件的流水線操作,這讓整個語音識別技術更加便捷,而使用神經網絡來抽取輸入端的特征信息相當于人功抽取特征則更加全面。

集微網消息,近年來,語音識別技術得到了迅猛的發(fā)展,這得益于人工智能的快速發(fā)展,其中最為主要的學業(yè)界的各大神經網絡的出現,包括基礎的序列神經網絡模型RNN、LSTM和GRU。語音識別技術也已經進入到各行各業(yè)中,如工業(yè)、家電、通信汽車電子等。于是,對于語音識別技術的要求也將更加嚴格了,更傾向于走向準確化和便捷化。

以往,構建語音識別模型主要是使用HMM的序列模型,再使用手工工程化部件來實現整個流水線操作,并且對于不同的語言的語音需要重新構建模型的結果特征。對此,國內語音識別技術第一梯隊公司百度便提出了使用端對端的神經網絡模型來進行語音識別工作,該專利為“端對端語音識別”(專利號:CN107408111A)。

首先,小編在這先介紹一下神經網絡端對端的學習方式。對于語音識別來說,端到端深度學習做的是,訓練一個深度神經網絡,輸入就是一段音頻,輸出直接是聽寫文本。其中這里的端表示輸入源數據端,另外一端是神經網絡處理的結果也就是我們最終需要的目標。這種訓練學習的方式能應對多種語言的語音識別的場景構建,因為僅僅是需要改變輸入端和輸出端,深度神經網絡的結構并不需要根據語言的語音不同而改變。

專利中提出的端對端的深度學習模型的架構圖如圖1所示。該架構包括訓練以攝取語譜并生成文本的遞歸神經網絡模型。首先,使用一個或更多個卷積層對語譜進行特征提取,緊接著,使用一個或多個遞歸層(雙向GRU神經網絡)對語譜的特征進行時序建模。最后再使用全連接層將遞歸層獲取的語譜信息進行全連接作為CTC(鏈結式時間分類算法:重點解決輸入數據與給定標簽的對齊問題)的輸入,經過Softmax計算輸出各個文本標簽的概率。

圖1端對端深度學習模型架構圖

經過上述端對端深度學習模型構建后,專利中還給出了端對端深度學習模型的訓練方法,如圖2所示。

百度端對端語音識別專利揭秘

圖2 端對端深度學習模型訓練方法圖

首先需要為模型設置好,輸入端和輸出端,對于語音識別技術來說,輸入端為一時間序列頻譜幀的話語X,輸出端是與話語X具有相關聯的真實標簽Y。

構建深度神經網絡模型(包括一個或多個卷積層和一個或多個遞歸層的模型)用來預測一個或多個字符也就是我們輸出端的標簽。

根據網絡模型的輸出端的標簽的概率分布與真實標簽的誤差計算損失函數,提供損失函數推出標簽預測的誤差,再使用梯度反向傳播算法更新模型參數。從而達到網絡模型學習的目的。

百度公司提出的端對端神經網絡模型來進行語音識別,成功的代替了手工工程化部件的流水線操作,這讓整個語音識別技術更加便捷,而使用神經網絡來抽取輸入端的特征信息相當于人功抽取特征則更加全面,這讓整個語音識別技術更加準確。從這兩方面來看,端對端的神經網絡模型確實是讓語音識別技術走向了便捷化,準確化。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 百度
    +關注

    關注

    9

    文章

    2389

    瀏覽量

    95237
  • 語音識別
    +關注

    關注

    39

    文章

    1825

    瀏覽量

    116252
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    百度地圖與NIMO眼鏡達成深度合作

    近日,百度地圖與NIMO眼鏡達成深度合作,將百度地圖全棧導航能力以輕量化、低功耗、極簡交互的方式落地智能眼鏡場景,為騎行、步行、日常通勤用戶提供抬頭即見、安全隨行的新一代導航體驗。
    的頭像 發(fā)表于 04-09 10:00 ?341次閱讀

    語音識別芯片介紹,語音識別芯片工作原理解析

    在智能交互不斷深入的今天,語音識別芯片正成為眾多設備實現語音控制與AI對話的關鍵部件。語音芯片廣義上涵蓋語音播放、錄音及
    的頭像 發(fā)表于 04-01 16:26 ?254次閱讀

    百度智能云推出全球首款手機龍蝦應用

    昨天,百度智能云發(fā)布了一款即開即用的零部署服務DuClaw。目前,DuClaw網頁服務已上線,能夠實現零門檻“養(yǎng)蝦”。DuClaw來了!零門檻開啟自由“養(yǎng)蝦”
    的頭像 發(fā)表于 03-13 11:38 ?605次閱讀

    百度文心大模型5.0正式版上線

    今天,在百度文心Moment大會現場,文心大模型5.0正式版上線。
    的頭像 發(fā)表于 01-23 16:48 ?1526次閱讀

    百度地圖開放平臺與400萬開發(fā)者共赴智能時空新未來

    二十年星辰大海,十五載開放引航。2025年,百度地圖迎來服務用戶的二十周年,其開放平臺亦走過了與開發(fā)者并肩同行的十五個春秋。在近期舉行的“2025百度地圖開發(fā)者盛典”上,百度地圖開放平臺回顧了從提供基礎地圖API,演進為以AI為
    的頭像 發(fā)表于 01-23 09:03 ?963次閱讀
    <b class='flag-5'>百度</b>地圖開放平臺與400萬開發(fā)者共赴智能時空新未來

    MediaTek攜手合作伙伴推動語音識別落地

    在《王者榮耀》等多人競技游戲中,語音溝通是團隊配合的核心。但網絡不穩(wěn)定、噪聲環(huán)境等問題會影響識別準確。
    的頭像 發(fā)表于 12-28 15:30 ?1356次閱讀

    百度健康升級發(fā)布文心健康管家

    面臨醫(yī)療資源分布不均、就診流程繁瑣、就醫(yī)信息不均等難題,“想讓每個家庭都擁有專屬醫(yī)生”成為百度健康的愿景。
    的頭像 發(fā)表于 12-23 15:01 ?923次閱讀

    語音交互革命:百度智能云聯合地瓜機器人,重塑AI陪伴體驗

    電子發(fā)燒友網報道(文/莫婷婷)隨著大模型技術的迅猛發(fā)展,人機交互正經歷從“工具式響應”向“擬人化陪伴”的深刻變革。在這一進程中,語音交互作為最自然的人機溝通方式。 ? 百度智能云泛科技行業(yè)解決方案
    發(fā)表于 12-01 01:07 ?1869次閱讀
    <b class='flag-5'>端</b>到<b class='flag-5'>端</b><b class='flag-5'>語音</b>交互革命:<b class='flag-5'>百度</b>智能云聯合地瓜機器人,重塑AI陪伴體驗

    百度世界大會亮點 五年五芯 百度宣布打造最硬AI云

    自2006年以來,百度世界大會已連續(xù)舉辦近20屆,百度世界大會是百度每年面向行業(yè)、媒體、合作伙伴和廣大用戶的最高級別盛事,作為百度年度最重要的的戰(zhàn)略、技術、產品發(fā)布會,自2006年以來
    的頭像 發(fā)表于 11-13 15:47 ?1956次閱讀

    百度世界2025進行中 百度昆侖芯超節(jié)點亮相 性能巨幅提升

    百度世界大會是百度每年面向行業(yè)、媒體、合作伙伴和廣大用戶的最高級別盛事,作為百度年度最重要的的戰(zhàn)略、技術、產品發(fā)布會,自2006年以來已連續(xù)舉辦19年,持續(xù)為行業(yè)搭建起交流前沿技術、碰撞創(chuàng)新
    的頭像 發(fā)表于 11-13 11:51 ?1499次閱讀

    語音交互數據 精準賦能語音大模型進階

    語音大模型從“能識別”向“懂語境”跨越的關鍵階段,高質量場景化語音數據已成為制約技術突破的核心瓶頸。傳統(tǒng)語音識別數據集采用孤立標注,在
    的頭像 發(fā)表于 09-11 17:17 ?853次閱讀

    百度智能云發(fā)布全球首批AI數字員工

    沒錯,在今天的百度AI Day開放日現場,這么溜的同事們正式上崗!
    的頭像 發(fā)表于 08-12 09:47 ?1914次閱讀

    廣和通發(fā)布自研語音識別大模型FiboASR

    7月,全球領先的無線通信模組及AI解決方案提供商廣和通,發(fā)布其自主研發(fā)的語音識別大模型FiboASR。該模型專為側設備上面臨的面對面實時對話及多人會議場景深度優(yōu)化,在低延遲語音交互、
    的頭像 發(fā)表于 08-04 11:43 ?1787次閱讀

    歐洲央行行長一行到訪百度Apollo Park

    近日,拉加德一行到訪位于北京亦莊(經濟技術開發(fā)區(qū))的百度Apollo Park,與百度Jackson等人交流自動駕駛、AI發(fā)展等話題,并在亦莊東環(huán)南路、宏達南路等公開道路上,試乘了蘿卜快跑第六代無人駕駛汽車。
    的頭像 發(fā)表于 06-18 15:44 ?992次閱讀

    百度地圖重磅發(fā)布地圖AI開放平臺

    近日,在WGDC25全球時空智能大會上,百度地圖重磅發(fā)布地圖AI開放平臺。百度地圖深耕20年的數據能力、引擎能力與AI技術全面開放,向開發(fā)者深度開放四大核心能力和五大場景解決方案。
    的頭像 發(fā)表于 05-26 11:26 ?2055次閱讀
    乐山市| 嘉峪关市| 大邑县| 双桥区| 墨竹工卡县| 友谊县| 乌苏市| 湄潭县| 平果县| 淅川县| 安泽县| 安新县| 牙克石市| 罗山县| 铁岭县| 馆陶县| 克什克腾旗| 黄冈市| 涿州市| 饶平县| 石景山区| 万州区| 个旧市| 黔东| 镇原县| 通榆县| 本溪| 宁安市| 柘城县| 桐城市| 武邑县| 蒲江县| 四平市| 常州市| 砚山县| 同德县| 维西| 隆子县| 象山县| 肃北| 朝阳市|