日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

淺析語音識(shí)別技術(shù)的發(fā)展歷程

汽車玩家 ? 來源:旺龍ITLONG、eepw、個(gè)人圖書 ? 作者:旺龍ITLONG、eepw、個(gè) ? 2022-02-07 10:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語音識(shí)別,通常稱為自動(dòng)語音識(shí)別,主要是將人類語音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,也有可能是按鍵、二進(jìn)制編碼或者字符序列。但是,我們一般理解的語音識(shí)別其實(shí)都是狹義的語音轉(zhuǎn)文字的過程,簡稱語音轉(zhuǎn)文本識(shí)別,主要是識(shí)別和確認(rèn)發(fā)出語音的人而非其中所包含的內(nèi)容。

語音識(shí)別的目的就是讓機(jī)器聽懂人類口述的語言,包括了兩方面的含義:一是逐字逐句聽懂而不是轉(zhuǎn)化成書面的語言文字;二是對(duì)口述語言中所包含的命令或請(qǐng)求加以領(lǐng)會(huì),做出正確回應(yīng),而不僅僅只是拘泥于所有詞匯的正確轉(zhuǎn)換。

語音識(shí)別系統(tǒng)根據(jù)對(duì)輸入語音的限制分類,可以將識(shí)別系統(tǒng)分為三類:

①特定人語音識(shí)別系統(tǒng),僅考慮對(duì)于專人的話音進(jìn)行識(shí)別。

②非特定人語音系統(tǒng),識(shí)別的語音與人無關(guān),通常要用大量不同人的語音數(shù)據(jù)庫對(duì)識(shí)別系統(tǒng)進(jìn)行學(xué)習(xí)。

③多人的識(shí)別系統(tǒng),通常能識(shí)別一組人的語音,或者成為特定組語音識(shí)別系統(tǒng),該系統(tǒng)僅要求對(duì)要識(shí)別的那組人的語音進(jìn)行訓(xùn)練。

根據(jù)從說話的方式考慮,也可以將識(shí)別系統(tǒng)分為三類:

①孤立詞語音識(shí)別系統(tǒng),孤立詞識(shí)別系統(tǒng)要求輸入每個(gè)詞后要停頓。

②連接詞語音識(shí)別系統(tǒng),連接詞輸入系統(tǒng)要求對(duì)每個(gè)詞都清楚發(fā)音,一些連音現(xiàn)象開始出現(xiàn)。

③連續(xù)語音識(shí)別系統(tǒng),連續(xù)語音輸入是自然流利的連續(xù)語音輸入,大量連音和變音會(huì)出現(xiàn)。

在過去5-10年,隨著技術(shù)快速迭代,語音識(shí)別市場在我國得到飛快發(fā)展,目前處于深度神經(jīng)網(wǎng)絡(luò)階段。如今,語音識(shí)別主流廠商主要使用端到端的算法,在實(shí)驗(yàn)環(huán)境準(zhǔn)確率可高達(dá)99%以上,為推動(dòng)新基建發(fā)展,5G、人工智能、云計(jì)算等作為輔助核心基礎(chǔ)設(shè)施的核心技術(shù)得到進(jìn)一步加速發(fā)展,帶動(dòng)語音識(shí)別迎來迎來了更加廣闊的發(fā)展空間,智能家居、智能音箱、智能車載和智能硬件等等都得到很好的廣泛應(yīng)用。

語音識(shí)別主要趨于遠(yuǎn)場化和融合化的方向發(fā)展,但在遠(yuǎn)場可靠性還有很多難點(diǎn)沒有突破,比如多輪交互、多人噪雜等場景還有待突破,還有需求較為迫切的人聲分離等技術(shù)。新的技術(shù)應(yīng)該徹底解決這些問題,讓機(jī)器聽覺遠(yuǎn)超人類的感知能力。這不能僅僅只是算法的進(jìn)步,需要整個(gè)產(chǎn)業(yè)鏈的共同技術(shù)升級(jí),包括更為先進(jìn)的傳感器和算力更強(qiáng)的芯片。

單從遠(yuǎn)場語音識(shí)別技術(shù)來看,仍然存在很多挑戰(zhàn),包括:

回聲消除技術(shù)。由于喇叭非線性失真的存在,單純依靠信號(hào)處理手段很難將回聲消除干凈,這也阻礙了語音交互系統(tǒng)的推廣,現(xiàn)有的基于深度學(xué)習(xí)的回聲消除技術(shù)都沒有考慮相位信息,直接求取的是各個(gè)頻帶上的增益,能否利用深度學(xué)習(xí)將非線性失真進(jìn)行擬合,同時(shí)結(jié)合信號(hào)處理手段可能是一個(gè)好的方向。

噪聲下的語音識(shí)別仍有待突破。信號(hào)處理擅長處理線性問題,深度學(xué)習(xí)擅長處理非線性問題,而實(shí)際問題一定是線性和非線性的疊加,因此一定是兩者融合才有可能更好地解決噪聲下的語音識(shí)別問題。

語音識(shí)別的目的是讓機(jī)器可以理解人類,因此轉(zhuǎn)換成文字并不是最終的目的,如何將語音識(shí)別和語義理解結(jié)合起來可能是未來更為重要的一個(gè)方向。語音識(shí)別里的LSTM已經(jīng)考慮了語音的歷史時(shí)刻信息,但語義理解需要更多的歷史信息才能有幫助,因此如何將更多上下文會(huì)話信息傳遞給語音識(shí)別引擎是一個(gè)難題。

讓機(jī)器聽懂人類語言,僅靠聲音信息還不夠,“聲光電熱力磁”這些物理傳感手段,下一步必然都要融合在一起,只有這樣機(jī)器才能感知世界的真實(shí)信息,這是機(jī)器能夠?qū)W習(xí)人類知識(shí)的前提條件;而且,機(jī)器必然要超越人類的五官,能夠看到人類看不到的世界,聽到人類聽不到的世界。

未來,相信在國家政策的強(qiáng)力扶持下,能夠加速在垂直行業(yè)的滲透和布局,也相信在供應(yīng)商和開發(fā)者共同努力下,語音識(shí)別技術(shù)能夠更好地與其他語音交互技術(shù)及軟件功能融合,為消費(fèi)者提供更優(yōu)質(zhì)的體驗(yàn)。

文章整合自:旺龍ITLONG、eepw、個(gè)人圖書館

審核編輯:鄢孟繁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1825

    瀏覽量

    116255
  • 機(jī)器
    +關(guān)注

    關(guān)注

    0

    文章

    801

    瀏覽量

    41942
  • 二進(jìn)制編碼
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    3419
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    語音識(shí)別ic芯片分類工作原理,語音識(shí)別芯片分類

    語音識(shí)別IC芯片,通俗講就是能讓機(jī)器“聽懂”人話的專用集成電路。與傳統(tǒng)的語音播放芯片不同,語音識(shí)別芯片最大優(yōu)勢在于具備
    的頭像 發(fā)表于 04-24 15:14 ?168次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>ic芯片分類工作原理,<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>芯片分類

    語音識(shí)別芯片介紹,語音識(shí)別芯片工作原理解析

    在智能交互不斷深入的今天,語音識(shí)別芯片正成為眾多設(shè)備實(shí)現(xiàn)語音控制與AI對(duì)話的關(guān)鍵部件。語音芯片廣義上涵蓋語音播放、錄音及
    的頭像 發(fā)表于 04-01 16:26 ?256次閱讀

    語音識(shí)別芯片的功能與優(yōu)勢有哪些

    在智能語音交互快速發(fā)展的今天,語音識(shí)別芯片作為核心部件,正逐漸成為各類智能設(shè)備不可或缺的組成部分。一款優(yōu)秀的語音
    的頭像 發(fā)表于 03-30 15:31 ?190次閱讀

    語音識(shí)別IC分類,語音識(shí)別芯片的工作原理

    語音識(shí)別芯片,也叫語音識(shí)別集成電路,是一種集聲音存儲(chǔ)、播放、錄音及語音識(shí)別功能于一體的專用芯片。
    的頭像 發(fā)表于 01-14 15:22 ?427次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>IC分類,<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>芯片的工作原理

    國產(chǎn)32位MCU語音識(shí)別方案

    在智能家居、工業(yè)控制及便攜設(shè)備領(lǐng)域,語音交互正成為人機(jī)界面的重要發(fā)展方向。針對(duì)離線語音識(shí)別需求,基于國產(chǎn)32位MCU的解決方案日益成熟,其中以CH32V307等為代表的32位MCU芯片
    的頭像 發(fā)表于 12-04 15:11 ?711次閱讀

    語音識(shí)別芯片有哪些(語音識(shí)別芯片AT680系列)

    在人工智能技術(shù)飛速發(fā)展的今天,語音識(shí)別芯片作為人機(jī)交互的重要橋梁,正逐漸成為各類智能設(shè)備不可或缺的核心部件。與傳統(tǒng)的語音芯片不同,
    的頭像 發(fā)表于 11-14 17:11 ?1567次閱讀

    廣州唯創(chuàng)電子WTK6900H-24SS語音識(shí)別芯片:智能語音控制賦能臺(tái)燈創(chuàng)新應(yīng)用 | 語音IC廠家

    在智能家居快速發(fā)展的今天,語音交互技術(shù)正在深刻改變?nèi)藗兣c家居設(shè)備的互動(dòng)方式。臺(tái)燈作為日常生活中不可或缺的照明工具,其智能化升級(jí)已成為行業(yè)發(fā)展的重要趨勢。廣州唯創(chuàng)電子作為國內(nèi)領(lǐng)先的
    的頭像 發(fā)表于 11-05 09:20 ?992次閱讀
    廣州唯創(chuàng)電子WTK6900H-24SS<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>芯片:智能<b class='flag-5'>語音</b>控制賦能臺(tái)燈創(chuàng)新應(yīng)用 | <b class='flag-5'>語音</b>IC廠家

    什么是離線語音識(shí)別芯片(離線語音識(shí)別芯片有哪些優(yōu)點(diǎn))

    離線語音識(shí)別芯片,是一種集成了語音信號(hào)采集、前端處理和本地識(shí)別功能的專用集成電路,無須聯(lián)網(wǎng)也可以進(jìn)行語音控制。它內(nèi)設(shè)先進(jìn)的數(shù)字信號(hào)處理模塊及
    的頭像 發(fā)表于 10-31 15:27 ?702次閱讀

    如何選擇合適的語音識(shí)別芯片型號(hào)

    語音識(shí)別芯片(又稱語音識(shí)別IC)是現(xiàn)代智能設(shè)備的核心組件,與傳統(tǒng)語音芯片相比,其最大特點(diǎn)是能夠主動(dòng)識(shí)別
    的頭像 發(fā)表于 10-30 16:32 ?759次閱讀

    廣州唯創(chuàng)電子WTK6900H-32N語音識(shí)別芯片:AI降噪算法助力抽油煙機(jī)精準(zhǔn)語音控制 | 語音IC廠家

    在現(xiàn)代智能家居快速發(fā)展的大背景下,廚房作為家庭生活的重要場景,其智能化程度卻一直受到環(huán)境噪音的制約。抽油煙機(jī)作為廚房核心電器,其運(yùn)行產(chǎn)生的噪音往往使得傳統(tǒng)語音識(shí)別技術(shù)難以發(fā)揮效用。廣州
    的頭像 發(fā)表于 10-30 09:17 ?542次閱讀
    廣州唯創(chuàng)電子WTK6900H-32N<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>芯片:AI降噪算法助力抽油煙機(jī)精準(zhǔn)<b class='flag-5'>語音</b>控制 | <b class='flag-5'>語音</b>IC廠家

    語音識(shí)別系統(tǒng)的技術(shù)核心:從聲音到文字的智能轉(zhuǎn)換

    ? ? ? 語音識(shí)別技術(shù),也稱為自動(dòng)語音識(shí)別(ASR),其核心目標(biāo)是將人類語音信號(hào)轉(zhuǎn)換為對(duì)應(yīng)的文
    的頭像 發(fā)表于 09-05 14:04 ?1020次閱讀

    瑞芯微RK3576語音識(shí)別算法

    1.語音識(shí)別簡介語音識(shí)別技術(shù),也被稱為自動(dòng)語音識(shí)別
    的頭像 發(fā)表于 08-15 15:13 ?2463次閱讀
    瑞芯微RK3576<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>算法

    語音識(shí)別---大家怎么看呢?

    語音識(shí)別是一門交叉學(xué)科。近二十年來,語音識(shí)別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場。人們預(yù)計(jì),未來10年內(nèi),
    發(fā)表于 08-09 10:54

    語音識(shí)別芯片選型有哪些技術(shù)參數(shù)要注意

    語音識(shí)別芯片的使用場景越來越多涉及的范圍也越來越廣!那么語音芯片的選型就很重要了,選型不對(duì)直接影響產(chǎn)品的使用體驗(yàn),下面小編從不同的維度來給大家介紹語音
    的頭像 發(fā)表于 06-23 17:31 ?1087次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>芯片選型有哪些<b class='flag-5'>技術(shù)</b>參數(shù)要注意

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量

    源的開發(fā)資料為開發(fā)者提供了深入研究和定制語音機(jī)器人功能的基礎(chǔ),開發(fā)者可以根據(jù)不同的應(yīng)用需求,對(duì)語音識(shí)別算法、語音合成引擎等進(jìn)行優(yōu)化和改進(jìn)。一對(duì)一的
    發(fā)表于 05-28 11:36
    尼木县| 涞源县| 襄樊市| 汪清县| 卢氏县| 桑日县| 景宁| 博爱县| 垣曲县| 桑植县| 眉山市| 江源县| 临颍县| 台山市| 洞口县| 东丽区| 雅安市| 丰城市| 郑州市| 汝州市| 酒泉市| 怀化市| 乡城县| 罗平县| 仙桃市| 长白| 莎车县| 疏勒县| 师宗县| 江安县| 双流县| 冀州市| 林西县| 北辰区| 金沙县| 扎囊县| 阿拉善左旗| 朔州市| 南康市| 安庆市| 苗栗市|