在人類的感官通道中,視覺占據(jù)最主要的位置,聽覺次之,但在信息傳遞中,聽覺語言的綜合利用率要遠(yuǎn)高于視覺符號(hào)。因此,更接近于人類本能的交互方式--語音交互受到廣泛關(guān)注。目前,隨著智能語音技術(shù)的發(fā)展和應(yīng)用場景的不斷豐富,人機(jī)交互方式已經(jīng)開始從鍵盤、鼠標(biāo)以及觸摸式的圖形交互,向語音模式轉(zhuǎn)變,并且隨著搭載量和使用率的提升,未來有望成為人機(jī)交互最主要的入口。
底層技術(shù)持續(xù)增強(qiáng)
智能語音包含語音識(shí)別、語義理解、自然語言生成以及語音合成等環(huán)節(jié)。其中,語音識(shí)別是率先商業(yè)化、應(yīng)用最成熟的人工智能技術(shù)之一。根據(jù)信通院數(shù)據(jù),全球智能語音識(shí)別錯(cuò)誤率連續(xù)降低,從2008年的23.6%降低到2017年的5.5%。
與此同時(shí),國內(nèi)廠商也在不斷刷新準(zhǔn)確率的上限。2018年6月,阿里巴巴推出語音識(shí)別模型DFSMN,準(zhǔn)確率高達(dá)96.04%;科大訊飛也在同期宣布訊飛語音識(shí)別率提升至98%;2017年11月,百度大腦推出新款語音識(shí)別模型--“基于復(fù)數(shù)CNN網(wǎng)絡(luò)的語音增強(qiáng)和聲學(xué)建模一體化的端到端語音識(shí)別模型”,打破了傳統(tǒng)遠(yuǎn)場語音識(shí)別技術(shù)的流程,將語音識(shí)別準(zhǔn)確率提高30%以上。
此外,大數(shù)據(jù)、深度學(xué)習(xí)、云計(jì)算等技術(shù)的迅速發(fā)展,也為智能語音提供了底層技術(shù)支持。
應(yīng)用場景豐富多元
在國家大力發(fā)展人工智能產(chǎn)業(yè)的戰(zhàn)略引導(dǎo)下,以及企業(yè)技術(shù)能力提升和市場需求不斷擴(kuò)張的驅(qū)動(dòng)下,智能語音技術(shù)在智能家居、車載環(huán)境、在線教育、醫(yī)療、呼叫中心等各個(gè)場景均有落地化應(yīng)用。據(jù)中國電子信息產(chǎn)業(yè)發(fā)展研究院預(yù)測(cè),未來三年智能語音市場將保持25%以上的增速,到2021年預(yù)計(jì)達(dá)到194.8億元。
例如,在智能家居方面,語音聲控的應(yīng)用增強(qiáng)了終端設(shè)備控制家居的簡便性、易用性、互動(dòng)性和娛樂性。目前,眾多參與者以智能音箱作為智能家居語音交互的切入口。例如接入阿里智能家居平臺(tái)的天貓精靈、提供智能家居控制入口的小度音箱、連接小米智能家居生態(tài)的小愛智能音箱等等。
再如,在智能車載方面,從安全因素考慮,車載智能語音應(yīng)用將是未來市場的剛需場景,如媒體娛樂、行車導(dǎo)航、信息查詢、即時(shí)通訊等等。2016年11月,科大訊飛發(fā)布智能車載系統(tǒng)飛魚助理,并于2017年11月發(fā)布2.0版本,該系統(tǒng)通過對(duì)語音引擎、生態(tài)引擎、云+端服務(wù)進(jìn)行深度整合,并賦予智能人機(jī)交互方式,來為用戶提供人臉識(shí)別、AI虛擬助手、聲源定位、非全時(shí)免喚醒+上下文理解、自定義喚醒詞、XTTS等功能。
另外,在隨身設(shè)備方面,隨著設(shè)備功能的多元化,人們迫切需求擺脫傳統(tǒng)輸入設(shè)備的束縛,以智能手機(jī)為例,有關(guān)數(shù)據(jù)顯示,到2023年智能手機(jī)配備語音交互功能的比例將達(dá)到90%以上。并且據(jù)IDC預(yù)測(cè),到2020年隨身設(shè)備的智能語音滲透率將達(dá)到68%。可見,智能語音擁有豐富的應(yīng)用場景,滲透率也會(huì)不斷提高。
圖:2020年智能語音滲透率預(yù)測(cè)

數(shù)據(jù)來源:IDC
創(chuàng)業(yè)及資本漸趨理性
智能語音市場參與者主要為科技巨頭及傳統(tǒng)智能語音企業(yè),行業(yè)集中度較高。科技巨頭在語音行業(yè)的布局多為對(duì)外開放語音生態(tài)系統(tǒng),對(duì)內(nèi)則在自身產(chǎn)品中實(shí)現(xiàn)AI First。例如,百度Dueros開放平臺(tái)、阿里AliGenie開發(fā)者平臺(tái)、騰訊的智能語音平臺(tái)騰訊云小微等等。傳統(tǒng)智能語音企業(yè)已在語音行業(yè)深耕多年,1999年成立的科大訊飛市場占有率已然位列第一,除了面向教育、司法、醫(yī)療、城市等領(lǐng)域推出智能語音解決方案以外,還向硬件方面拓展,推出了翻譯機(jī)、學(xué)習(xí)機(jī)、錄音筆等相關(guān)產(chǎn)品。
此外,科技巨頭和傳統(tǒng)智能語音企業(yè)出于構(gòu)建生態(tài)、積累數(shù)據(jù)等方面的考慮,大都提供開放平臺(tái),而初創(chuàng)企業(yè)則可以借此發(fā)揮后發(fā)優(yōu)勢(shì)。雖然頭部企業(yè)已經(jīng)處于絕對(duì)優(yōu)勢(shì),但隨著應(yīng)用場景的豐富,行業(yè)機(jī)會(huì)仍不斷涌現(xiàn),智能語音初創(chuàng)企業(yè)也吸引了資本市場的關(guān)注。據(jù)<華秋創(chuàng)服>不完全統(tǒng)計(jì),2000-2019年,共有55家智能語音方案企業(yè)獲得融資,共計(jì)157筆,平均成立1.7年后獲得第一筆融資,獲投企業(yè)主要分布在北京、廣東、上海等地;從時(shí)間分布來看,2015年開始進(jìn)入融資高峰期,2019年有所下降,一定程度上反映了智能語音企業(yè)的創(chuàng)業(yè)熱潮正逐漸趨于理性,市場也越來越重視企業(yè)的核心技術(shù)和落地能力。
圖:2000-2019年智能語音方案企業(yè)獲投筆數(shù)

數(shù)據(jù)來源:華秋創(chuàng)服
圖:2000-2019年獲投智能語音方案企業(yè)地區(qū)分布

數(shù)據(jù)來源:華秋創(chuàng)服
市場前景廣闊 技術(shù)仍待突破
IDC數(shù)據(jù)顯示,智能語音在我國人工智能市場中的份額占有22%的比重。場景應(yīng)用的普遍化,促使整個(gè)行業(yè)開始從發(fā)展初期向成熟期邁進(jìn)。雖然科大訊飛、百度等占據(jù)了市場近七成的份額,但是,隨著應(yīng)用場景的拓寬,整個(gè)市場規(guī)模仍會(huì)不斷擴(kuò)大。
不可否認(rèn)的是,雖然智能語音技術(shù)飛速發(fā)展,但在實(shí)際應(yīng)用環(huán)境中,語音信號(hào)往往伴隨著環(huán)境噪聲和混響,使得語音識(shí)別的性能急劇下降。例如,訊飛中英文語音識(shí)別準(zhǔn)確率分別達(dá)到98%和95%,但在有方言、噪音、口音和遠(yuǎn)場情況下,提高語音識(shí)別準(zhǔn)確率仍有較大的提升空間。再如機(jī)器翻譯,雖然實(shí)時(shí)高效,但距離會(huì)議同傳以及高水平翻譯所講究的“信、達(dá)、雅”仍存在較大差距??梢?,雖然語音識(shí)別等某一技術(shù)環(huán)節(jié)已經(jīng)取得較大發(fā)展,但面對(duì)應(yīng)用場景的復(fù)雜性,智能語音技術(shù)仍有待突破。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
智能語音
+關(guān)注
關(guān)注
11文章
829瀏覽量
50354
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
語音識(shí)別芯片到底是怎么工作的?一篇講透核心技術(shù)原理與國產(chǎn)選型指南
你有沒有好奇過:喊一聲“打開空調(diào)”,空調(diào)怎么就“聽懂”了你的話?智能門鎖憑什么能靠一句“開門”就解鎖?這些看似簡單的語音交互背后,其實(shí)都藏著一顆核心技術(shù)元件——語音識(shí)別芯片。它究竟是如
廣州唯創(chuàng)電子單片機(jī)語音芯片:智能設(shè)備的聲音靈魂與技術(shù)核心
一、揭開單片機(jī)語音芯片的神秘面紗1.從基礎(chǔ)概念認(rèn)識(shí)核心技術(shù)在智能化設(shè)備普及的今天,單片機(jī)語音芯片已成為人機(jī)交互的重要橋梁。要理解這一技術(shù),首
藍(lán)牙室內(nèi)定位核心技術(shù)解析:RSSI 與 AOA 的測(cè)距原理對(duì)比與精度升級(jí)邏輯
本文解析藍(lán)牙室內(nèi)定位核心技術(shù),對(duì)比RSSI與AOA的測(cè)距原理,深入探討從RSSI到AOA在精度、誤差控制和硬件適配方面的升級(jí)邏輯,揭示兩者如何互補(bǔ)滿足不同場景需求。
廣州唯創(chuàng)電子WTK6900H-24SS語音識(shí)別芯片:智能語音控制賦能臺(tái)燈創(chuàng)新應(yīng)用 | 語音IC廠家
在智能家居快速發(fā)展的今天,語音交互技術(shù)正在深刻改變?nèi)藗兣c家居設(shè)備的互動(dòng)方式。臺(tái)燈作為日常生活中不可或缺的照明工具,其智能化升級(jí)已成為行業(yè)發(fā)展
廣州唯創(chuàng)電子WTK6900H-32N語音識(shí)別芯片:智能語音控制賦能LED燈帶創(chuàng)新應(yīng)用 | 語音IC廠家
芯片,憑借其卓越的性能和精準(zhǔn)的識(shí)別能力,在LED燈帶控制領(lǐng)域展現(xiàn)出強(qiáng)大的應(yīng)用價(jià)值,為智能照明系統(tǒng)帶來了革命性的創(chuàng)新突破。一、核心技術(shù)優(yōu)勢(shì)1.1高性能語音識(shí)別引擎WT
廣州唯創(chuàng)電子WT2003HX語音芯片:無縫循環(huán)播放功能賦能智能加濕器睡眠儀 | 語音IC廠家
系列MP3音頻芯片以其突破性的無縫循環(huán)播放技術(shù),為加濕器睡眠儀帶來了革命性的音頻體驗(yàn)升級(jí),重新定義了智能睡眠設(shè)備的性能標(biāo)準(zhǔn)。一、核心技術(shù)突破1.1無縫循環(huán)播放
語音機(jī)器人交互系統(tǒng):核心技術(shù)與應(yīng)用挑戰(zhàn)
? ? ? 語音機(jī)器人交互系統(tǒng)是融合多學(xué)科技術(shù)的復(fù)雜工程,其核心目標(biāo)是實(shí)現(xiàn)人與機(jī)器間的自然、流暢語音對(duì)話。該系統(tǒng)已廣泛應(yīng)用于智能客服、
廣州唯創(chuàng)電子語音芯片的工作原理與應(yīng)用解析
隨著人工智能與物聯(lián)網(wǎng)技術(shù)的深度融合,語音技術(shù)已成為智能設(shè)備交互的核心方式之一。作為國內(nèi)
廣州唯創(chuàng)電子WTN6/WTV系列語音芯片:賦能凈水機(jī)智能升級(jí)新體驗(yàn)
新體驗(yàn)。一、智能語音交互:重塑凈水機(jī)人機(jī)交互體驗(yàn)唯創(chuàng)電子語音芯片通過深度集成,為凈水機(jī)帶來三大核心智能化功能
【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】+混合專家
感謝電子發(fā)燒友提供學(xué)習(xí)Deepseek核心技術(shù)這本書的機(jī)會(huì)。
讀完《Deepseek核心技術(shù)揭秘》,我深受觸動(dòng),對(duì)人工智能領(lǐng)域有了全新的認(rèn)識(shí)。了解Deepseek-R1 、Deepseek-V3
發(fā)表于 07-22 22:14
廣州唯創(chuàng)電子語音芯片IC:驅(qū)動(dòng)餐廳呼叫器智能升級(jí),打造高效服務(wù)新體驗(yàn)
及WTN6040F系列語音芯片,憑借其卓越的靈活性與強(qiáng)大功能,正成為智能餐廳呼叫器升級(jí)的核心引擎,為行業(yè)注入全新活力。一、智能
語音芯片如何賦能洗地機(jī)智能升級(jí):唯創(chuàng)關(guān)鍵技術(shù)實(shí)現(xiàn)與應(yīng)用生態(tài)解析
隨著智能家居技術(shù)的快速發(fā)展,洗地機(jī)作為現(xiàn)代清潔工具的核心品類,正通過語音交互技術(shù)的深度融合實(shí)現(xiàn)產(chǎn)品形態(tài)的全面
芯資訊|廣州唯創(chuàng)電子WTK6900P語音識(shí)別芯片:離線語音交互的革新者
智能家電、工業(yè)控制、消費(fèi)電子等領(lǐng)域提供了低門檻、高可靠性的語音交互解決方案。以下從核心技術(shù)、性能優(yōu)勢(shì)及行業(yè)應(yīng)用三個(gè)層面,深度解析其核心競爭力。一、核
芯資訊|廣州唯創(chuàng)電子WTV系列語音芯片:以技術(shù)創(chuàng)新賦能智能語音交互
,WTV-380與WTV-890兩款語音芯片憑借其超長內(nèi)置音頻時(shí)長和出色的性能表現(xiàn),成為工業(yè)控制、智能家電、公共服務(wù)等領(lǐng)域的明星產(chǎn)品。一、核心技術(shù):突破存儲(chǔ)限制,滿足多樣
芯知識(shí)|廣州唯創(chuàng)電子藍(lán)牙語音芯片IC射頻設(shè)計(jì)核心技術(shù)解析
一、藍(lán)牙射頻電路設(shè)計(jì)的核心價(jià)值在智能穿戴、智能家居等物聯(lián)網(wǎng)設(shè)備中,射頻性能直接決定通信質(zhì)量與用戶體驗(yàn)。廣州唯創(chuàng)電子WT2605C等藍(lán)牙語音芯
智能語音創(chuàng)投趨緩 核心技術(shù)仍需升級(jí)
評(píng)論