美女久久久免费视频,亚洲人妻系

如今，語音技術(shù)領(lǐng)域的許多最大參與者也是手機(jī)操作系統(tǒng)（OS）市場的重量級(jí)人物。微軟是第一個(gè)建立語音團(tuán)隊(duì)的軟件/移動(dòng)操作系統(tǒng)巨頭。在1990年代早期，比爾·蓋茨（Bill Gates）宣揚(yáng)語音用戶界面（VUI）的好處，并預(yù)測它們將在計(jì)算機(jī)上的人類界面中發(fā)揮作用。谷歌在21世紀(jì)初通過建立一支由語音技術(shù)專家組成的精英團(tuán)隊(duì)而變得咄咄逼人，并通過其Android版本刺激了移動(dòng)行業(yè)向語音界面和語音控制的方向發(fā)展。蘋果一直是用戶體驗(yàn)之王，直到最近，由于準(zhǔn)確性方面的挑戰(zhàn)，蘋果才避免推動(dòng)語音技術(shù)。然而，隨著Siri（一種語音禮賓服務(wù)）的收購以及該公司的技術(shù)融入iPhone 4S，蘋果可能會(huì)通過語音迎來新一代的自然語言用戶體驗(yàn)。

由于各種原因，語音技術(shù)對(duì)移動(dòng)行業(yè)至關(guān)重要，主要是因?yàn)樗却蜃指菀渍f話，而且因?yàn)槭謾C(jī)的外形尺寸是圍繞說話而不是打字而構(gòu)建的。此外，隨著移動(dòng)搜索的巨大收入潛力，移動(dòng)操作系統(tǒng)提供商看到了在其技術(shù)組合中添加語音識(shí)別的價(jià)值。

為什么要嵌入？

VUI 的大部分繁重工作都是在云中完成的。這就是大型操作系統(tǒng)參與者的大部分投資去向的地方。云提供了一個(gè)具有幾乎無限的MIPS和內(nèi)存的環(huán)境 - 這是高級(jí)語音搜索處理的兩個(gè)基本要素。隨著基于云的語音技術(shù)使用的增長，嵌入式領(lǐng)域似乎也出現(xiàn)了類似的趨勢。

嵌入式語音是在無法訪問云時(shí)啟用語音控制和輸入的唯一解決方案，這是增加用戶體驗(yàn)的必要功能。嵌入式語音還具有消耗更少M(fèi)IPS和內(nèi)存的能力，從而提高了設(shè)備電池電量的效率。

客戶端/云語音使用的最佳方案需要在客戶端上激活語音，并在云上繁重地破譯文本和含義。這可以實(shí)現(xiàn)設(shè)備始終打開并始終偵聽的方案，因此可以給出并執(zhí)行語音命令，而無需按客戶端上的按鈕。這種“無需手或眼睛”的范例在汽車中特別有用，出于安全目的和在家中的便利性。

例如，在最近推出的Galaxy SII Android手機(jī)中，三星的語音通話利用Sension的TrueHandsfree語音控制（一種嵌入式語音技術(shù)）來激活帶有“嘿銀河”字樣的手機(jī)。這個(gè)短語調(diào)用了Vlingo基于云的識(shí)別服務(wù)，該服務(wù)允許用戶在不觸摸手機(jī)的情況下發(fā)出命令和輸入文本。

語音識(shí)別可以在具有低至10 MIPS和數(shù)萬字節(jié)內(nèi)存的設(shè)備上實(shí)現(xiàn)。Sensory的語音芯片系列包括基于8位微控制器的RISC單芯片和利用小型嵌入式DSP的自然語言處理器。通常，在語音識(shí)別中投入的MIPS和內(nèi)存越多，產(chǎn)品可以具有的功能就越多（更快的響應(yīng)時(shí)間，更大的詞匯量和更復(fù)雜的語法）。

無論哪個(gè)平臺(tái)執(zhí)行任務(wù)，語音識(shí)別的一般方法都是相似的。多年來，隱馬爾可夫建模和神經(jīng)網(wǎng)絡(luò)等統(tǒng)計(jì)方法一直是語音識(shí)別的主要方法。從客戶端遷移到云允許部署統(tǒng)計(jì)語言建模和更復(fù)雜的技術(shù)。

維伊關(guān)卡

要?jiǎng)?chuàng)建真正免提、免眼的用戶體驗(yàn)，必須解決幾個(gè)技術(shù)階段。

第 1 階段：語音激活

這實(shí)質(zhì)上是取代按鈕按下。識(shí)別器需要始終處于打開狀態(tài)，準(zhǔn)備好將階段 2 調(diào)用到運(yùn)行狀態(tài)，并且能夠在非常嘈雜的情況下激活。第一階段的另一個(gè)關(guān)鍵標(biāo)準(zhǔn)是非常快的響應(yīng)時(shí)間。鑒于超過幾百毫秒的延遲可能會(huì)產(chǎn)生由用戶在識(shí)別器偵聽之前與階段 2 交談而導(dǎo)致的準(zhǔn)確性問題，因此語音激活的響應(yīng)時(shí)間必須與按鈕的響應(yīng)時(shí)間相同，這幾乎是瞬時(shí)的。簡單的命令和控制功能可以通過 Stage 1 識(shí)別系統(tǒng)或更復(fù)雜的 Stage 2 系統(tǒng)嵌入到客戶端中，該系統(tǒng)可以嵌入或基于云的。

第 2 階段：語音識(shí)別和轉(zhuǎn)錄

更耗電且功能更強(qiáng)大的 Stage 2 識(shí)別器可將所講的內(nèi)容轉(zhuǎn)換為文本。如果目的是短信或語音撥號(hào)，則該過程可以在此處停止。如果用戶希望回答問題或訪問數(shù)據(jù)，系統(tǒng)將進(jìn)入第 3 階段。由于 Stage 1 識(shí)別器可以響應(yīng)高噪聲，因此它可以降低汽車收音機(jī)或家用 AV 中的音量，以協(xié)助階段 2 識(shí)別。

第 3 階段：意圖和意義

這可能是這一過程中最大的挑戰(zhàn)。文本翻譯準(zhǔn)確，但它是什么意思？例如，互聯(lián)網(wǎng)搜索所需的查詢是什么？今天的“智能”可能會(huì)嘗試修改搜索，以更好地滿足用戶的需求。然而，計(jì)算機(jī)在弄清楚意圖方面非常糟糕。蘋果的Siri智能助手是在國防部資助的CALO項(xiàng)目下開發(fā)的，該項(xiàng)目涉及300多名研究人員，可能是當(dāng)今智能詮釋的最佳典范。

第 4 階段：數(shù)據(jù)搜索和查詢

根據(jù)查詢的不同，搜索數(shù)據(jù)并找到正確的結(jié)果可能很簡單，也可能很復(fù)雜。映射數(shù)據(jù)和方向可能是可靠的，因?yàn)檎Z法很容易理解，并具有地圖搜索的明確目標(biāo)。隨著谷歌和其他搜索提供商在數(shù)據(jù)搜索功能上投入大量資金和時(shí)間，這一階段將繼續(xù)改善。

第 5 階段：語音響應(yīng)

對(duì)查詢的語音響應(yīng)是顯示響應(yīng)的一個(gè)很好的替代方法，這可能會(huì)導(dǎo)致駕駛員將視線從道路上移開或給家中帶來不便。當(dāng)今最先進(jìn)的文本到語音轉(zhuǎn)換系統(tǒng)具有高度的可理解性，并且已經(jīng)發(fā)展到比以前的自動(dòng)語音系統(tǒng)聽起來更自然。

為什么嵌入式識(shí)別器在第 1 階段替換按鈕需要這么長時(shí)間？

語音識(shí)別傳統(tǒng)上需要按鈕激活而不是語音激活。其主要原因是按鈕雖然分散了注意力，但即使在嘈雜的環(huán)境中也是可靠且響應(yīng)迅速的。這些類型的環(huán)境（如汽車或繁忙的家庭）對(duì)語音識(shí)別器來說可能具有挑戰(zhàn)性。聲控詞必須在汽車（車窗關(guān)閉、收音機(jī)打開和道路噪音）或家中（嬰兒哭泣、音樂或電視打開以及電器運(yùn)行）中創(chuàng)建響應(yīng)，而無需用戶為其工作。因此，直到最近，只有當(dāng)用戶處于安靜的環(huán)境中，麥克風(fēng)靠近嘴巴時(shí)，語音技術(shù)才是可靠的。

快速響應(yīng)時(shí)間的要求使這一挑戰(zhàn)進(jìn)一步復(fù)雜化。語音識(shí)別器通常需要數(shù)百毫秒才能確定用戶在開始處理語音之前是否完成了通話。這種時(shí)間延遲可能是可以接受的，從識(shí)別系統(tǒng)產(chǎn)生答案或回復(fù)給消費(fèi)者。但是，在第 1 階段，激活的響應(yīng)是在階段 2 中調(diào)用另一個(gè)更復(fù)雜的識(shí)別器，并且使用者不會(huì)接受持續(xù)時(shí)間遠(yuǎn)遠(yuǎn)超過按下按鈕所花費(fèi)的時(shí)間的延遲。延遲時(shí)間越長，階段 2 發(fā)生識(shí)別失敗的可能性就越大，因?yàn)橛脩艨赡軙?huì)在階段 2 識(shí)別器準(zhǔn)備好收聽之前開始說話。

嵌入式語音技術(shù)的最新進(jìn)展，如Sensory的真無握語音接口，無需觸摸設(shè)備即可提供真正的VUI。這些技術(shù)消除了嘈雜環(huán)境中固有的問題以及較長的響應(yīng)時(shí)間，使語音激活可行，準(zhǔn)確且更方便。

消費(fèi)電子產(chǎn)品中語音的未來

許多年前，電視觀眾不得不站起來走到他們的單位來改變頻道。遙控器的到來結(jié)束了這一切，今天沒有人會(huì)買沒有遙控器的電視。盡管如此，我們?nèi)匀徽酒饋?，走到我們的大多?shù)計(jì)算設(shè)備使用它們。隨著語音識(shí)別的改進(jìn)，這將不再是必需的。

帶有語音觸發(fā)器的免提設(shè)備的快速使用將發(fā)展成為智能設(shè)備，這些設(shè)備可以傾聽我們所說的內(nèi)容，并決定何時(shí)適合從客戶端轉(zhuǎn)到云端。他們還將決定何時(shí)以及如何回應(yīng)，可能會(huì)演變成坐在后臺(tái)傾聽一切并決定何時(shí)提供幫助的助手。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

嵌入式

嵌入式

+關(guān)注

關(guān)注
5210

文章
20692

瀏覽量
337601
Android

Android

+關(guān)注

關(guān)注
12

文章
4035

瀏覽量
134602
計(jì)算機(jī)

計(jì)算機(jī)

+關(guān)注

關(guān)注
19

文章
7843

瀏覽量
93503

日B视频亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

搜索歷史

行動(dòng)端及云端的語音辨識(shí)的成長推動(dòng)嵌入式語音技術(shù)

評(píng)論