日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何使用音頻來估計與講話用戶之間的距離,并識別周圍的聲音

倩倩 ? 來源:百度粉絲網(wǎng) ? 作者:百度粉絲網(wǎng) ? 2021-01-22 16:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最新研究表明,蘋果公司正在研究HomePod或其他設(shè)備如何使用音頻來估計與講話用戶之間的距離,并識別周圍的聲音。

Apple的HomePod已經(jīng)非常擅長于聽到您的聲音,即使它正在大聲播放音樂。蘋果公司有兩項(xiàng)單獨(dú)的新專利申請表明,蘋果公司希望將其改進(jìn),并將設(shè)備的聆聽能力提高到一個新水平。

其中之一,“基于學(xué)習(xí)的距離估計”,不僅涉及使用音頻來識別用戶,而且要弄清楚他們在哪里。

專利申請說:“通常希望設(shè)備使用[其]緊湊型麥克風(fēng)陣列來估算從設(shè)備到用戶的距離?!?“例如,該設(shè)備可以基于用戶到該設(shè)備的估計距離來調(diào)整播放音量或來自智能輔助設(shè)備的響應(yīng)?!?/p>

繼續(xù)說:“因此,如果用戶離設(shè)備非常近,則不會大量播放音樂或語音?!?或者,如果用戶離得很遠(yuǎn),則可以將媒體播放或來自智能助手設(shè)備的響應(yīng)調(diào)整為更大的音量?!?/p>

同樣的想法也意味著將其引入蘋果公司目前令人印象深刻但有些瑕疵的系統(tǒng),在該系統(tǒng)中,所有設(shè)備都會嘗試確定您對“嘿,Siri”說的是什么。

蘋果公司說:“在有多個設(shè)備的應(yīng)用程序中,這些設(shè)備可以在彼此之間進(jìn)行協(xié)調(diào)或仲裁,以根據(jù)從每個設(shè)備到用戶的距離來決定應(yīng)回答一個或多個設(shè)備的查詢。”

蘋果公司提出了簡單和更復(fù)雜的解決方案,它們都可以同時使用。更簡單的方法是讓設(shè)備先執(zhí)行HomePod的工作并首先繪制其環(huán)境圖。

然后,它實(shí)際上具有“在聲學(xué)環(huán)境中的測量點(diǎn)或模擬點(diǎn)的網(wǎng)格”。在這種情況下,可以將聲音與此“網(wǎng)格”進(jìn)行比較,以大致了解說話者所在的位置。

但是,Apple認(rèn)為這本身并不足夠好,并且還說它與Siri最少一起使用。那是因?yàn)橐粋€人說話時可能會動彈,而且他們要求快速回應(yīng)-此提議不適合。

備選地,然后,“如果至少兩個麥克風(fēng)陣列可用”,則“可以使用三角測量方法來估計語音源的距離”。

但是,這里的關(guān)鍵部分是至少需要兩個帶麥克風(fēng)的設(shè)備。因此,Apple提供了另一個涉及更多的解決方案,其中涉及“基于學(xué)習(xí)的系統(tǒng),如深度神經(jīng)網(wǎng)絡(luò)(DNN)”,并且不需要多個設(shè)備。

專利申請說:“深度學(xué)習(xí)系統(tǒng)可以根據(jù)緊湊型麥克風(fēng)陣列接收到的語音信號來估計每個時間幀的語音源距離。”

這個DNN系統(tǒng)可以做的是確定什么是語音,什么是背景噪聲。然后,它可以計算“有關(guān)直接信號傳播的信息”以及“混響效果和噪聲”。

該申請歸功于三位發(fā)明者,包括Mehrez Souden和Joshua D. Atkins。他們先前的相關(guān)工作包括已獲專利的如何使用比普通麥克風(fēng)少的聲音來錄制完整空間聲音的專利。

這特別涉及Apple AR中的音頻,該最新專利申請涉及真實(shí)環(huán)境中的物理設(shè)備。但是,如果只是為了避免用太大聲的HomePod mini炸毀別人的耳朵而感到很麻煩,那還有很多事情要做。

該專利申請說:“例如,助聽器之類的輔助和增強(qiáng)型助聽器可以根據(jù)語音源的距離來增強(qiáng)音頻信號?!?/p>

這也是第二個新公開的專利申請重點(diǎn)關(guān)注的內(nèi)容。

識別重要的聲音

“基于觀察到的聲音識別聲源的系統(tǒng)和方法”,是關(guān)于讓一些設(shè)備識別其他聲音并為我們做出反應(yīng)。

“許多家用電器,例如微波爐,洗衣機(jī),洗碗機(jī)和門鈴,會發(fā)出聲音來提醒用戶該器具的狀況已經(jīng)改變,”該專利申請開始。

它繼續(xù)說:“但是,由于各種原因,用戶可能無法聽到家用電器發(fā)出的聲音警報。” “例如,用戶可能有聽力障礙,用戶可能在外面或在另一個房間里,或者設(shè)備可能發(fā)出被家庭聲學(xué)場景遮擋的聲音?!?/p>

也不必是您的煮蛋計時器關(guān)閉。該專利同樣涉及“公共場所(政府大樓),半公共場所(辦公室大廳)和私人場所(住宅或辦公大樓)”中的聲音。

它說:“(這些)也有聲學(xué)場景,可以包含帶有信息的聲音。” “例如,鈴,鈴或蜂鳴器可能指示門已經(jīng)打開或關(guān)閉,或者警報器可能發(fā)出警報聲或其他聲音,警告附近的人有危險(例如,煙,火或一氧化碳)?!?/p>

總體而言,該專利申請主要詳述了可以“訓(xùn)練”設(shè)備以識別“常見聲音”的方法。然后,它將繼續(xù)偵聽其中的任何一個,并且當(dāng)聽到一個聲音時,可以發(fā)出“響應(yīng)于確定聲音存在于聲學(xué)場景中的選定輸出”。

換句話說,如果是您的煮蛋計時器關(guān)閉,則該設(shè)備可能會使您的Apple Watch在手腕上輕按?;蛘?,如果是防盜警報,則該設(shè)備可以通知當(dāng)局。

蘋果公司表示:“聲音中包含大量的上下文信息?!?“識別常見的聲音可以使電子設(shè)備響應(yīng)于觀察到的環(huán)境(例如,根據(jù)觀察到的聲音確定)來適應(yīng)其行為或提供服務(wù),從而增加它們對用戶的相關(guān)性和價值,同時需要更少的用戶幫助或輸入?!?/p>

第二項(xiàng)專利申請歸功于包括丹尼爾·克林格(Daniel C. Klinger)在內(nèi)的四位發(fā)明家。他先前的工作包括一項(xiàng)專利申請,該專利用于通過HomePod或其他設(shè)備進(jìn)行安全的電話呼叫。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 音頻
    +關(guān)注

    關(guān)注

    31

    文章

    3236

    瀏覽量

    86455
  • 蘋果公司
    +關(guān)注

    關(guān)注

    2

    文章

    449

    瀏覽量

    24215
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5612

    瀏覽量

    124697
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    TLV320DAC26:高性能立體聲音頻DAC的深度解析

    TLV320DAC26:高性能立體聲音頻DAC的深度解析 在當(dāng)今的便攜式計算、通信和娛樂設(shè)備中,高質(zhì)量的音頻體驗(yàn)是用戶的核心需求之一。TI的TLV320DAC26作為一款高度集成的立體聲音頻
    的頭像 發(fā)表于 04-23 13:05 ?175次閱讀

    TI PCM270xC系列立體聲音頻DAC:USB音頻解決方案的理想之選

    TI PCM270xC系列立體聲音頻DAC:USB音頻解決方案的理想之選 在當(dāng)今數(shù)字化音頻的時代,對于高品質(zhì)、便捷的音頻解決方案的需求日益增長。TI(德州儀器)推出的PCM2704C
    的頭像 發(fā)表于 04-22 14:55 ?344次閱讀

    PCM1744立體聲音頻數(shù)模轉(zhuǎn)換器:特性、應(yīng)用與設(shè)計要點(diǎn)

    PCM1744立體聲音頻數(shù)模轉(zhuǎn)換器:特性、應(yīng)用與設(shè)計要點(diǎn) 在音頻處理領(lǐng)域,數(shù)模轉(zhuǎn)換器(DAC)扮演著至關(guān)重要的角色,它將數(shù)字音頻信號轉(zhuǎn)換為模擬音頻信號,直接影響著
    的頭像 發(fā)表于 04-22 13:05 ?198次閱讀

    低成本立體聲音頻DAC——PCM1733的技術(shù)解析與應(yīng)用指南

    低成本立體聲音頻DAC——PCM1733的技術(shù)解析與應(yīng)用指南 在音頻設(shè)備的設(shè)計中,數(shù)模轉(zhuǎn)換器(DAC)是實(shí)現(xiàn)數(shù)字音頻信號到模擬音頻信號轉(zhuǎn)換的關(guān)鍵組件。PCM1733作為一款低成本立體
    的頭像 發(fā)表于 04-22 12:40 ?200次閱讀

    深入解析PCM1733立體聲音頻數(shù)模轉(zhuǎn)換器

    深入解析PCM1733立體聲音頻數(shù)模轉(zhuǎn)換器 在音頻處理領(lǐng)域,數(shù)模轉(zhuǎn)換器(DAC)是實(shí)現(xiàn)數(shù)字音頻信號到模擬音頻信號轉(zhuǎn)換的關(guān)鍵器件。今天我們
    的頭像 發(fā)表于 04-22 12:40 ?197次閱讀

    PCM1718E立體聲音頻數(shù)模轉(zhuǎn)換器:技術(shù)剖析與應(yīng)用指南

    等特點(diǎn),在消費(fèi)類音頻應(yīng)用中得到了廣泛的應(yīng)用。本文將對PCM1718E進(jìn)行詳細(xì)的技術(shù)剖析,探討其在實(shí)際應(yīng)用中的注意事項(xiàng)。 文件下載: PCM1718E.pdf 一、PCM1718E的特性 1. 輸入兼容性 PCM1718E能夠接受16位或18位I2S數(shù)據(jù)格式,以及18位普
    的頭像 發(fā)表于 04-22 12:15 ?234次閱讀

    AD1871立體聲音頻ADC:高性能音頻轉(zhuǎn)換的理想之選

    AD1871立體聲音頻ADC:高性能音頻轉(zhuǎn)換的理想之選 在音頻處理領(lǐng)域,高性能的模擬 - 數(shù)字轉(zhuǎn)換器(ADC)至關(guān)重要。AD1871作為一款立體聲音頻ADC,專為需要高性能模數(shù)轉(zhuǎn)換的數(shù)
    的頭像 發(fā)表于 04-02 09:20 ?151次閱讀

    探索ROHM BD3884FS音頻聲音處理器:設(shè)計與應(yīng)用指南

    探索ROHM BD3884FS音頻聲音處理器:設(shè)計與應(yīng)用指南 在電視音頻處理領(lǐng)域,ROHM SEMICONDUCTOR的BD3884FS音頻聲音
    的頭像 發(fā)表于 02-28 17:10 ?696次閱讀

    詳解TI的PCM2901/2903立體聲音頻編解碼器

    詳解TI的PCM2901/2903立體聲音頻編解碼器 在音頻設(shè)備領(lǐng)域,一款性能出色且功能豐富的編解碼器是實(shí)現(xiàn)高質(zhì)量音頻處理的關(guān)鍵。今天我們要深入探討德州儀器(TI)的PCM2901和PCM2903
    的頭像 發(fā)表于 02-04 10:30 ?517次閱讀

    TLV320AIC28立體聲音頻編解碼器:高性能音頻解決方案解析

    TLV320AIC28立體聲音頻編解碼器:高性能音頻解決方案解析 在當(dāng)今的電子設(shè)備中,音頻體驗(yàn)是至關(guān)重要的一環(huán)。無論是智能手機(jī)、MP3 播放器還是數(shù)碼攝像機(jī),都需要高質(zhì)量的音頻編解碼器
    的頭像 發(fā)表于 02-03 14:50 ?611次閱讀

    TLV320AIC3262:低功耗立體聲音頻編解碼器的卓越之選

    TLV320AIC3262:低功耗立體聲音頻編解碼器的卓越之選 在當(dāng)今的電子設(shè)備領(lǐng)域,音頻編解碼器的性能和功耗是影響用戶體驗(yàn)和設(shè)備續(xù)航的關(guān)鍵因素。TI推出的TLV320AIC3262低功耗立體
    的頭像 發(fā)表于 01-30 14:40 ?496次閱讀

    TAA5242高性能立體聲音頻ADC深度解析

    TAA5242高性能立體聲音頻ADC深度解析 在音頻處理領(lǐng)域,高性能的模數(shù)轉(zhuǎn)換器(ADC)是實(shí)現(xiàn)高質(zhì)量音頻錄制和處理的關(guān)鍵。今天,我們將深入探討Texas Instruments的TAA5242
    的頭像 發(fā)表于 01-28 16:55 ?537次閱讀

    全新蔚ES8斬獲2025聲學(xué)樓汽車音頻技術(shù)創(chuàng)新大獎

    近期,由“聲學(xué)樓”聯(lián)合多家音頻行業(yè)權(quán)威機(jī)構(gòu)發(fā)起的“汽車音頻技術(shù)創(chuàng)新大獎”獲獎名單公布,全新ES8搭載的蔚天琴8.1.4.2沉浸聲音響系統(tǒng)斬獲年度汽車
    的頭像 發(fā)表于 12-12 17:35 ?2375次閱讀

    解鎖聲音定位新維度,AR-1105 雙數(shù)字麥克風(fēng)陣列板引領(lǐng)音頻感知革命

    AR-1105 是一款性能卓越的雙數(shù)字麥克風(fēng)陣列板,具備 360 度 6 方向聲音識別能力,工作電壓覆蓋 4-6.5V,拾音范圍達(dá) 10-200CM,支持模擬和數(shù)字音頻雙端口輸出。它可
    的頭像 發(fā)表于 11-07 09:14 ?1042次閱讀
    解鎖<b class='flag-5'>聲音</b>定位新維度,AR-1105 雙數(shù)字麥克風(fēng)陣列板引領(lǐng)<b class='flag-5'>音頻</b>感知革命

    【上海晶珩睿莓1開發(fā)板試用體驗(yàn)】GPIO事件監(jiān)控&amp;USB asound聲卡設(shè)備錄入聲音通過云平臺識別

    系統(tǒng)中直接使用命令arecord -f S16_LE -c 1 -r 16000 -d 3 -D hw:1 /home/arecord.wav錄制聲音。 將錄制好的wav文件通過libcurl庫
    發(fā)表于 09-09 18:28
    台南县| 镇巴县| 云和县| 犍为县| 姜堰市| 巢湖市| 额敏县| 陵川县| 黔东| 介休市| 道真| 盐津县| 库车县| 泽州县| 隆子县| 安仁县| 云南省| 乌恰县| 信丰县| 瑞丽市| 常山县| 泰兴市| 仙桃市| 镇江市| 青岛市| 闻喜县| 昂仁县| 页游| 金堂县| 渭源县| 九龙城区| 晋江市| 宁强县| 抚远县| 会宁县| 哈巴河县| 元朗区| 柳江县| 荣成市| 中方县| 绥宁县|