日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌擬用WaveNetEQ技術(shù)提高Duo的通話質(zhì)量 可自動(dòng)判斷且替換丟失的音頻數(shù)據(jù)

工程師鄧生 ? 來源:雷鋒網(wǎng) ? 作者:雷鋒網(wǎng) ? 2020-04-08 16:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著 4G、5G通信技術(shù)發(fā)展,網(wǎng)絡(luò)通話越來越盛行。但是網(wǎng)絡(luò)不穩(wěn)定是常態(tài),所以通話中我們時(shí)不時(shí)可能會(huì)蹦出一句,“你能再重復(fù)一遍嗎,剛剛網(wǎng)絡(luò)不太好?!睘榱颂?a href="http://m.sdkjxy.cn/tags/高通/" target="_blank">高通話質(zhì)量,谷歌近期在視頻聊天應(yīng)用 Duo 中應(yīng)用了一種新技術(shù) WaveNetEQ ,在出現(xiàn)音頻丟包情況時(shí),該技術(shù)會(huì)判斷丟失的音頻數(shù)據(jù)可能是什么,并替換掉它。

背后的技術(shù)支持來自谷歌聲名在外的 DeepMind 團(tuán)隊(duì)。

一個(gè)完整的在線呼叫,數(shù)據(jù)經(jīng)常會(huì)被分成多個(gè)小塊,每小塊就是一個(gè)數(shù)據(jù)包 packet 。然而,在這些“數(shù)據(jù)包”從發(fā)送方傳輸?shù)浇邮辗降倪^程中,數(shù)據(jù)包通常會(huì)以錯(cuò)誤的順序到達(dá),從而產(chǎn)生抖動(dòng)相關(guān)問題,或者直接丟失,造成音頻空白。

谷歌給出一份資料顯示, Duo 99% 的通話都有數(shù)據(jù)包丟失、過度抖動(dòng)或網(wǎng)絡(luò)延遲情況。20% 的通話丟失了超過 3% 的音頻,10% 的通話丟包率超過 8% ,也就是說每次通話都有很多音頻需要替換。

每個(gè)視音頻 app 都會(huì)用某種方式處理丟包。谷歌表示,這些數(shù)據(jù)包丟失隱藏 (PLC) 過程可能很難更好地填補(bǔ) 60 毫秒或更長時(shí)間的空白。過去常用算法是 NetEQ ,這是 webRTC 中音頻技術(shù)方面的兩大核心技術(shù)之一(另一核心技術(shù)是音頻的前后處理,包括AEC、ANS、AGC等)。webRTC 是谷歌收購 GIPS 再開源的,是目前影響力極大的實(shí)時(shí)音視頻通信解決方案,但用它處理丟包,大多情況下聽起來像機(jī)器人機(jī)械重復(fù)。

谷歌就用了大量的語音數(shù)據(jù),訓(xùn)練出了基于 DeepMind WaveRNN 技術(shù)的 WaveNetEQ 模型。訓(xùn)練數(shù)據(jù)集來自 100 多名、48 種不同語言的志愿者,也就是說它可以自動(dòng)填補(bǔ) 48 種語言的丟包情況。

WaveNetEQ 是一種用于語音合成的遞歸神經(jīng)網(wǎng)絡(luò)模型,由兩部分組成,即自回歸網(wǎng)絡(luò)(autoregressive network)和條件網(wǎng)絡(luò)(conditioning network)。自回歸網(wǎng)絡(luò)的作用是保持信號(hào)的平穩(wěn)流動(dòng),而條件網(wǎng)絡(luò)控制和影響自回歸網(wǎng)絡(luò)以保持音頻一致性。

谷歌用 WaveNetEQ 取代了原來的 NetEQ PLC 組件,相對于 NetEQ ,它在聲音質(zhì)感方面無疑有提升,而且 WaveNetEQ 模型跑得足夠快,可以在手機(jī)上運(yùn)行,如此也可以規(guī)避用戶可能擔(dān)心的數(shù)據(jù)隱私問題。谷歌稱所有的處理都是在設(shè)備上進(jìn)行,因?yàn)?Duo 的通話默認(rèn)情況下就是端到端加密。一旦通話的真實(shí)音頻恢復(fù),將無縫地切換到現(xiàn)實(shí)對話。

不過,WaveNetEQ 替換的內(nèi)容和時(shí)長有限制。目前是支持在 120 毫秒以內(nèi)的空白,之后會(huì)逐漸消失并歸零;WaveNetEQ 不是生成完整的單詞,而是簡單的音節(jié)。

目前 WaveNetEQ 已經(jīng)應(yīng)用到 Pixel 4 手機(jī)上的 Duo APP 中,谷歌表示,它正在將其推廣到其他安卓手機(jī)上。

當(dāng)然用機(jī)器學(xué)習(xí)處理音頻丟包并不是頭一遭,許多公司都在研究相關(guān)技術(shù),以國內(nèi)公司為例,有些是自身業(yè)務(wù)本就涉及視音頻,比如騰訊;有些是音視頻云服務(wù)商,比如阿里,還有一些是專門的音視頻第三方服務(wù)商如聲網(wǎng)等。
責(zé)任編輯:wv

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6259

    瀏覽量

    112002
  • 通話
    +關(guān)注

    關(guān)注

    0

    文章

    31

    瀏覽量

    9857
  • DeepMind
    +關(guān)注

    關(guān)注

    0

    文章

    131

    瀏覽量

    12440
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    TLV320DAC23立體聲音頻數(shù)模轉(zhuǎn)換器:高性能音頻解決方案

    TLV320DAC23立體聲音頻數(shù)模轉(zhuǎn)換器:高性能音頻解決方案 在當(dāng)今數(shù)字化音頻的時(shí)代,一款優(yōu)秀的音頻數(shù)模轉(zhuǎn)換器(DAC)對于實(shí)現(xiàn)高質(zhì)量
    的頭像 發(fā)表于 04-24 18:15 ?1055次閱讀

    PCM1744立體聲音頻數(shù)模轉(zhuǎn)換器:特性、應(yīng)用與設(shè)計(jì)要點(diǎn)

    PCM1744立體聲音頻數(shù)模轉(zhuǎn)換器:特性、應(yīng)用與設(shè)計(jì)要點(diǎn) 在音頻處理領(lǐng)域,數(shù)模轉(zhuǎn)換器(DAC)扮演著至關(guān)重要的角色,它將數(shù)字音頻信號(hào)轉(zhuǎn)換為模擬音頻信號(hào),直接影響著
    的頭像 發(fā)表于 04-22 13:05 ?168次閱讀

    德州儀器PCM1723立體聲音頻數(shù)模轉(zhuǎn)換器:技術(shù)解析與應(yīng)用指南

    德州儀器PCM1723立體聲音頻數(shù)模轉(zhuǎn)換器:技術(shù)解析與應(yīng)用指南 在音頻處理領(lǐng)域,數(shù)模轉(zhuǎn)換器(DAC)是至關(guān)重要的組件,它直接影響著音頻信號(hào)的質(zhì)量
    的頭像 發(fā)表于 04-22 12:20 ?190次閱讀

    PCM1710U立體聲音頻數(shù)模轉(zhuǎn)換器:技術(shù)剖析與應(yīng)用指南

    PCM1710U立體聲音頻數(shù)模轉(zhuǎn)換器:技術(shù)剖析與應(yīng)用指南 在音頻處理領(lǐng)域,數(shù)模轉(zhuǎn)換器(DAC)扮演著至關(guān)重要的角色,它將數(shù)字音頻信號(hào)轉(zhuǎn)換為模擬音頻
    的頭像 發(fā)表于 04-22 11:50 ?211次閱讀

    深入剖析PCM1604/PCM1605:高性能音頻數(shù)模轉(zhuǎn)換器的技術(shù)解析

    深入剖析PCM1604/PCM1605:高性能音頻數(shù)模轉(zhuǎn)換器的技術(shù)解析 在音頻處理領(lǐng)域,數(shù)模轉(zhuǎn)換器(DAC)的性能直接影響著音頻質(zhì)量。PCM
    的頭像 發(fā)表于 04-22 11:30 ?181次閱讀

    探索DSD1794A:24位音頻數(shù)模轉(zhuǎn)換器的卓越性能與應(yīng)用

    探索DSD1794A:24位音頻數(shù)模轉(zhuǎn)換器的卓越性能與應(yīng)用 在音頻技術(shù)不斷發(fā)展的今天,高質(zhì)量音頻數(shù)模轉(zhuǎn)換器(DAC)對于實(shí)現(xiàn)出色的音質(zhì)至關(guān)
    的頭像 發(fā)表于 04-19 10:15 ?232次閱讀

    探索DSD1791:高性能24位音頻數(shù)模轉(zhuǎn)換器的技術(shù)奧秘

    探索DSD1791:高性能24位音頻數(shù)模轉(zhuǎn)換器的技術(shù)奧秘 在音頻技術(shù)的不斷發(fā)展中,數(shù)模轉(zhuǎn)換器(DAC)作為連接數(shù)字音頻世界和模擬
    的頭像 發(fā)表于 04-19 09:55 ?162次閱讀

    探索DSD1792:24位高性能音頻數(shù)模轉(zhuǎn)換器

    探索DSD1792:24位高性能音頻數(shù)模轉(zhuǎn)換器 在音頻技術(shù)不斷發(fā)展的今天,數(shù)模轉(zhuǎn)換器(DAC)作為連接數(shù)字音頻世界和模擬音頻世界的橋梁,其性
    的頭像 發(fā)表于 04-19 09:50 ?180次閱讀

    DSD1792A:24位音頻數(shù)模轉(zhuǎn)換器的卓越之選

    DSD1792A:24位音頻數(shù)模轉(zhuǎn)換器的卓越之選 在音頻處理領(lǐng)域,高質(zhì)量的數(shù)模轉(zhuǎn)換器(DAC)對于實(shí)現(xiàn)出色的音頻性能至關(guān)重要。今天,我們將深入探討德州儀器(Texas Instrume
    的頭像 發(fā)表于 04-19 09:50 ?165次閱讀

    解析DSD1702:一款多功能音頻數(shù)模轉(zhuǎn)換器

    ,它同時(shí)支持脈沖編碼調(diào)制(PCM)音頻數(shù)據(jù)格式和直接流數(shù)字(DSD)音頻數(shù)據(jù)格式。這使得它在音頻處理方面
    的頭像 發(fā)表于 04-19 09:50 ?155次閱讀

    使用 APx500 軟件檢測音頻毛刺與信號(hào)丟失

    在數(shù)字音頻播放系統(tǒng)中,音頻毛刺和信號(hào)丟失無疑是最令人困擾的問題之一。當(dāng)一個(gè)設(shè)備丟失一個(gè)采樣點(diǎn)時(shí),這意味著什么?這意味著一個(gè)采樣點(diǎn)被跳過,從那一刻起,整個(gè)波形在時(shí)間上向左平移了一個(gè)采樣瞬
    的頭像 發(fā)表于 10-20 09:02 ?815次閱讀
    使用 APx500 軟件檢測<b class='flag-5'>音頻</b>毛刺與信號(hào)<b class='flag-5'>丟失</b>

    即時(shí)通話軟件音頻傳輸質(zhì)量測試方案介紹

    傳輸質(zhì)量。即時(shí)通話軟件基于移動(dòng)網(wǎng)絡(luò)鏈路傳輸信號(hào),通過本套測試方案中配套的網(wǎng)絡(luò)損傷仿真設(shè)備對傳輸鏈路添加不同的網(wǎng)絡(luò)影響,模擬軟件在不同網(wǎng)絡(luò)環(huán)境下的使用情況,進(jìn)而測得更接近真實(shí)應(yīng)用場景下的音頻傳輸
    的頭像 發(fā)表于 08-10 15:21 ?3794次閱讀
    即時(shí)<b class='flag-5'>通話</b>軟件<b class='flag-5'>音頻</b>傳輸<b class='flag-5'>質(zhì)量</b>測試方案介紹

    解鎖高品質(zhì)音頻體驗(yàn):探索音頻質(zhì)量評估與測試的科學(xué)之道

    一、引言在數(shù)字化浪潮席卷的今天,音頻質(zhì)量直接影響著從VoIP通話、視頻會(huì)議到智能音箱等應(yīng)用的沉浸式體驗(yàn)。音頻質(zhì)量評估與測試,不僅是電信、廣播
    發(fā)表于 07-22 11:15

    如何通過I2S使用CYW4373 HFP音頻數(shù)據(jù)

    請教我使用 CYW4373 通過 I2S 使用 HFP 音頻數(shù)據(jù)所需的步驟和供應(yīng)商特定命令。 配對完成,SCO 已連接,數(shù)據(jù)正在通過 I2S 發(fā)送,但Bluetooth?耳機(jī)沒有音頻輸出。此外
    發(fā)表于 07-17 07:43

    LE-Audio是什么?

    音頻編解碼、音頻數(shù)據(jù)傳輸和音頻控制方面進(jìn)行了優(yōu)化。與傳統(tǒng)藍(lán)牙音頻相比,LE-Audio通過采用更高效的編碼算法和改進(jìn)的數(shù)據(jù)壓縮
    發(fā)表于 06-28 21:32
    黎平县| 乐山市| 衢州市| 若尔盖县| 轮台县| 绥江县| 黄山市| 昌邑市| 澎湖县| 财经| 黔江区| 赫章县| 深泽县| 乐清市| 博爱县| 潮安县| 临澧县| 旺苍县| 连州市| 平舆县| 五莲县| 二手房| 临沭县| 涿鹿县| 沙洋县| 汝州市| 肃南| 祁阳县| 年辖:市辖区| 晋江市| 聂拉木县| 三门县| 桃园市| 金寨县| 公安县| 揭西县| 舞钢市| 凉城县| 青冈县| 木兰县| 龙海市|