日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

應(yīng)用深度學(xué)習(xí)變革傳統(tǒng)語音信號(hào)處理,讓機(jī)器擁有類似人耳一樣的聽覺感知能力

MEMS ? 來源:MEMS ? 2020-09-01 13:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

智能語音是人工智能技術(shù)的重要組成部分,包括聲音前端信號(hào)處理、語音識(shí)別、語義理解、自然語言處理、語音合成等細(xì)分領(lǐng)域。在技術(shù)的具體落地中,消費(fèi)級(jí)智能硬件是最早顯示出市場(chǎng)潛力的賽道,從藍(lán)牙耳機(jī)到可穿戴設(shè)備再到智能家居,各種產(chǎn)品都離不開相關(guān)的智能語音技術(shù),而語音交互的第一步就是聽見,聲音前端信號(hào)處理的效果一定程度上制約了語音識(shí)別的效果,當(dāng)前也有一些公司正在解決這一讓各類產(chǎn)品“聽得更清晰”的問題。

36氪日前接觸到的「大象聲科」,是一家專注于機(jī)器聽覺的人工智能公司。該公司于2017年在深圳成立,致力于應(yīng)用深度學(xué)習(xí)變革傳統(tǒng)語音信號(hào)處理,讓機(jī)器擁有類似人耳一樣的聽覺感知能力。據(jù)了解,「大象聲科」技術(shù)的理論基礎(chǔ)為CASA(計(jì)算機(jī)聽覺場(chǎng)景分析)+DNN(深度神經(jīng)網(wǎng)絡(luò)技術(shù))。CASA 解決的問題是基于人的聽覺原理來實(shí)現(xiàn)聲源分離,該理論的奠基人汪德亮教授也是「大象聲科」的首席科學(xué)家和聯(lián)合創(chuàng)始人。公司通過將CASA和深度學(xué)習(xí)相結(jié)合,在業(yè)內(nèi)首家成功實(shí)現(xiàn)大規(guī)模商用級(jí)的噪音和人聲的分離,后續(xù)有望進(jìn)一步解決雞尾酒會(huì)問題。(注:雞尾酒會(huì)問題是語音識(shí)別領(lǐng)域的痛點(diǎn)和難點(diǎn),人們?cè)陔u尾酒會(huì)中交談,語音信號(hào)會(huì)重疊在一起,機(jī)器需要將它們分離成獨(dú)立的信號(hào))

公司創(chuàng)始人兼CEO苗健彰向記者對(duì)比了傳統(tǒng)信號(hào)處理和基于深度學(xué)習(xí)的信號(hào)處理方式的差別——傳統(tǒng)的數(shù)字信號(hào)處理方式主要依據(jù)固定噪音特性和方向,通過濾波器對(duì)信號(hào)進(jìn)行相應(yīng)的過濾和增強(qiáng)。但因?yàn)樯钪械脑胍舨灰欢ù嬖诠潭ㄌ匦?,并可能來自于各種方向反射,所以傳統(tǒng)方式或許無法徹底解決復(fù)雜噪聲環(huán)境中的問題。而CASA+DNN的方案是讓機(jī)器通過訓(xùn)練獲得與人類聽覺感知相似的機(jī)制,從而去認(rèn)知周邊的聲場(chǎng)環(huán)境,在復(fù)雜場(chǎng)景中提取、識(shí)別人聲。

在技術(shù)產(chǎn)業(yè)化這一塊,「大象聲科」首先從“降噪”切入,一方面解決通訊過程中的噪音干擾問題,讓人們?cè)趶?fù)雜的現(xiàn)實(shí)噪聲場(chǎng)景中擁有更加清晰、更加私密的通話體驗(yàn);另一方面解決語音識(shí)別中噪聲干擾問題,讓機(jī)器在“聽清”之后聽得“更懂”。為此,公司推出了Vocplus智能語音增強(qiáng)和Vocplus Smart智能語音交互方案,目前已經(jīng)在手機(jī)、耳機(jī)、PC、對(duì)講機(jī)、VoIP、IoT等行業(yè)成功落地。

在研發(fā)過程中,苗健彰認(rèn)為,把技術(shù)從理論進(jìn)行工程落地轉(zhuǎn)化是最大的難點(diǎn),其中將神經(jīng)網(wǎng)絡(luò)小型化和模型的泛化是決定深度學(xué)習(xí)能否應(yīng)用于實(shí)際產(chǎn)品中的重要環(huán)節(jié)?!按笙舐暱圃谶@方面有一套獨(dú)特的技術(shù),能夠在不損失精度的情況下,使得算法參數(shù)盡量少,計(jì)算速度盡量快,這也是為什么目前我們的深度學(xué)習(xí)降噪算法快速落地到像耳機(jī)這類可穿戴產(chǎn)品。另外,市面上已經(jīng)有上千萬臺(tái)設(shè)備搭載了公司的算法,幫助公司沉淀了大量數(shù)據(jù)。大象聲科將人耳的聽覺機(jī)理與深度學(xué)習(xí)相結(jié)合,也大幅提升了算法的泛化性能,形成了較高的技術(shù)壁壘?!彼榻B。

相較而言,公司目前在手機(jī)、耳機(jī)等消費(fèi)電子行業(yè)有比較多的應(yīng)用案例,這和行業(yè)本身的需求和規(guī)模相關(guān)?!艾F(xiàn)在中國(guó)絕大部分的手機(jī)品牌,比如小米、OPPO、vivo都已經(jīng)有使用「大象聲科」的通話降噪技術(shù)(Vocplus Telecom)以及游戲抗嘯叫技術(shù)(DHS)的量產(chǎn)案例。”苗健彰說。在前不久發(fā)布的華為FreeLace Pro耳機(jī)上,也搭載了公司的Vocplus AI三麥通話降噪方案。

此外,自去年以來的TWS耳機(jī)增長(zhǎng)浪潮,也讓越來越多的耳機(jī)廠商逐漸采納以AI技術(shù)為主導(dǎo)的通話降噪方案?!复笙舐暱啤故锹氏仍谒{(lán)牙耳機(jī)上落地AI語音降噪的公司,首個(gè)成功量產(chǎn)案例是OPPO Enco Q1 。并且,2020年「大象聲科」與漫步者合作,成功落地了第一個(gè)AI算法結(jié)合骨傳導(dǎo)sensor的通話降噪方案,可以讓TWS耳機(jī)在通話時(shí)完全屏蔽周圍噪音(包含人聲噪音在內(nèi)),實(shí)現(xiàn)私密性更強(qiáng)的通話體驗(yàn)。

談及客戶方的具體考量維度,苗健彰介紹客戶主要會(huì)圍繞通話清晰度進(jìn)行評(píng)價(jià),在這方面,業(yè)內(nèi)有一套衡量通話降噪效果的客觀標(biāo)準(zhǔn)3QUEST,測(cè)試指標(biāo)包括:S-MOS(人聲保留程度),N-MOS(噪音消除程度),G-MOS(綜合通話降噪性能),而公司由于采用較獨(dú)特的AI技術(shù),在測(cè)評(píng)中得以展現(xiàn)優(yōu)勢(shì)。

在產(chǎn)業(yè)合作上,「大象聲科」目前已與Qualcomm,CEVA,Cirrus Logic,Infineon,Rockchip和BES等國(guó)內(nèi)外知名芯片廠商建立合作關(guān)系。其中值得一提的是,公司在2018年拿到了小米和高通的融資,并在之后和高通一起進(jìn)行聯(lián)合技術(shù)推廣,這也為公司在市場(chǎng)拓展和品牌建設(shè)方面提供了一定幫助。在收費(fèi)模式上,大象有按照license授權(quán)和按項(xiàng)目收費(fèi)兩種方式,當(dāng)前l(fā)icense總裝機(jī)量在數(shù)千萬級(jí)別,今年的營(yíng)收在數(shù)千萬元量級(jí)。

在未來的行業(yè)延展中,「大象聲科」計(jì)劃進(jìn)一步完善整個(gè)語音技術(shù)鏈條,把應(yīng)用場(chǎng)景從近場(chǎng)拓展到遠(yuǎn)場(chǎng),為更多行業(yè)如助聽器、智能家居、會(huì)議系統(tǒng)、智能車載等帶來更精準(zhǔn)更智能的語音解決方案。

團(tuán)隊(duì)方面,公司創(chuàng)始人兼CEO苗健彰UBC軟件工程學(xué)碩士畢業(yè),曾就職于IBM、RBC等500強(qiáng)企業(yè),并在加拿大成功創(chuàng)辦過一家軟件公司 。聯(lián)合創(chuàng)始人兼首席科學(xué)家汪德亮教授是計(jì)算機(jī)聽覺場(chǎng)景分析奠基人之一,也是全球首位將深度學(xué)習(xí)應(yīng)用于語音增強(qiáng)的科學(xué)家。聯(lián)合創(chuàng)始人兼CTO張學(xué)良多年從事語音分離、增強(qiáng)算法研發(fā)工作,是內(nèi)蒙古大學(xué)計(jì)算機(jī)學(xué)院教授。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50403

    瀏覽量

    267259
  • 智能語音
    +關(guān)注

    關(guān)注

    11

    文章

    829

    瀏覽量

    50355
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5612

    瀏覽量

    124676

原文標(biāo)題:用深度學(xué)習(xí)改變語音信號(hào)處理,大象聲科讓機(jī)器像人耳一樣“聆聽”

文章出處:【微信號(hào):MEMSensor,微信公眾號(hào):MEMS】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    博世超聲波芯片組革新:以原始信號(hào)處理技術(shù)重構(gòu)AI泊車感知新維度

    近期,在2026北京國(guó)際車展上,博世正式發(fā)布專為車輛近距離感知打造的新代超聲波芯片組TB193/TB293,通過**底層硬件級(jí)原始信號(hào)處理技術(shù)**實(shí)現(xiàn)泊車場(chǎng)景
    的頭像 發(fā)表于 05-08 11:14 ?665次閱讀

    語音芯片是如何機(jī)器“開口說話”的?文讀懂語音芯片工作原理及選型指南

    工作原理、主流類型到應(yīng)用選型,為你全面解析這機(jī)器擁有“聲音”的核心元器件。、什么是語音芯片
    的頭像 發(fā)表于 04-14 08:59 ?170次閱讀
    <b class='flag-5'>語音</b>芯片是如何<b class='flag-5'>讓</b><b class='flag-5'>機(jī)器</b>“開口說話”的?<b class='flag-5'>一</b>文讀懂<b class='flag-5'>語音</b>芯片工作原理及選型指南

    智能機(jī)器人從0到1系統(tǒng)入門課程 帶源碼課件 百度網(wǎng)盤下載

    機(jī)器人 AI 交互:語音識(shí)別 + 視覺識(shí)別入門實(shí)踐 在人工智能技術(shù)飛速演進(jìn)的當(dāng)下,機(jī)器人正從冰冷的自動(dòng)化設(shè)備向具備感知能力的智能體進(jìn)化。傳統(tǒng)
    發(fā)表于 04-11 16:41

    語音空調(diào)技術(shù)方案:從“聲控”到“感知”,HomeSense? 引領(lǐng)空間智能新體驗(yàn)

    在智能家居浪潮中,空調(diào)作為調(diào)節(jié)室內(nèi)環(huán)境的核心設(shè)備,其智能化水平直接影響著用戶的舒適度與體驗(yàn)。傳統(tǒng)語音控制空調(diào),雖解放了雙手,但往往停留在“單向指令”階段,缺乏對(duì)環(huán)境與人的主動(dòng)感知能力。用戶仍需手動(dòng)
    的頭像 發(fā)表于 03-16 11:30 ?207次閱讀

    SLAM如何為自動(dòng)駕駛提供空間感知能力

    [首發(fā)于智駕最前沿微信公眾號(hào)]在人工智能與機(jī)器人領(lǐng)域,如何機(jī)器像生物一樣理解空間,是個(gè)繞不開的核心命題。當(dāng)人類在
    的頭像 發(fā)表于 02-09 09:12 ?591次閱讀
    SLAM如何為自動(dòng)駕駛提供空間<b class='flag-5'>感知能力</b>?

    如何在NVIDIA Jetson Thor上提升機(jī)器感知效率

    構(gòu)建自主機(jī)器人需要具備可靠且低延遲的視覺感知能力,以實(shí)現(xiàn)在動(dòng)態(tài)環(huán)境中的深度估計(jì)、障礙物識(shí)別、定位與導(dǎo)航。這些功能對(duì)計(jì)算性能有較高要求。NVIDIA Jetson 平臺(tái)雖為深度
    的頭像 發(fā)表于 12-24 10:14 ?4665次閱讀
    如何在NVIDIA Jetson Thor上提升<b class='flag-5'>機(jī)器</b>人<b class='flag-5'>感知</b>效率

    四川大學(xué):研究種具有四重感知能力的柔性機(jī)器人傳感器

    在本研究中,作者受自然皮膚感知能力的啟發(fā),提出了種新型的內(nèi)在柔性機(jī)器人傳感器,其四重感知功能集成于單設(shè)備中,包括空間接近
    的頭像 發(fā)表于 12-10 18:16 ?2474次閱讀
    四川大學(xué):研究<b class='flag-5'>一</b>種具有四重<b class='flag-5'>感知能力</b>的柔性<b class='flag-5'>機(jī)器</b>人傳感器

    如何選擇合適的語音識(shí)別芯片型號(hào)

    語音識(shí)別芯片(又稱語音識(shí)別IC)是現(xiàn)代智能設(shè)備的核心組件,與傳統(tǒng)語音芯片相比,其最大特點(diǎn)是能夠主動(dòng)識(shí)別并處理
    的頭像 發(fā)表于 10-30 16:32 ?769次閱讀

    RK3576機(jī)器人核心:三屏異顯+八路攝像頭,重塑機(jī)器人交互與感知

    更多"、"互動(dòng)更流暢"是開發(fā)者面臨的核心挑戰(zhàn)。傳統(tǒng)的單屏幕和有限的視覺輸入已成為提升機(jī)器人智能化水平的瓶頸。而瑞芯微RK3576高性能處理器的出現(xiàn)
    發(fā)表于 10-29 16:41

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+具身智能芯片

    物理形狀的信息,分為緩慢適應(yīng)1型神經(jīng)元(SA-1)和快速適應(yīng)1型神經(jīng)元(FA-1)。 4、聽覺 具身智能需要像人耳一樣強(qiáng)大的聽力感官來感知聲音,并將他們傳輸?shù)秸J(rèn)知系統(tǒng),從而使系統(tǒng)通過聲
    發(fā)表于 09-18 11:45

    語音機(jī)器人交互系統(tǒng):核心技術(shù)與應(yīng)用挑戰(zhàn)

    、核心技術(shù)模塊 1. 自動(dòng)語音識(shí)別(ASR):這是系統(tǒng)的“耳朵”。它負(fù)責(zé)將用戶輸入的模擬語音信號(hào)轉(zhuǎn)換為計(jì)算機(jī)可處理的文本信息。當(dāng)前,基于深度
    的頭像 發(fā)表于 09-02 11:08 ?1039次閱讀

    再掀語音交互革命,廣和通AI解決方案加速機(jī)器聽覺進(jìn)化

    機(jī)器人世界里,感知是智能化的第步,是機(jī)器人獲取環(huán)境信息,學(xué)習(xí)適應(yīng)并自主決策的前提。聽覺作為五
    的頭像 發(fā)表于 08-26 17:44 ?1087次閱讀

    機(jī)器人競(jìng)技幕后:磁傳感器芯片激活 “精準(zhǔn)感知力”

    幫助機(jī)器人實(shí)時(shí)修正重心,大幅降低翻倒風(fēng)險(xiǎn)。 在關(guān)節(jié)運(yùn)動(dòng)控制上,磁傳感器芯片實(shí)現(xiàn) “毫米級(jí)精度保障”。以昆泰芯 KTM59 系列磁編碼器的離軸應(yīng)用為例,其非接觸式磁信號(hào)捕捉技術(shù),解決了傳統(tǒng)光學(xué)編碼器在
    發(fā)表于 08-26 10:02

    顆TTS語音芯給產(chǎn)品增加智能語音播報(bào)能力

    ,正在逐漸登上舞臺(tái)中央。 TTS語音合成芯片和傳統(tǒng)播報(bào)語音芯片的優(yōu)缺點(diǎn) 傳統(tǒng)播報(bào)語音芯片 本質(zhì)是 "聲音 U 盤",通過 ADC 將
    的頭像 發(fā)表于 08-14 16:33 ?913次閱讀

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量

    的四核1.4GHz處理器具備強(qiáng)勁的運(yùn)算性能,能夠高效處理語音機(jī)器人運(yùn)行過程中的復(fù)雜任務(wù)。語音識(shí)別和合成需要大量的計(jì)算資源,該
    發(fā)表于 05-28 11:36
    兴业县| 涿鹿县| 南汇区| 日喀则市| 盐边县| 西华县| 弥勒县| 兴山县| 若羌县| 榆中县| 普安县| 绥德县| 晋江市| 崇文区| 保靖县| 安泽县| 芷江| 贵德县| 肃宁县| 宣化县| 江华| 行唐县| 天镇县| 霍城县| 阜城县| 台北市| 阳城县| 固始县| 婺源县| 美姑县| 蒙自县| 乌海市| 巴林右旗| 美姑县| 丹凤县| 峨眉山市| 伊川县| 鲁山县| 天镇县| 青田县| 晋中市|