日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

針對智能語音交互的“金耳朵”語音前端處理技術(shù)進行了深度分享

fjYQ_ittbank ? 來源:未知 ? 作者:伍文輝 ? 2017-12-27 17:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能,可以說是今年最熱的一個關(guān)鍵詞,并推動著很多產(chǎn)品和產(chǎn)業(yè)的創(chuàng)新。而提到人工智能,目前主要的還是語音識別和圖像識別,這兩點也一直是上游芯片原廠和方案商想要突破和創(chuàng)新的技術(shù)關(guān)卡。

作為國內(nèi)知名音頻芯片廠商炬芯科技,不但于去年在音頻領(lǐng)域進入了小米、魅族等幾家大公司的供應(yīng)鏈,現(xiàn)在也開始聚焦音頻AI領(lǐng)域,推出了一系列的智能語音產(chǎn)品和解決方案。12月15日,炬芯科技在深圳舉行了針對智能語音技術(shù)的專屬品牌活動:炬芯科技2017 TcehLife開發(fā)者交流大會。

單麥克風(fēng)or麥克風(fēng)陣列,語音交互該選用怎樣的方案?

本次的TechLife活動交流分享環(huán)節(jié),炬芯特邀地平線語音前端處理技術(shù)負責人,南京大學(xué)聲科學(xué)與工程系教授,噪聲控制與通信聲學(xué)研究室主任盧晶盧教授,為大家針對智能語音交互的“金耳朵”語音前端處理技術(shù)進行了深度分享。

據(jù)WER統(tǒng)計,目前最頂尖的語音識別技術(shù)的誤識率是3%,已經(jīng)與人類聽力的誤識率持平,但是WER統(tǒng)計大多數(shù)針對安靜場景的語音數(shù)據(jù),在復(fù)雜環(huán)境中語音性能顯著惡化。人耳能夠自動屏蔽掉周圍的噪音,只關(guān)注你想聽到的聲音;但是機器做不到,在語音識別系統(tǒng)看來所接收到的所有聲音重要性都是一樣的,無法區(qū)分噪音和聲音,在復(fù)雜環(huán)境下語音識別率自然會下降。

因此,智能語音技術(shù)的發(fā)展讓語音前端處理的重要性日益凸顯。不僅要像手機、藍牙耳機、助聽器的語音前端處理系統(tǒng)一樣實現(xiàn)降噪,還要進一步還原語音,讓要讓機器聽得懂,進而提升語音識別和說話人識別系統(tǒng)的實用性和識別率。

盧晶盧教授表示,目前對干擾噪音的抑制有單麥克風(fēng)和麥克風(fēng)陣列兩種方案。其中單通道方案的關(guān)鍵點是噪聲功率譜的有效追蹤和語音邊界檢測,也可以基于深度學(xué)習(xí)的方案提升抑制干擾噪聲的能力。單通道方案優(yōu)點是結(jié)構(gòu)簡單,硬件成本低,對平穩(wěn)噪聲效果明顯,但弱點是對非平穩(wěn)噪聲處理效果不佳。

麥克風(fēng)陣列由一組按一定幾何結(jié)構(gòu)(常用線形、環(huán)形)擺放的麥克風(fēng)組成,對采集的不同空間方向的聲音信號進行空時處理,實現(xiàn)噪聲抑制、混響去除、人聲干擾抑制、聲源測向、聲源跟蹤、陣列增益等功能,進而提高語音信號處理質(zhì)量,以提高真實環(huán)境下的語音識別率。

理論上來說,麥克風(fēng)數(shù)量多多益善,但系統(tǒng)的實現(xiàn)必須考慮性價比。那么,對于開發(fā)者來說,該如何平衡語音前端硬件系統(tǒng)的性能和價格呢?盧晶盧教授認為,在一般應(yīng)用場景,說話人距離3m以內(nèi)可以采用單麥克風(fēng);復(fù)雜場景使用2顆;需要DOA估計的復(fù)雜場景則需要3-4顆甚至8顆的麥克風(fēng)。

聚焦音頻AI,炬芯推出智能語音全系列產(chǎn)品線

炬芯科技技術(shù)專家陶永耀在現(xiàn)場也為大家詳細的講解了炬芯目前的幾大核心平臺,同時也對智能語音的未來發(fā)表了獨到的觀點。

熟悉炬芯的人都知道,炬芯是做音頻起家的,最早做MP3,老人機、小音箱等產(chǎn)品。陶永耀表示,炬芯未來三到五年仍將重點聚焦以音頻為主線的三大領(lǐng)域,并引入人工智能元素。一是無線音頻和智能穿戴運動耳機;二是智能多媒體,將原來的老人機、游戲機、學(xué)習(xí)機,與人工智能結(jié)合形成跨界的產(chǎn)品。三是智慧計算與物聯(lián)網(wǎng),包括無人機VR/AR、OTT盒子等產(chǎn)品。

作為一家芯片廠商,炬芯聚焦解決智能語音平臺的共性需求,致力于智能語音交互技術(shù)中的前臺技術(shù)的發(fā)展。主要包括以下四點:1.mic陣列語音采集芯片;2整合語音前處理相關(guān)算法;3.整合本地語音識別引擎;4.雙mic語音前處理模塊。

目前炬芯已經(jīng)擁有非常豐富的智能語音產(chǎn)品線,尤其是目前熱門且已經(jīng)成功落地的智能早教機器人產(chǎn)品。其實在早教機器人方面炬芯已經(jīng)推出了比較全面的解決方案,完整布局了低、中、高端市場,主要包括ATS3503、ATS3603、ATS3703。

針對火爆的智能音箱市場,炬芯在本次開發(fā)者交流大會上正式推出了全新的智能語音多媒體平臺。包括面向無屏Linux系統(tǒng)的智能語音平臺ATS3605D,面向有屏的Android智能語音平臺有S500、S700、S900,以及一顆支持4-8麥的語音采集套片ATT300X。

此外,炬芯還推出了雙模藍牙平臺AT3282X和ATB12XX,以及針對BLE藍牙智能語音平臺ATB110X。

此前,炬芯科技CEO周正宇博士被采訪表示,人工智能和物聯(lián)網(wǎng)概念一樣的龐大,如果人工智能像物聯(lián)網(wǎng)一樣不追求產(chǎn)品的落地,它將依然得不到人工智能需要追求實際的產(chǎn)品落地和智能化的用戶體驗,堅持小步快走的微智能化發(fā)展方針才是長久之計。炬芯在此次開發(fā)者大會上充分展示了智能語音全面的產(chǎn)品線,正是基于其小步快走的微智能化發(fā)展方針的最好實踐。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41326

    瀏覽量

    302705
  • 智能語音
    +關(guān)注

    關(guān)注

    11

    文章

    829

    瀏覽量

    50352

原文標題:從音頻到智能語音,看炬芯AI創(chuàng)新之路

文章出處:【微信號:ittbank,微信公眾號:ittbank】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    新品 | Echo Pyramid,智能語音交互底座

    系列主控單元實現(xiàn)音頻數(shù)據(jù)處理、無線通信、業(yè)務(wù)邏輯控制以及物聯(lián)網(wǎng)連接,適用于遠場語音識別、語音助手、語音控制等多種智能
    的頭像 發(fā)表于 03-06 16:51 ?2622次閱讀
    新品 | Echo Pyramid,<b class='flag-5'>智能</b><b class='flag-5'>語音</b><b class='flag-5'>交互</b>底座

    100dB 深度消回音 + AI 降噪!A29P 語音處理模組技術(shù)解析與應(yīng)用指南

    語音質(zhì)量問題,尤其針對 “小體積 + 高音量喇叭” 的極端場景進行了優(yōu)化,無需復(fù)雜調(diào)試即可實現(xiàn)清晰、流暢的語音交互。 與同類型模組相比,
    的頭像 發(fā)表于 01-08 11:02 ?818次閱讀
    100dB <b class='flag-5'>深度</b>消回音 + AI 降噪!A29P <b class='flag-5'>語音</b><b class='flag-5'>處理</b>模組<b class='flag-5'>技術(shù)</b>解析與應(yīng)用指南

    聽得清,才是真智能!移遠“金耳朵”升級——AI回聲消除,讓對話更清晰自然!

    智能語音交互與免提通話日益普及的今天,回聲干擾已成為影響用戶體驗的“隱形殺手”。針對這一痛點,移遠通信依托基于人工智能的回聲消除算法(AE
    的頭像 發(fā)表于 11-07 12:07 ?928次閱讀
    聽得清,才是真<b class='flag-5'>智能</b>!移遠“<b class='flag-5'>金耳朵</b>”升級——AI回聲消除,讓對話更清晰自然!

    什么是離線語音識別芯片(離線語音識別芯片有哪些優(yōu)點)

    離線語音識別芯片,是一種集成了語音信號采集、前端處理和本地識別功能的專用集成電路,無須聯(lián)網(wǎng)也可以進行語音
    的頭像 發(fā)表于 10-31 15:27 ?702次閱讀

    揭秘AI玩具“聽得清”的秘密!這幾款語音前端芯片撐起交互體驗天花板

    電子發(fā)燒友網(wǎng)報道(文/黃山明)在AI大模型的加持下,AI玩具的最重要的功能便是語音交互,而要做到較好的語音交互,少不了語音
    的頭像 發(fā)表于 10-17 08:42 ?1w次閱讀

    “芯”聲代,智未來—VS680本地語音交互系統(tǒng) #語音交互 #芯片

    語音交互
    深蕾半導(dǎo)體
    發(fā)布于 :2025年09月17日 10:59:30

    語音機器人交互系統(tǒng):核心技術(shù)與應(yīng)用挑戰(zhàn)

    : 一、核心技術(shù)模塊 1. 自動語音識別(ASR):這是系統(tǒng)的“耳朵”。它負責將用戶輸入的模擬語音信號轉(zhuǎn)換為計算機可處理的文本信息。當前,基
    的頭像 發(fā)表于 09-02 11:08 ?1026次閱讀

    智能語音交互升級,九芯語音識別芯片來助力

    在科技飛速發(fā)展的當下,智能語音交互已經(jīng)深度融入我們的生活,從智能家居的便捷操控,到車載電子的安全駕駛輔助,再到
    的頭像 發(fā)表于 08-11 14:08 ?1199次閱讀
    <b class='flag-5'>智能</b><b class='flag-5'>語音</b><b class='flag-5'>交互</b>升級,九芯<b class='flag-5'>語音</b>識別芯片來助力

    普強智能語音技術(shù)重新定義車載交互邊界

    普強憑借自主研發(fā)的智能語音技術(shù),為某國內(nèi)頭部車企提供的語音處理、喚醒詞、ASR、TTS等技術(shù)
    的頭像 發(fā)表于 07-11 14:00 ?1333次閱讀

    智能語音交互別再瞎選語音芯片了!NRK3502 才是你的最優(yōu)解!

    在科技飛速發(fā)展的當下,智能產(chǎn)品如潮水般涌入我們的生活,從智能家居到智能醫(yī)療,從智能玩具到工業(yè)控制,語音
    的頭像 發(fā)表于 07-10 07:03 ?811次閱讀
    <b class='flag-5'>智能</b><b class='flag-5'>語音</b><b class='flag-5'>交互</b>別再瞎選<b class='flag-5'>語音</b>芯片了!NRK3502 才是你的最優(yōu)解!

    藍牙語音遙控器:智能家居的智慧控制核心

    和低功耗特性,成為理想選擇。 藍牙語音遙控器不僅是智能家居控制的樞紐,更是技術(shù)進步的縮影。其便捷的操作、智能語音
    發(fā)表于 06-01 20:24

    明遠智睿SSD2351開發(fā)板:語音機器人領(lǐng)域的變革力量

    的四核1.4GHz處理器具備強勁的運算性能,能夠高效處理語音機器人運行過程中的復(fù)雜任務(wù)。語音識別和合成需要大量的計算資源,該處理器可以快速對
    發(fā)表于 05-28 11:36

    芯資訊|廣州唯創(chuàng)電子WTK6900P語音識別芯片:離線語音交互的革新者

    智能設(shè)備全面普及的浪潮中,語音交互技術(shù)正逐步從“云端依賴”向“本地化高效處理”演進。廣州唯創(chuàng)電子推出的WTK6900P
    的頭像 發(fā)表于 05-22 09:22 ?984次閱讀
    芯資訊|廣州唯創(chuàng)電子WTK6900P<b class='flag-5'>語音</b>識別芯片:離線<b class='flag-5'>語音</b><b class='flag-5'>交互</b>的革新者

    豐富案例庫:解鎖唯創(chuàng)智能門鎖行業(yè)語音交互方案及應(yīng)用優(yōu)勢

    創(chuàng)知音語音芯片及交互方案,正為每一位業(yè)務(wù)伙伴的智能門鎖產(chǎn)品注入一個"會說話"的靈魂。自2010年起,唯創(chuàng)知音就與不少智能門鎖廠家建立了深度
    的頭像 發(fā)表于 05-21 12:06 ?836次閱讀
    豐富案例庫:解鎖唯創(chuàng)<b class='flag-5'>智能</b>門鎖行業(yè)<b class='flag-5'>語音</b><b class='flag-5'>交互</b>方案及應(yīng)用優(yōu)勢

    芯資訊|廣州唯創(chuàng)電子WTV系列語音芯片:以技術(shù)創(chuàng)新賦能智能語音交互

    在萬物互聯(lián)的智能化時代,語音交互技術(shù)已成為人機交互的重要橋梁。廣州唯創(chuàng)電子深耕語音芯片領(lǐng)域多年,
    的頭像 發(fā)表于 05-21 08:45 ?852次閱讀
    芯資訊|廣州唯創(chuàng)電子WTV系列<b class='flag-5'>語音</b>芯片:以<b class='flag-5'>技術(shù)</b>創(chuàng)新賦能<b class='flag-5'>智能</b><b class='flag-5'>語音</b><b class='flag-5'>交互</b>
    苏尼特左旗| 保山市| 弥渡县| 洛浦县| 磐石市| 自治县| 耒阳市| 屯门区| 嘉峪关市| 临漳县| 郓城县| 江西省| 茌平县| 西平县| 增城市| 东丰县| 榕江县| 绍兴市| 漾濞| 正定县| 象山县| 化隆| 潞西市| 东方市| 三门峡市| 根河市| 平利县| 清丰县| 花垣县| 丰顺县| 罗定市| 枣庄市| 栾川县| 阿拉善左旗| 馆陶县| 广饶县| 洛宁县| 井冈山市| 山丹县| 阳东县| 二连浩特市|