日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計(jì)算模型通過(guò)預(yù)測(cè)對(duì)語(yǔ)音進(jìn)行解碼

倩倩 ? 來(lái)源:互聯(lián)網(wǎng)分析沙龍 ? 2020-07-03 10:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大腦通過(guò)識(shí)別音節(jié)來(lái)分析口語(yǔ)。日內(nèi)瓦大學(xué)(UNIGE)和不斷發(fā)展的語(yǔ)言國(guó)家能力研究中心(NCCR)的科學(xué)家設(shè)計(jì)了一種計(jì)算模型,該模型再現(xiàn)了中樞神經(jīng)系統(tǒng)執(zhí)行此操作所采用的復(fù)雜機(jī)制。該模型匯集了兩個(gè)獨(dú)立的理論框架,使用等效于大腦活動(dòng)產(chǎn)生的神經(jīng)元振動(dòng)來(lái)處理關(guān)聯(lián)語(yǔ)音的連續(xù)聲音流。

該模型根據(jù)稱為預(yù)測(cè)編碼的理論起作用,從而大腦通過(guò)不斷嘗試基于候選假設(shè)(此模型中的音節(jié))來(lái)預(yù)測(cè)感覺(jué)信號(hào)來(lái)優(yōu)化感知。結(jié)果模型在《自然通訊》雜志上進(jìn)行了描述,該模型有助于實(shí)時(shí)識(shí)別以自然語(yǔ)言說(shuō)出的數(shù)百個(gè)句子中包含的數(shù)千個(gè)音節(jié)。這證實(shí)了神經(jīng)元振動(dòng)可以用來(lái)協(xié)調(diào)我們聽(tīng)到的音節(jié)流與大腦預(yù)測(cè)的想法。

UNIGE醫(yī)學(xué)院基礎(chǔ)神經(jīng)科學(xué)系教授,不斷發(fā)展的語(yǔ)言NCCR聯(lián)合主任Anne-Lise Giraud說(shuō):“腦部活動(dòng)會(huì)產(chǎn)生可通過(guò)腦電圖測(cè)量的神經(jīng)元振蕩?!边@些是電磁波,是由整個(gè)神經(jīng)元網(wǎng)絡(luò)的相干電活動(dòng)產(chǎn)生的。有幾種類型,根據(jù)它們的頻率定義。它們被稱為α,β,θ,δ或γ波。這些節(jié)奏單獨(dú)或疊加在一起,與不同的認(rèn)知功能相關(guān),例如感知,記憶,注意力,機(jī)敏性等。

但是,神經(jīng)科學(xué)家尚不知道他們是否對(duì)這些功能做出積極貢獻(xiàn)以及如何發(fā)揮作用。在2015年發(fā)表的一項(xiàng)較早研究中,Giraud教授的團(tuán)隊(duì)表明,theta波(低頻)和gamma波(高頻)相互配合,對(duì)音節(jié)中的音流進(jìn)行排序,并分析其內(nèi)容,以便對(duì)其進(jìn)行識(shí)別。

總部位于日內(nèi)瓦的科學(xué)家根據(jù)這些生理節(jié)律開(kāi)發(fā)了一種突跳的神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)模型,該模型在現(xiàn)場(chǎng)(在線)音節(jié)排序方面的性能優(yōu)于傳統(tǒng)的自動(dòng)語(yǔ)音識(shí)別系統(tǒng)。

在他們的第一個(gè)模型中,theta波(介于4赫茲與8赫茲之間)使跟隨系統(tǒng)感知的音節(jié)節(jié)奏成為可能。伽馬波(大約30赫茲)用于將聽(tīng)覺(jué)信號(hào)切成較小的切片并進(jìn)行編碼。這會(huì)產(chǎn)生一個(gè)鏈接到每個(gè)聲音序列的“音素”配置文件,可以將其與后一個(gè)音節(jié)進(jìn)行比較,并與已知音節(jié)庫(kù)進(jìn)行比較。這種類型的模型的優(yōu)點(diǎn)之一是,它可以自發(fā)地適應(yīng)語(yǔ)音速度,語(yǔ)音速度可能因人而異。

在這篇新文章中,為了更接近生物學(xué)現(xiàn)實(shí),Giraud教授和她的團(tuán)隊(duì)開(kāi)發(fā)了一種新模型,其中結(jié)合了來(lái)自另一個(gè)理論框架的元素,而與神經(jīng)元振蕩無(wú)關(guān):“預(yù)測(cè)編碼”。

“該理論認(rèn)為,大腦的功能是如此之好,因?yàn)樗恢痹谑褂猛饨缡录绾萎a(chǎn)生感官信號(hào)的學(xué)習(xí)模型來(lái)不斷嘗試預(yù)測(cè)和解釋環(huán)境中正在發(fā)生的事情。就口語(yǔ)而言,它試圖找到最有效的方法。根據(jù)已學(xué)到的,并且正在不斷更新的一組心理表征,可能會(huì)隨著聲音的發(fā)展而使耳朵感知到的聲音的可能原因?!?Giraud小組的計(jì)算神經(jīng)科學(xué)家Itsaso Olasagasti博士說(shuō)。模型實(shí)施。

“我們開(kāi)發(fā)了一種模擬這種預(yù)測(cè)編碼的計(jì)算機(jī)模型,”基礎(chǔ)神經(jīng)科學(xué)系研究員,該論文的第一作者Sevada Hovsepyan解釋說(shuō)?!岸椅覀兺ㄟ^(guò)引入振蕩機(jī)制來(lái)實(shí)現(xiàn)它。”

進(jìn)入系統(tǒng)的聲音首先由類似于神經(jīng)元種群產(chǎn)生的θ(慢)波調(diào)制。這樣就可以發(fā)信號(hào)通知音節(jié)的輪廓。然后,(快速)伽馬波序列有助于在音節(jié)被感知時(shí)對(duì)音節(jié)進(jìn)行編碼。在此過(guò)程中,系統(tǒng)會(huì)建議可能的音節(jié),并在必要時(shí)更正選擇。在兩個(gè)級(jí)別之間來(lái)回幾次后,它會(huì)發(fā)現(xiàn)正確的音節(jié)。隨后,系統(tǒng)在每個(gè)音節(jié)結(jié)束時(shí)將其重置為零。

該模型已成功使用220個(gè)句子中的2888個(gè)不同音節(jié)以英語(yǔ)自然語(yǔ)言進(jìn)行了測(cè)試。Giraud教授說(shuō):“一方面,我們成功地將兩個(gè)非常不同的理論框架整合到一個(gè)計(jì)算機(jī)模型中?!薄傲硪环矫?,我們已經(jīng)表明,神經(jīng)元振蕩很可能在節(jié)奏上使大腦的內(nèi)源性功能與通過(guò)感覺(jué)器官?gòu)耐獠總魅氲男盘?hào)對(duì)齊。如果將其放回預(yù)測(cè)編碼理論中,則意味著這些振蕩可能使大腦大腦在正確的時(shí)機(jī)做出正確的假設(shè)?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    《多模態(tài)大模型 前沿算法與實(shí)戰(zhàn)應(yīng)用 第一季》精品課程簡(jiǎn)介

    ;語(yǔ)境下會(huì)生成不同的向量表示。 音頻模態(tài) :Mel頻譜圖或Wav2Vec等模型將聲波轉(zhuǎn)換為時(shí)頻特征矩陣,捕捉音調(diào)、節(jié)奏等語(yǔ)音信息。 2. 跨模態(tài)對(duì)齊:建立模態(tài)間關(guān)聯(lián) 通過(guò)對(duì)比學(xué)習(xí)或注意力機(jī)制實(shí)現(xiàn)模態(tài)對(duì)齊
    發(fā)表于 05-01 17:46

    MAX9860:16位單聲道音頻語(yǔ)音解碼器的卓越之選

    MAX9860:16位單聲道音頻語(yǔ)音解碼器的卓越之選 在音頻設(shè)備設(shè)計(jì)領(lǐng)域,一款性能出色的音頻編解碼器對(duì)于提升產(chǎn)品音質(zhì)和用戶體驗(yàn)至關(guān)重要。今天,我們就來(lái)深入了解一下Maxim Integrated
    的頭像 發(fā)表于 04-22 15:45 ?154次閱讀

    深入解析Si3000:高性能語(yǔ)音解碼器的技術(shù)洞察

    深入解析Si3000:高性能語(yǔ)音解碼器的技術(shù)洞察 在電子設(shè)備的音頻處理領(lǐng)域,一款出色的語(yǔ)音解碼器對(duì)于提升音質(zhì)和功能起著至關(guān)重要的作用。今天,我們就來(lái)詳細(xì)探討一下Skyworks的S
    的頭像 發(fā)表于 04-16 09:10 ?424次閱讀

    TLV320AIC14:高性能語(yǔ)音解碼器的深度剖析與應(yīng)用指南

    TLV320AIC14:高性能語(yǔ)音解碼器的深度剖析與應(yīng)用指南 在電子設(shè)備的音頻處理領(lǐng)域,編解碼器扮演著至關(guān)重要的角色。TI公司的TLV320AIC14是一款極具特色的低功耗、高性能語(yǔ)音
    的頭像 發(fā)表于 02-04 11:25 ?637次閱讀

    探索MAX9860:16位單聲道音頻語(yǔ)音解碼器的卓越性能與應(yīng)用

    探索MAX9860:16位單聲道音頻語(yǔ)音解碼器的卓越性能與應(yīng)用 在當(dāng)今的音頻設(shè)備領(lǐng)域,低功耗、高性能的音頻編解碼器需求日益增長(zhǎng)。Maxim Integrated的MAX9860 16位單聲道音頻
    的頭像 發(fā)表于 01-28 16:10 ?338次閱讀

    從數(shù)據(jù)到模型:如何預(yù)測(cè)細(xì)節(jié)距鍵合的剪切力?

    在微電子封裝領(lǐng)域,細(xì)節(jié)距鍵合工藝的開(kāi)發(fā)與質(zhì)量控制面臨著巨大挑戰(zhàn)。工程師們常常需要在缺乏大量破壞性測(cè)試的前提下,快速評(píng)估或預(yù)測(cè)一個(gè)鍵合點(diǎn)的剪切力性能。能否根據(jù)焊球的表觀尺寸,通過(guò)一個(gè)可靠的數(shù)學(xué)模型來(lái)
    發(fā)表于 01-08 09:45

    TLV320AIC12KIDBTR 低功耗單聲道語(yǔ)音頻編解碼

    TLV320AIC12KIDBTR低功耗單聲道語(yǔ)音頻編解碼器產(chǎn)品型號(hào):TLV320AIC12KIDBTR產(chǎn)品品牌:TI/德州儀器產(chǎn)品封裝:TSSOP30產(chǎn)品功能:語(yǔ)音頻編解碼
    的頭像 發(fā)表于 12-20 11:30 ?622次閱讀
    TLV320AIC12KIDBTR   低功耗單聲道<b class='flag-5'>語(yǔ)音</b>頻編<b class='flag-5'>解碼</b>器

    模型賦能物資需求精準(zhǔn)預(yù)測(cè)與采購(gòu)系統(tǒng):功能特點(diǎn)與平臺(tái)架構(gòu)解析

    ? ? 大模型賦能物資需求預(yù)測(cè)與采購(gòu)智能化:核心功能與價(jià)值解析 ? ?大模型賦能物資需求精準(zhǔn)預(yù)測(cè)與采購(gòu)系統(tǒng)通過(guò)深度整合多源數(shù)據(jù)、構(gòu)建動(dòng)態(tài)
    的頭像 發(fā)表于 12-16 11:54 ?489次閱讀

    蜂鳥(niǎo)E203簡(jiǎn)單分支預(yù)測(cè)的改進(jìn)

    當(dāng)前指令的類型是普通指令還是分支跳轉(zhuǎn)指令。當(dāng)譯碼信息指示當(dāng)前指令為分支跳轉(zhuǎn)指令時(shí),則在一個(gè)周期內(nèi)進(jìn)行分支預(yù)測(cè)。 蜂鳥(niǎo)E203的分支預(yù)測(cè)十分簡(jiǎn)單,是常見(jiàn)的靜態(tài)分支預(yù)測(cè),
    發(fā)表于 10-24 07:45

    在Ubuntu20.04系統(tǒng)中訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗(yàn)

    , batch_size=512, epochs=20)總結(jié) 這個(gè)核心算法中的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練過(guò)程,是用來(lái)對(duì)MNIST手寫(xiě)數(shù)字圖像進(jìn)行分類的。模型將圖像作為輸入,通過(guò)卷積和池化層提取圖像的特征,然后
    發(fā)表于 10-22 07:03

    基于全局預(yù)測(cè)歷史的gshare分支預(yù)測(cè)器的實(shí)現(xiàn)細(xì)節(jié)

    GShare預(yù)測(cè)機(jī)制簡(jiǎn)介 GShare預(yù)測(cè)機(jī)制作為一種常用的分支預(yù)測(cè)機(jī)制,通過(guò)基于分支歷史和分支地址來(lái)預(yù)測(cè)分支指令的執(zhí)行路徑。分支歷史是指
    發(fā)表于 10-22 06:50

    廣和通發(fā)布自研端側(cè)語(yǔ)音識(shí)別大模型FiboASR

    7月,全球領(lǐng)先的無(wú)線通信模組及AI解決方案提供商廣和通,發(fā)布其自主研發(fā)的語(yǔ)音識(shí)別大模型FiboASR。該模型專為端側(cè)設(shè)備上面臨的面對(duì)面實(shí)時(shí)對(duì)話及多人會(huì)議場(chǎng)景深度優(yōu)化,在低延遲語(yǔ)音交互、
    的頭像 發(fā)表于 08-04 11:43 ?1811次閱讀

    模型推理顯存和計(jì)算量估計(jì)方法研究

    方法。 一、引言 大模型推理是指在已知輸入數(shù)據(jù)的情況下,通過(guò)深度學(xué)習(xí)模型進(jìn)行預(yù)測(cè)或分類的過(guò)程。然而,大
    發(fā)表于 07-03 19:43

    明遠(yuǎn)智睿SSD2351開(kāi)發(fā)板:語(yǔ)音機(jī)器人領(lǐng)域的變革力量

    的四核1.4GHz處理器具備強(qiáng)勁的運(yùn)算性能,能夠高效處理語(yǔ)音機(jī)器人運(yùn)行過(guò)程中的復(fù)雜任務(wù)。語(yǔ)音識(shí)別和合成需要大量的計(jì)算資源,該處理器可以快速對(duì)語(yǔ)音信號(hào)
    發(fā)表于 05-28 11:36

    芯資訊|廣州唯創(chuàng)電子MP3語(yǔ)音芯片IC的音頻解碼方式解析

    音頻解碼語(yǔ)音芯片的核心功能之一,決定了音質(zhì)表現(xiàn)和應(yīng)用場(chǎng)景的適配性。廣州唯創(chuàng)電子作為國(guó)內(nèi)領(lǐng)先的語(yǔ)音芯片廠商,其MP3語(yǔ)音芯片系列(如WT2003H)以靈活的
    的頭像 發(fā)表于 05-28 08:48 ?1060次閱讀
    芯資訊|廣州唯創(chuàng)電子MP3<b class='flag-5'>語(yǔ)音</b>芯片IC的音頻<b class='flag-5'>解碼</b>方式解析
    扬州市| 广灵县| 北宁市| 宁国市| 西乌珠穆沁旗| 怀安县| 河南省| 南皮县| 鹤峰县| 米易县| 扎囊县| 雷州市| 太康县| 大田县| 察雅县| 都匀市| 辽阳县| 宿松县| 施甸县| 白玉县| 黄大仙区| 德清县| 镇江市| 苏尼特右旗| 武胜县| 高阳县| 连云港市| 滁州市| 新和县| 伊宁县| 连南| 时尚| 印江| 连江县| 健康| 海南省| 樟树市| 上杭县| 涞水县| 汉川市| 邯郸市|