日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

中國(guó)團(tuán)隊(duì)將計(jì)算機(jī)“詞匯級(jí)唇讀”精度提高到84.41%

獨(dú)愛(ài)72H ? 來(lái)源:DeepTech ? 作者:DeepTech ? 2020-03-19 16:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來(lái)源:DeepTech)

近年來(lái),隨著深度學(xué)習(xí)的迅速發(fā)展和廣泛的潛在應(yīng)用,基于計(jì)算機(jī)視覺(jué)的唇讀技術(shù)受到越來(lái)越多的關(guān)注,它在實(shí)踐中有許多重要的應(yīng)用,如輔助語(yǔ)音識(shí)別、生物認(rèn)證、幫助聽(tīng)障人士等。但是唇讀任務(wù)的難度非常高,一個(gè)關(guān)鍵點(diǎn)是如何有效地獲取唇部的運(yùn)動(dòng)信息,同時(shí)抵抗由姿勢(shì)、光線變化引起的識(shí)別困難,講話人的外貌、講話速度變化等干擾因素,此外,如何把唇語(yǔ)圖像特征與詞匯文本進(jìn)行精確關(guān)聯(lián)或者區(qū)分同音詞也挑戰(zhàn)重重。

來(lái)自浙江工業(yè)大學(xué)、中國(guó)科學(xué)院智能信息處理重點(diǎn)實(shí)驗(yàn)室以及中國(guó)科學(xué)院計(jì)算技術(shù)研究所的研究人員針對(duì)這些問(wèn)題,提出在局部特征層和全局序列層引入互信息約束,以增強(qiáng)唇部視覺(jué)特征與語(yǔ)音內(nèi)容的關(guān)系。通過(guò)在一些主流數(shù)據(jù)集上測(cè)試,該團(tuán)隊(duì)提出的方法有望同時(shí)具有較好的鑒別能力和魯棒性,以實(shí)現(xiàn)有效的唇讀。

唇讀領(lǐng)域有一個(gè)重要技術(shù)分支即詞匯級(jí)唇讀,對(duì)于該任務(wù),需要用單個(gè)單詞標(biāo)簽對(duì)每個(gè)輸入視頻進(jìn)行注釋,盡管在同一視頻中也存在其他單詞,如上圖所示:(a)中的視頻樣本總共包括 29 幀,被注釋為 “ABOUT”,但是單詞“ABOUT” 的實(shí)際幀僅包括時(shí)間步驟 T=1219 的幀,這個(gè)間隔前后的幀分別對(duì)應(yīng)于單詞是 “JUST” 和“TEN”,而不是“ABOUT”。在基于唇語(yǔ)視覺(jué)的研究中,我們總是很難劃分一個(gè)單詞的確切邊界。

這種特性要求一個(gè)好的唇讀模型能夠?qū)W習(xí)到同一個(gè)詞標(biāo)簽下不同視頻中反映的潛在但一致的特性,從而能夠更多地關(guān)注有效的關(guān)鍵幀,而較少關(guān)注其他無(wú)關(guān)幀。除了不精確的詞匯邊界挑戰(zhàn)外,對(duì)應(yīng)于同一個(gè)詞標(biāo)簽的視頻樣本總是具有極大的多樣化和外觀變化,如(b)所示,所有這些特性都要求唇讀模型能夠抵抗序列中的噪聲,從而在不同的語(yǔ)音條件下捕獲一致的潛在模式。

同時(shí),由于唇部動(dòng)作的有效面積有限,不同的詞在說(shuō)話過(guò)程中可能表現(xiàn)出相似的現(xiàn)象。特別是,同音詞的存在,不同的詞看起來(lái)可能相同或非常相似,增加了許多額外的困難,這些屬性要求模型能夠發(fā)現(xiàn)與幀級(jí)別中不同單詞相關(guān)的細(xì)粒度差異,以便區(qū)分每個(gè)單詞。為了解決上述問(wèn)題,研究人員在不同層次上引入了互信息最大化(MIM),以幫助該模型學(xué)習(xí)魯棒性和區(qū)分性表示,從而實(shí)現(xiàn)有效的唇讀。

一方面,通過(guò)施加局部互信息最大化約束(LMIM)來(lái)約束每個(gè)時(shí)間步產(chǎn)生的特征,使其與語(yǔ)音內(nèi)容之間具有很強(qiáng)的相關(guān)性,從而提高了模型發(fā)現(xiàn)精細(xì)的嘴唇動(dòng)作的能力,以及發(fā)音相似的單詞之間的細(xì)微差別,比如 “spend” 和“spending”;另一方面,引入了全局序列水平上的互信息最大化約束(GMIM),使得模型能夠更加注意區(qū)分與語(yǔ)音內(nèi)容相關(guān)的關(guān)鍵幀,而且在說(shuō)話過(guò)程中出現(xiàn)的各種噪音也較少。

此外,GMIM 迫使模型學(xué)習(xí)不同樣本中同一個(gè)詞標(biāo)簽的潛在一致全局模式,同時(shí)對(duì)姿勢(shì)、光照和其他不相關(guān)條件的變化具有魯棒性;LMIM 可增強(qiáng)每個(gè)時(shí)間步與單詞相關(guān)的細(xì)粒度運(yùn)動(dòng),進(jìn)一步增強(qiáng)不同單詞之間的差異。通過(guò)將這兩類約束結(jié)合起來(lái),模型可以自動(dòng)發(fā)現(xiàn)和區(qū)分目標(biāo)詞的有效重要幀,而忽略其他無(wú)關(guān)幀,進(jìn)一步提高了識(shí)別的精準(zhǔn)度。

最后,團(tuán)隊(duì)在兩個(gè)大規(guī)模的單詞級(jí)唇讀數(shù)據(jù)集 LRW 和 LRW-1000 上與同行提出的主流唇語(yǔ)識(shí)別模型方法做了對(duì)比評(píng)估,這兩個(gè)數(shù)據(jù)集的樣本都是從各種不同的電視節(jié)目中收集的,并且演講條件也有很大的變化,涵蓋了包括燈光條件、分辨率、姿勢(shì)、性別、化妝等在內(nèi)的多種說(shuō)話條件。

LRW 于 2016 年發(fā)布,包括 500 個(gè)單詞的唇形樣本,1000 多個(gè)演講者,訓(xùn)練集中的實(shí)例數(shù)達(dá)到 488766 個(gè),驗(yàn)證和測(cè)試集中的每個(gè)實(shí)例數(shù)為 25000 個(gè);LRW-1000 數(shù)據(jù)集則是一個(gè)大規(guī)模的自然分布的字級(jí)基準(zhǔn)數(shù)據(jù)集,總共有 1000 個(gè)中文詞匯,總計(jì)大約 718018 個(gè)樣本實(shí)例,持續(xù)時(shí)間約 57 小時(shí),不過(guò)該數(shù)據(jù)集旨在覆蓋不同語(yǔ)音模式和成像條件下的自然變化,以納入實(shí)際應(yīng)用中遇到的挑戰(zhàn)。

在 LRW 數(shù)據(jù)集上,引入 LMIM 之后,在基線準(zhǔn)確率基礎(chǔ)上提高了約 1.19%,LMIM 有望為主要任務(wù)捕獲更具區(qū)分性和細(xì)粒度的特征,同時(shí)引入 GMIM 則把精度提高到了 84.41%,主要得益于其對(duì)不同幀的不同關(guān)注。

不過(guò),在 LRW-1000 數(shù)據(jù)集上因其語(yǔ)音條件變化較大,包括燈光條件、分辨率、演講者年齡、姿勢(shì)、性別、化妝等,此前行業(yè)最佳測(cè)試結(jié)果僅為 38.19%。在這個(gè)數(shù)據(jù)集上獲得良好的識(shí)別效果仍是一個(gè)挑戰(zhàn),新的模型方式獲得了 38.79% 的識(shí)別精度,略微優(yōu)于現(xiàn)有的最新結(jié)果。

結(jié)果表明,該團(tuán)隊(duì)提出的方法在不使用額外數(shù)據(jù)或額外的預(yù)訓(xùn)練模型的情況下,在兩個(gè)具有挑戰(zhàn)性的數(shù)據(jù)集上相比其他唇語(yǔ)識(shí)別模型,呈現(xiàn)出一種新的實(shí)時(shí)性能狀態(tài)。此外,團(tuán)隊(duì)表示,該方法還可以很容易地修改為其他任務(wù)的模型,從而為其他任務(wù)的研究提供一些有意義的見(jiàn)解。
(責(zé)任編輯:fqj)

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7843

    瀏覽量

    93500
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5611

    瀏覽量

    124668
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    計(jì)算機(jī)專業(yè)408考研科目

    408 跨考零基礎(chǔ):三個(gè)月入門(mén)精通路線 站在2026年的節(jié)點(diǎn)回望,計(jì)算機(jī)考研408(計(jì)算機(jī)學(xué)科專業(yè)基礎(chǔ)綜合)早已超越了單純的知識(shí)點(diǎn)考核,它更像是一場(chǎng)對(duì)邏輯思維與系統(tǒng)觀的深度洗禮。對(duì)于跨考且零基
    發(fā)表于 04-11 16:44

    虹科 owa5X 無(wú)線嵌入式計(jì)算機(jī) 工業(yè)級(jí)邊緣計(jì)算終端與車(chē)載網(wǎng)關(guān)優(yōu)選

    從工業(yè)級(jí)邊緣計(jì)算終端車(chē)載高性能邊緣計(jì)算網(wǎng)關(guān),從工業(yè)級(jí)嵌入式計(jì)算機(jī)
    的頭像 發(fā)表于 02-10 17:08 ?284次閱讀
    虹科 owa5X 無(wú)線嵌入式<b class='flag-5'>計(jì)算機(jī)</b> 工業(yè)<b class='flag-5'>級(jí)</b>邊緣<b class='flag-5'>計(jì)算</b>終端與車(chē)載網(wǎng)關(guān)優(yōu)選

    上海計(jì)算機(jī)視覺(jué)企業(yè)行學(xué)術(shù)沙龍走進(jìn)西井科技

    12月5日,由中國(guó)圖象圖形學(xué)學(xué)會(huì)青年工作委員會(huì)(下簡(jiǎn)稱“青工委”)、上海市計(jì)算機(jī)學(xué)會(huì)計(jì)算機(jī)視覺(jué)專委會(huì)(下簡(jiǎn)稱“專委會(huì)”)聯(lián)合主辦,上海西井科技股份有限公司、江蘇路街道商會(huì)承辦的“上海計(jì)算機(jī)
    的頭像 發(fā)表于 12-16 15:39 ?762次閱讀

    深圳中國(guó)首個(gè)光量子計(jì)算機(jī)制造工廠落成

    據(jù)央視新聞報(bào)道;在24日;深圳南山區(qū)國(guó)內(nèi)首個(gè)光量子計(jì)算機(jī)制造工廠正式進(jìn)入小規(guī)模生產(chǎn)階段,據(jù)悉該工廠是隸屬于玻色量子;總面積約5000平方米,集研發(fā)、制造、測(cè)試于一體,用于實(shí)現(xiàn)光量子計(jì)算機(jī)的工程化、標(biāo)準(zhǔn)化和規(guī)?;a(chǎn)。第一臺(tái)計(jì)算
    的頭像 發(fā)表于 11-25 17:17 ?2276次閱讀

    工控機(jī)與普通計(jì)算機(jī)的核心差異解析

    在工業(yè)自動(dòng)化和智能制造領(lǐng)域,計(jì)算機(jī)設(shè)備作為核心控制單元,其選擇直接影響整個(gè)系統(tǒng)的穩(wěn)定性與可靠性。工控機(jī)與普通計(jì)算機(jī)雖同屬計(jì)算設(shè)備,但其設(shè)計(jì)目標(biāo)、性能側(cè)重和應(yīng)用場(chǎng)景存在根本性差異。準(zhǔn)確理解這些差異,是進(jìn)行正確設(shè)備選型的基礎(chǔ)。
    的頭像 發(fā)表于 11-25 14:45 ?2030次閱讀
    工控機(jī)與普通<b class='flag-5'>計(jì)算機(jī)</b>的核心差異解析

    龍芯中科斬獲2025中國(guó)工業(yè)計(jì)算機(jī)大會(huì)兩項(xiàng)殊榮

    近日,2025中國(guó)工業(yè)計(jì)算機(jī)大會(huì)(CCF ICCC 2025)在云南昆明召開(kāi)。本次大會(huì)由中國(guó)計(jì)算機(jī)學(xué)會(huì)主辦,中國(guó)計(jì)算機(jī)學(xué)會(huì)工業(yè)控制計(jì)算機(jī)專委
    的頭像 發(fā)表于 11-10 17:35 ?820次閱讀

    2025中國(guó)計(jì)算機(jī)大會(huì)DPU技術(shù)論壇成功舉辦

    近日,備受矚目的第22屆中國(guó)計(jì)算機(jī)大會(huì)(CNCC2025)在哈爾濱開(kāi)幕。本屆大會(huì)注冊(cè)人數(shù)突破1.2萬(wàn)人,匯聚了來(lái)自全球計(jì)算機(jī)領(lǐng)域的頂尖學(xué)者、產(chǎn)業(yè)領(lǐng)袖、青年學(xué)子及國(guó)際組織代表。大會(huì)以“數(shù)智賦能、無(wú)限可能”為主題,旨在深度探討數(shù)字智能技術(shù)的前沿進(jìn)展與未來(lái)趨勢(shì),為推動(dòng)
    的頭像 發(fā)表于 11-02 09:29 ?925次閱讀

    摩爾線程亮相2025中國(guó)計(jì)算機(jī)大會(huì)

    10月23日至25日,第二十二屆中國(guó)計(jì)算機(jī)大會(huì)(CNCC2025)在哈爾濱成功舉辦。大會(huì)以“數(shù)智賦能,無(wú)限可能”為主題,匯聚了來(lái)自全球計(jì)算機(jī)領(lǐng)域的頂尖學(xué)者、產(chǎn)業(yè)領(lǐng)袖、青年學(xué)子及國(guó)際組織代表,共同探討
    的頭像 發(fā)表于 10-27 17:46 ?1258次閱讀

    NVIDIA DGX Spark桌面AI計(jì)算機(jī)開(kāi)啟預(yù)訂

    DGX Spark 現(xiàn)已開(kāi)啟預(yù)訂!麗臺(tái)科技作為 NVIDIA 授權(quán)分銷(xiāo)商,提供從產(chǎn)品服務(wù)的一站式解決方案,助力輕松部署桌面 AI 計(jì)算機(jī)。
    的頭像 發(fā)表于 09-23 17:20 ?1586次閱讀
    NVIDIA DGX Spark桌面AI<b class='flag-5'>計(jì)算機(jī)</b>開(kāi)啟預(yù)訂

    【作品合集】賽昉科技VisionFive 2單板計(jì)算機(jī)開(kāi)發(fā)板測(cè)評(píng)

    賽昉科技VisionFive 2單板計(jì)算機(jī)開(kāi)發(fā)板測(cè)評(píng)作品合集 產(chǎn)品介紹: 昉·星光 2是全球首款集成了3D GPU的高性能量產(chǎn)RISC-V單板計(jì)算機(jī),搭載昉·驚鴻-7110(型號(hào):JH-7110
    發(fā)表于 09-04 09:08

    工業(yè)計(jì)算機(jī)的重要性

    工業(yè)計(jì)算機(jī)對(duì)某些行業(yè)至關(guān)重要。我們將在下面詳細(xì)解釋這些行業(yè)中的工業(yè)計(jì)算機(jī)應(yīng)用。1.制造與工業(yè)自動(dòng)化工業(yè)級(jí)計(jì)算機(jī)非常適合制造工廠,特別是那些想要自動(dòng)化裝配過(guò)程的工廠。在這樣的環(huán)境中,工業(yè)
    的頭像 發(fā)表于 07-28 16:07 ?754次閱讀
    工業(yè)<b class='flag-5'>計(jì)算機(jī)</b>的重要性

    自動(dòng)化計(jì)算機(jī)經(jīng)過(guò)加固后有什么好處?

    -40℃的寒冷環(huán)境中運(yùn)行?C和溫度達(dá)到85℃的灼熱環(huán)境,這要?dú)w功于此類系統(tǒng)中使用的寬溫度組件和被動(dòng)冷卻技術(shù)。2.抗沖擊和振動(dòng)自動(dòng)化計(jì)算機(jī)是工業(yè)級(jí)計(jì)算機(jī),其設(shè)計(jì)和制造可
    的頭像 發(fā)表于 07-21 16:44 ?787次閱讀
    自動(dòng)化<b class='flag-5'>計(jì)算機(jī)</b>經(jīng)過(guò)加固后有什么好處?

    自動(dòng)化計(jì)算機(jī)的功能與用途

    工業(yè)自動(dòng)化是指利用自動(dòng)化計(jì)算機(jī)來(lái)控制工業(yè)環(huán)境中的流程、機(jī)器人和機(jī)械,以制造產(chǎn)品或其部件。工業(yè)自動(dòng)化的目的是提高生產(chǎn)率、增加靈活性,并提升制造過(guò)程的質(zhì)量。工業(yè)自動(dòng)化在汽車(chē)制造中體現(xiàn)得最為明顯,其中許多
    的頭像 發(fā)表于 07-15 16:32 ?936次閱讀
    自動(dòng)化<b class='flag-5'>計(jì)算機(jī)</b>的功能與用途

    工業(yè)計(jì)算機(jī)與商用計(jì)算機(jī)的區(qū)別有哪些

    能夠高效穩(wěn)定地運(yùn)行,減少停機(jī)時(shí)間,確保生產(chǎn)效率。那么工業(yè)計(jì)算機(jī)與普通商用計(jì)算機(jī)有哪些區(qū)別呢?一、組件選擇與制造質(zhì)量:工業(yè)級(jí)組件:使用更寬溫度范圍(如-20°C60
    的頭像 發(fā)表于 07-10 16:36 ?950次閱讀
    工業(yè)<b class='flag-5'>計(jì)算機(jī)</b>與商用<b class='flag-5'>計(jì)算機(jī)</b>的區(qū)別有哪些

    工業(yè)計(jì)算機(jī)如何設(shè)計(jì)用于沖擊和振動(dòng)

    工業(yè)計(jì)算機(jī)是為挑戰(zhàn)消費(fèi)級(jí)系統(tǒng)耐用性的環(huán)境而構(gòu)建的。在制造業(yè)、運(yùn)輸業(yè)、國(guó)防和采礦業(yè)等領(lǐng)域,計(jì)算機(jī)面臨著持續(xù)的沖擊、振動(dòng)和其他物理壓力。設(shè)計(jì)這些系統(tǒng)以在這種條件下保持可靠需要卓越的工程和創(chuàng)新技術(shù)。本文
    的頭像 發(fā)表于 05-19 15:27 ?641次閱讀
    工業(yè)<b class='flag-5'>計(jì)算機(jī)</b>如何設(shè)計(jì)用于沖擊和振動(dòng)
    林州市| 葫芦岛市| 庐江县| 太康县| 屏东市| 鹿泉市| 香格里拉县| 九台市| 读书| 平塘县| 安宁市| 东城区| 永顺县| 吉木萨尔县| 河池市| 灌云县| 许昌县| 简阳市| 长阳| 柳林县| 台北县| 安平县| 永登县| 南投县| 长岛县| 当阳市| 合肥市| 博罗县| 肥城市| 马尔康县| 昭觉县| 乌拉特中旗| 永城市| 临武县| 花莲县| 蓬安县| 盐城市| 杭锦旗| 天门市| 阿勒泰市| 克东县|