日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里讀唇AI幫助5億聽(tīng)障人士

汽車玩家 ? 來(lái)源:venturebeat ? 作者:venturebeat ? 2019-12-06 16:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

阿里又出黑科技。新的唇語(yǔ)閱讀 AI 系統(tǒng)在識(shí)別準(zhǔn)確率表現(xiàn)上不僅超越基線標(biāo)準(zhǔn),也優(yōu)于專家級(jí)人類水平,有望為全球近 5 億聽(tīng)障人士帶來(lái)福音。

阿里巴巴又出黑科技,AI 看唇語(yǔ)知內(nèi)容!

實(shí)際上,能夠從視頻中讀取嘴唇的 AI 和機(jī)器學(xué)習(xí)算法并沒(méi)有什么不同。早在 2016 年,來(lái)自 Google 和牛津大學(xué)的研究人員就詳細(xì)介紹了一種系統(tǒng),該系統(tǒng)可以 46.8% 的準(zhǔn)確度注釋視頻錄像,這個(gè)表現(xiàn)明顯優(yōu)于專業(yè)唇語(yǔ)識(shí)別人士 12.4% 準(zhǔn)確度。但是,即使是最先進(jìn)的系統(tǒng),也難以克服唇語(yǔ)識(shí)別時(shí)的歧義問(wèn)題,這使唇語(yǔ) AI 的性能一直難以超越音頻語(yǔ)音識(shí)別

為了追求更好的性能,浙江阿里巴巴公司和史蒂文斯理工學(xué)院的研究人員聯(lián)合設(shè)計(jì)了一種方法,稱為 LIBS,該方法利用從語(yǔ)音識(shí)別器中提取的特征作為唇語(yǔ)識(shí)別時(shí)的補(bǔ)充信息。研究人員表示,LIBS 系統(tǒng)在兩個(gè)基準(zhǔn)測(cè)試中都達(dá)到了業(yè)界領(lǐng)先的準(zhǔn)確度,在識(shí)別字符錯(cuò)誤率方面,LIBS 分別較基線性能高出 7.66% 和 2.75%。

LIBS 和其他類似的解決方案一樣,都可以幫助聽(tīng)障人士觀看缺少字幕的視頻。據(jù)估計(jì),全世界有 4.66 億人患有失能性聽(tīng)力障礙,約占世界人口的5%。根據(jù)世界衛(wèi)生組織的數(shù)據(jù),到 2050 年,這一數(shù)字可能會(huì)超過(guò) 9 億。

LIBS 會(huì)從說(shuō)話人的視頻中以多種不同尺度提取有用的音頻信息,包括序列級(jí)、上下文級(jí)和幀級(jí)。然后,系統(tǒng)會(huì)識(shí)別這些信息之間的對(duì)應(yīng)關(guān)系,將數(shù)據(jù)與視頻數(shù)據(jù)進(jìn)行對(duì)齊(由于開(kāi)頭或結(jié)尾有時(shí)會(huì)出現(xiàn)采樣率不一致、視頻和音頻序列的長(zhǎng)度不一致等情況),并利用過(guò)濾技術(shù)來(lái)優(yōu)化蒸餾功能。


LIBS 系統(tǒng)架構(gòu)示意圖

LIBS 的語(yǔ)音識(shí)別器和口語(yǔ)閱讀器組件均基于注意力的 seq2seq 體系結(jié)構(gòu),這是一種機(jī)器翻譯方法,可將序列的輸入(即音頻或視頻)映射到帶有標(biāo)簽的輸出和注意力值上。研究人員對(duì)上述內(nèi)容在 LRS2 和 CMLR 數(shù)據(jù)集上進(jìn)行了訓(xùn)練,LRS2 包含來(lái)自 BBC 的 45000 多個(gè)口語(yǔ)句子,CMLR 則是最大的中文普通話口語(yǔ)語(yǔ)料庫(kù),包括了來(lái)自中國(guó)網(wǎng)絡(luò)電視臺(tái)網(wǎng)站的 10 萬(wàn)余個(gè)自然句(包括 3000 多個(gè)漢字和 20000 多個(gè)短語(yǔ))。

不過(guò),研究團(tuán)隊(duì)也表示,由于某些句子長(zhǎng)度太短,該模型難以在 LRS2 數(shù)據(jù)集上實(shí)現(xiàn)“合理的”結(jié)果。(解碼器從少于 14 個(gè)字符的句子中提取相關(guān)信息時(shí)會(huì)遇到困難。)但是,一旦對(duì)最大長(zhǎng)度為 16 個(gè)單詞的句子進(jìn)行了預(yù)訓(xùn)練,解碼器將可以通過(guò)對(duì)上下文級(jí)別的知識(shí)進(jìn)行設(shè)置,提高 LRS2 數(shù)據(jù)中句子結(jié)尾部分的質(zhì)量。

研究人員在描述其工作的論文中寫(xiě)道:“ LIBS 減少了對(duì)無(wú)關(guān)框架的關(guān)注。” “幀級(jí)知識(shí)提煉進(jìn)一步提高了視頻幀特征的可分辨性,使注意力更加集中?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41370

    瀏覽量

    302741
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1825

    瀏覽量

    116257
  • 阿里
    +關(guān)注

    關(guān)注

    6

    文章

    468

    瀏覽量

    34239
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    3800AI Infra!阿里CEO:AGI只是階段,ASI才是終極目標(biāo)!

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)“大模型是下一代的操作系統(tǒng),阿里選擇將通義千問(wèn)打造成AI時(shí)代的安卓系統(tǒng)” “AI將會(huì)替代能源的地位,成為最重要的商品” “正如電曾經(jīng)放大了人類物理力量的杠桿,ASI將
    的頭像 發(fā)表于 09-25 10:14 ?8640次閱讀
    3800<b class='flag-5'>億</b>投<b class='flag-5'>AI</b> Infra!<b class='flag-5'>阿里</b>CEO:AGI只是階段,ASI才是終極目標(biāo)!

    阿里放大招:自研AI芯片100%國(guó)產(chǎn),不用臺(tái)積電代工

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 吳子鵬)8 月 31 日晚間,有消息稱阿里云通義千問(wèn)大模型面臨算力缺口,阿里緊急追加寒武紀(jì)思元 370 芯片訂單至 15 萬(wàn)片。然而,該消息隨后不久便被阿里云相關(guān)人士
    的頭像 發(fā)表于 09-03 09:17 ?1.2w次閱讀

    騰訊阿里聯(lián)手投資DeepSeek:估值飆升背后的AI資本博弈

    2026年4月23日,科技圈掀起資本巨浪——騰訊控股與阿里巴巴集團(tuán)正就投資AI初創(chuàng)公司DeepSeek展開(kāi)深度洽談,若交易達(dá)成,這家成立僅三年的企業(yè)估值將突破200美元,較五日前市場(chǎng)傳聞的100
    的頭像 發(fā)表于 04-24 09:11 ?910次閱讀

    AI加速騰訊、阿里業(yè)績(jī)?cè)鲩L(zhǎng)!平頭哥自研GPU年?duì)I收達(dá)百億級(jí)規(guī)模

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,騰訊、阿里先后公布最新財(cái)報(bào),在AI驅(qū)動(dòng)下,二者均交出亮眼成績(jī)。2025年,騰訊全年收入達(dá)7517.66元人民幣,同比增長(zhǎng)14%;經(jīng)營(yíng)盈利2415.62
    的頭像 發(fā)表于 03-21 08:14 ?1.4w次閱讀

    阿里自研AI芯片“真武”亮相 “通云哥”黃金三角浮出水面

    1月29日上午,平頭哥官網(wǎng)悄然上線一款名為“真武810E”的高端AI芯片,此前被央視《新聞聯(lián)播》曝光的阿里自研芯片PPU正式亮相。這是通義實(shí)驗(yàn)室、阿里云和平頭哥組成的阿里巴巴
    的頭像 發(fā)表于 01-29 09:42 ?726次閱讀
    <b class='flag-5'>阿里</b>自研<b class='flag-5'>AI</b>芯片“真武”亮相 “通云哥”黃金三角浮出水面

    比Google更快!阿里千問(wèn)率先推出AI購(gòu)物、點(diǎn)外賣,全面打通阿里生態(tài)

    1月15日,在阿里千問(wèn)產(chǎn)品迭代發(fā)布會(huì)上,阿里巴巴集團(tuán)副總裁、阿里千問(wèn)C端事業(yè)群總裁吳嘉宣布,阿里千問(wèn)App宣布全面接入淘寶、支付寶、淘寶閃購(gòu)、飛豬、高德等
    的頭像 發(fā)表于 01-15 14:39 ?1.2w次閱讀
    比Google更快!<b class='flag-5'>阿里</b>千問(wèn)率先推出<b class='flag-5'>AI</b>購(gòu)物、點(diǎn)外賣,全面打通<b class='flag-5'>阿里</b>生態(tài)

    新大陸NLS Soldier300N工業(yè)碼器:AI賦能工業(yè)碼新標(biāo)桿

    在工業(yè)自動(dòng)化浪潮下,高效精準(zhǔn)的碼需求日益迫切,新大陸NLSSoldier300N工業(yè)碼器作為一款性能卓越的AI智能讀碼器,正以強(qiáng)大實(shí)力重塑工業(yè)碼場(chǎng)景。這款工業(yè)級(jí)固定掃碼器憑借前沿
    的頭像 發(fā)表于 01-14 14:31 ?420次閱讀
    新大陸NLS Soldier300N工業(yè)<b class='flag-5'>讀</b>碼器:<b class='flag-5'>AI</b>賦能工業(yè)<b class='flag-5'>讀</b>碼新標(biāo)桿

    國(guó)內(nèi)首款AI助盲眼鏡發(fā)布,1700萬(wàn)視人士的新眼睛

    在國(guó)際殘疾人日(12 月 3 日)這一天,杭州瞳行科技公司正式發(fā)布國(guó)內(nèi)首款 AI 助盲眼鏡。該眼鏡由眼鏡主體、手機(jī)、遙控指環(huán)、盲杖四部分組成,目前已正式面市。
    的頭像 發(fā)表于 12-05 20:19 ?2754次閱讀
    國(guó)內(nèi)首款<b class='flag-5'>AI</b>助盲眼鏡發(fā)布,1700萬(wàn)視<b class='flag-5'>障</b><b class='flag-5'>人士</b>的新眼睛

    中國(guó)電信與阿里簽署戰(zhàn)略合作協(xié)議 發(fā)力云和AI基礎(chǔ)設(shè)施

    煌妹代表雙方簽訂協(xié)議。 據(jù)悉,中國(guó)電信與阿里巴巴將在云和AI基礎(chǔ)設(shè)施、新型服務(wù)業(yè)電商、社會(huì)價(jià)值創(chuàng)新等領(lǐng)域展開(kāi)深入合作。 ?
    的頭像 發(fā)表于 08-31 20:16 ?1421次閱讀

    大家都在用什么AI軟件?有沒(méi)有好用的免費(fèi)的AI軟件推薦一下?

    大家都在用什么AI軟件?有沒(méi)有好用的免費(fèi)的AI軟件推薦一下?直接發(fā)個(gè)安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    發(fā)表于 07-09 18:30

    AI大模型加速上車,聯(lián)手高通,阿里有哪些策略?

    系列模型衍生數(shù)量超Llama,三大方向形成 阿里巴巴的“AI大模型” 通義千問(wèn)大模型最初于2023年4月7日開(kāi)始邀請(qǐng)測(cè)試,并在2023年4月11日的阿里云峰會(huì)上正式揭曉。徐棟在會(huì)議上提及,阿里
    的頭像 發(fā)表于 07-03 01:10 ?9332次閱讀
    <b class='flag-5'>AI</b>大模型加速上車,聯(lián)手高通,<b class='flag-5'>阿里</b>有哪些策略?

    阿里2025財(cái)年業(yè)績(jī):凈利潤(rùn)大漲77%,AI+云業(yè)務(wù)攬下千億收入

    (電子發(fā)燒友網(wǎng)綜合報(bào)道)6月26日,阿里巴巴發(fā)布了2025財(cái)年年報(bào):2025財(cái)年,阿里巴巴營(yíng)收達(dá)到9963.47元,同比增長(zhǎng)6%;凈利潤(rùn)達(dá)到1259.76元,同比大增長(zhǎng)77%,創(chuàng)下
    的頭像 發(fā)表于 06-28 00:10 ?9231次閱讀
    <b class='flag-5'>阿里</b>2025財(cái)年業(yè)績(jī):凈利潤(rùn)大漲77%,<b class='flag-5'>AI</b>+云業(yè)務(wù)攬下千億收入

    安森美展示專業(yè)數(shù)字助聽(tīng)器和OTC輔聽(tīng)設(shè)備解決方案

    隨著國(guó)內(nèi)老齡化程度加劇以及對(duì)聽(tīng)群體關(guān)懷的日益增強(qiáng),功能更強(qiáng)大、體驗(yàn)更人性化的助聽(tīng)器正加速進(jìn)入市場(chǎng)。智研咨詢公開(kāi)資料顯示,當(dāng)前我國(guó)助聽(tīng)器市場(chǎng)規(guī)模已達(dá)約65元。展望未來(lái),隨著聽(tīng)
    的頭像 發(fā)表于 06-17 16:55 ?1759次閱讀
    安森美展示專業(yè)數(shù)字助聽(tīng)器和OTC輔<b class='flag-5'>聽(tīng)</b>設(shè)備解決方案

    【「零基礎(chǔ)開(kāi)發(fā)AI Agent」閱讀體驗(yàn)】+《零基礎(chǔ)開(kāi)發(fā)AI Agent》掌握扣子平臺(tái)開(kāi)發(fā)智能體方法

    儲(chǔ)備。然后介紹AI Agen的主流平臺(tái),接著說(shuō)明了扣子平臺(tái)開(kāi)發(fā)AI Agent的流程和策略,然后對(duì)其插件、工作流、圖像流、知識(shí)庫(kù)等功能模塊進(jìn)行了詳細(xì)概述。并就5大場(chǎng)景,11個(gè)開(kāi)發(fā)案例分別從功能,使用場(chǎng)
    發(fā)表于 05-14 19:51

    阿里稱要把AI融入每一塊業(yè)務(wù) 蔡崇信稱電商和云+AI是方向

    阿里和馬云的消息總是被人關(guān)注,前幾天還有爆料稱馬云即將回歸阿里,后來(lái)被馬云辟謠。 現(xiàn)在我們看到一個(gè)關(guān)于阿里AI的消息,在第21個(gè)“阿里日”;
    的頭像 發(fā)表于 05-12 15:32 ?1046次閱讀
    环江| 平湖市| 枞阳县| 光山县| 济阳县| 祁东县| 富裕县| 会东县| 永顺县| 元阳县| 古交市| 肃南| 芮城县| 龙岩市| 石棉县| 大方县| 边坝县| 灌云县| 遵化市| 丹棱县| 梧州市| 九江市| 华阴市| 襄樊市| 新巴尔虎右旗| 井研县| 原平市| 来安县| 博爱县| 和平区| 邵东县| 织金县| 太保市| 临潭县| 高清| 龙岩市| 开化县| 阿拉善右旗| 南江县| 蕲春县| 木兰县|