日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

聚焦語(yǔ)音 AI:在 AR 眼鏡上可視化語(yǔ)音和聲音

NVIDIA英偉達(dá) ? 來(lái)源:未知 ? 2023-07-26 19:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

音頻可以包含從人類(lèi)語(yǔ)言到非語(yǔ)言聲音等各種聲音,例如狗吠和警笛聲。在為聽(tīng)力困難的人設(shè)計(jì)無(wú)障礙應(yīng)用程序時(shí),該應(yīng)用程序應(yīng)能夠識(shí)別聲音并理解語(yǔ)義。

這種技術(shù)將有助于聾啞或聽(tīng)力有障礙的人可視化語(yǔ)音,例如人類(lèi)的對(duì)話(huà)和非語(yǔ)音聲音。通過(guò)將語(yǔ)音和聲音 AI 相結(jié)合,可以將這些可視化效果疊加到 AR 眼鏡上,從而使用戶(hù)能夠看到并理解他們無(wú)法聽(tīng)到的聲音。

根據(jù)世界衛(wèi)生組織的統(tǒng)計(jì),約有 15 億人(占全球人口近 20%)患有聽(tīng)力損失。到 2050 年,這一數(shù)字將上升至 25 億。

Cochl 是 NVIDIA 的合作伙伴,總部位于圣何塞。該公司是一家利用聲音 AI 技術(shù)來(lái)理解各類(lèi)音頻的科技密集型初創(chuàng)企業(yè)。他同時(shí)也是 NVIDIA 初創(chuàng)加速計(jì)劃的會(huì)員。通過(guò)提供尖端技術(shù)和 NVIDIA 專(zhuān)家的支持,該計(jì)劃幫助初創(chuàng)企業(yè)更快地構(gòu)建解決方案。

該平臺(tái)可識(shí)別 37 種環(huán)境聲音,并且 CochI 還加入了先進(jìn)的語(yǔ)音轉(zhuǎn)文本技術(shù),使用戶(hù)能夠真正全方位地了解聲音世界。

AR 眼鏡可視化任何聲音

AR 眼鏡作為一個(gè)可視化聲音的工具,有望極大改善聽(tīng)力損失者的生活。這項(xiàng)技術(shù)可以幫助提高他們的交流能力,使他們更容易理解和融入到周?chē)氖澜纭?/p>

Cochl.Sense 和 NVIDIA Riva 在微軟 HoloLens 2 上運(yùn)行!

在此方案中,自動(dòng)語(yǔ)音識(shí)別(ASR)使眼鏡能夠識(shí)別并理解人類(lèi)的語(yǔ)音。這項(xiàng)技術(shù)可通過(guò)多種方式集成到眼鏡中:

  • 使用麥克風(fēng)捕捉與聾啞人或聽(tīng)力有障礙者交談的人的語(yǔ)音,然后使用 ASR 算法解釋語(yǔ)音并將其轉(zhuǎn)錄為文本,最后將該文本顯示在眼鏡上,從而使聾啞人或聽(tīng)力有障礙者能夠閱讀并理解該語(yǔ)音。

  • ASR 還可以使眼鏡能夠響應(yīng)語(yǔ)音命令,以便用戶(hù)可以通過(guò)語(yǔ)音控制眼鏡。

  • AR 眼鏡還能在屏幕上顯示所有對(duì)話(huà)(例如在駕車(chē)時(shí)轉(zhuǎn)錄地圖上的語(yǔ)音指示)以及其他聲音(例如緊急車(chē)輛的喇叭聲、警報(bào)聲以及風(fēng)聲)。

解決方案背后的技術(shù)

Cochl 在其軟件堆棧中使用了 NVIDIA Riva 來(lái)增強(qiáng)其 ASR 功能。Riva 是一個(gè)使用 GPU 加速、完全可定制的 SDK,用于開(kāi)發(fā)語(yǔ)音 AI 的應(yīng)用程序。通過(guò)使用 Riva,該平臺(tái)的功能得以擴(kuò)展,能夠理解包括非語(yǔ)音聲音在內(nèi)的各種聲音。

Cochl 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Yoonchang Han 表示:“我們測(cè)試了很多語(yǔ)音識(shí)別服務(wù),但只有 Riva 提供了極高且穩(wěn)定的實(shí)時(shí)性能。所以現(xiàn)在我們可以讓我們的聲音 AI 系統(tǒng)更加接近人類(lèi)的聽(tīng)覺(jué)感知?!?/p>

“正如我們所觀(guān)察到的,AR 眼鏡最有可能在環(huán)境嘈雜的開(kāi)放空間中使用。NVIDIA Riva 幫助我們?cè)卩须s的環(huán)境中也能準(zhǔn)確轉(zhuǎn)錄語(yǔ)音,并為我們提供了無(wú)縫體驗(yàn),可以集成到我們的 Cochl.Sense 平臺(tái)上?!?/p>

輔助技術(shù)的未來(lái)

創(chuàng)建一個(gè)能像人類(lèi)一樣感知聲音的通用 AI 系統(tǒng)是一項(xiàng)巨大的挑戰(zhàn)。為了使 AR 眼鏡更易于使用,需要更輕便的可穿戴技術(shù)。

盡管它們?nèi)匀皇菍⒙曇艉驼Z(yǔ)音轉(zhuǎn)化為視覺(jué)信息的理想媒介。通過(guò)集成機(jī)器聽(tīng)覺(jué)功能,AR 眼鏡能夠?yàn)槭澜绺鞯氐拿@啞或聽(tīng)力障礙者帶來(lái)更加安全、便捷和愉快的日常生活體驗(yàn)。

Cochl 還在探索語(yǔ)音 AI 的更多用例,例如為 AR 眼鏡上的任何視頻提供隱藏式字幕和實(shí)現(xiàn)多個(gè)發(fā)言者的轉(zhuǎn)錄。為了給聽(tīng)力障礙者帶來(lái)最佳體驗(yàn),該公司正在探索分析并可視化音樂(lè)的方法,以幫助他們至少能夠理解音樂(lè)的類(lèi)型和情感。

該公司期待體驗(yàn)更多的 NVIDIA 解決方案,包括 Riva、NVIDIA NeMo 和 NVIDIA TensorRT。

點(diǎn)擊“閱讀原文”,或掃描下方海報(bào)二維碼,在 8 月 8日聆聽(tīng)NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 SIGGRAPH 現(xiàn)場(chǎng)發(fā)表的 NVIDIA 主題演講,了解 NVIDIA 的新技術(shù),包括屢獲殊榮的研究,OpenUSD 開(kāi)發(fā),以及最新的 AI 內(nèi)容創(chuàng)作解決方案。


原文標(biāo)題:聚焦語(yǔ)音 AI:在 AR 眼鏡上可視化語(yǔ)音和聲音

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4116

    瀏覽量

    99655

原文標(biāo)題:聚焦語(yǔ)音 AI:在 AR 眼鏡上可視化語(yǔ)音和聲音

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Moonix AI眼鏡全球首發(fā):語(yǔ)音交互與智能助手引領(lǐng)未來(lái)

    Moonix公司于2026年4月29日正式發(fā)布全球首款AI眼鏡,標(biāo)志著智能穿戴設(shè)備正式邁入“語(yǔ)音交互+智能助手”的新紀(jì)元。這款名為Moonix AI Glasses的產(chǎn)品,以“讓科技融
    的頭像 發(fā)表于 04-29 09:46 ?1302次閱讀

    《2024工業(yè)AR質(zhì)量檢測(cè)方案橫評(píng):5大主流工具深度對(duì)比》

    標(biāo)準(zhǔn)等數(shù)字信息實(shí)時(shí)疊加到真實(shí)生產(chǎn)場(chǎng)景中,實(shí)現(xiàn)\"虛實(shí)融合\"的可視化檢測(cè)。其核心優(yōu)勢(shì)包括: 可視化精準(zhǔn)指導(dǎo) :操作員通過(guò)AR眼鏡或平板設(shè)備實(shí)時(shí)看到檢測(cè)標(biāo)準(zhǔn)、圖紙對(duì)比和缺陷提示,顯著
    發(fā)表于 04-27 10:42

    語(yǔ)音芯片怎么樣寫(xiě)入聲音?一文講透語(yǔ)音播放芯片的聲音寫(xiě)入之道

    如果說(shuō)芯片是電子產(chǎn)品的“大腦”,那么語(yǔ)音芯片就是賦予設(shè)備“聲音靈魂”的關(guān)鍵元器件。從商場(chǎng)迎賓器、電動(dòng)車(chē)報(bào)警器,到智能門(mén)鎖、醫(yī)療設(shè)備,凡是需要“開(kāi)口說(shuō)話(huà)”的設(shè)備,內(nèi)部都藏著一顆或多顆能將數(shù)字信號(hào)轉(zhuǎn)化
    的頭像 發(fā)表于 04-24 10:04 ?125次閱讀
    <b class='flag-5'>語(yǔ)音</b>芯片怎么樣寫(xiě)入<b class='flag-5'>聲音</b>?一文講透<b class='flag-5'>語(yǔ)音</b>播放芯片的<b class='flag-5'>聲音</b>寫(xiě)入之道

    485AI語(yǔ)音識(shí)別模塊:多路語(yǔ)音控制,實(shí)現(xiàn)安防設(shè)備語(yǔ)音聯(lián)動(dòng)

    485AI語(yǔ)音識(shí)別模塊憑借工業(yè)級(jí)的RS485總線(xiàn)通信與離線(xiàn)/在線(xiàn)AI語(yǔ)音識(shí)別能力,應(yīng)用場(chǎng)景非常廣泛,粗略劃分可覆蓋超10大領(lǐng)域、數(shù)十種細(xì)分場(chǎng)景,核心集中
    的頭像 發(fā)表于 04-22 15:17 ?147次閱讀

    語(yǔ)音識(shí)別芯片介紹,語(yǔ)音識(shí)別芯片工作原理解析

    智能交互不斷深入的今天,語(yǔ)音識(shí)別芯片正成為眾多設(shè)備實(shí)現(xiàn)語(yǔ)音控制與AI對(duì)話(huà)的關(guān)鍵部件。語(yǔ)音芯片廣義
    的頭像 發(fā)表于 04-01 16:26 ?254次閱讀

    3D系統(tǒng)可視化

    本身的深入描述和F-Theta透鏡的應(yīng)用示例。 光學(xué)系統(tǒng)的3D-可視化 VirtualLab Fusion提供的工具可以實(shí)現(xiàn)光學(xué)系統(tǒng)的3D可視化,因此可以用于檢查元件的位置,以及快速了解系統(tǒng)內(nèi)部的光
    發(fā)表于 03-30 09:25

    可視化特點(diǎn)在AR遠(yuǎn)程協(xié)助方面的重要意義

    傳遞仍存在“理解偏差”“操作延遲”等問(wèn)題。 ?而當(dāng)增強(qiáng)現(xiàn)實(shí)(AR)技術(shù)融入遠(yuǎn)程協(xié)助場(chǎng)景后,信息傳遞方式發(fā)生了質(zhì)的變化。通過(guò)可視化呈現(xiàn),專(zhuān)家能夠?qū)⒉僮髦噶?、結(jié)構(gòu)模型、標(biāo)注信息、工藝參數(shù)以三維圖像的形式直接疊加在現(xiàn)
    的頭像 發(fā)表于 03-23 15:13 ?202次閱讀

    KubePi:開(kāi)源Kubernetes可視化管理面板,讓集群管理如此簡(jiǎn)單

    KubePi:開(kāi)源Kubernetes可視化管理面板,讓集群管理如此簡(jiǎn)單 云原生時(shí)代,Kubernetes已成為容器編排的事實(shí)標(biāo)準(zhǔn),但其復(fù)雜性卻讓許多開(kāi)發(fā)者望而卻步。KubePi作為一款現(xiàn)代
    發(fā)表于 02-11 12:53

    可視化AR巡檢:工業(yè)智能發(fā)展的新引擎

    一背景下,可視化AR巡檢應(yīng)運(yùn)而生,它將AR術(shù)與可視化數(shù)據(jù)分析能力相結(jié)合,讓巡檢工作變得更直觀(guān)、更智能、更高效。 ?AR巡檢的最大特征在于“虛
    的頭像 發(fā)表于 02-02 21:17 ?194次閱讀

    語(yǔ)音識(shí)別IC分類(lèi),語(yǔ)音識(shí)別芯片的工作原理

    語(yǔ)音識(shí)別芯片,也叫語(yǔ)音識(shí)別集成電路,是一種集聲音存儲(chǔ)、播放、錄音及語(yǔ)音識(shí)別功能于一體的專(zhuān)用芯片。語(yǔ)音識(shí)別IC的核心功能在于實(shí)現(xiàn)
    的頭像 發(fā)表于 01-14 15:22 ?427次閱讀
    <b class='flag-5'>語(yǔ)音</b>識(shí)別IC分類(lèi),<b class='flag-5'>語(yǔ)音</b>識(shí)別芯片的工作原理

    谷東智能AI+AR眼鏡重塑手術(shù)遠(yuǎn)程協(xié)作標(biāo)準(zhǔn)

    醫(yī)療領(lǐng)域,每一臺(tái)手術(shù)的安全邊界都需要精準(zhǔn)把控,而遠(yuǎn)程協(xié)作中的信息差,曾是制約手術(shù)安全的關(guān)鍵瓶頸。近期,谷東智能 C2000 AI+AR 眼鏡畢節(jié) - 杭州跨域手術(shù)中交出亮眼答卷 —
    的頭像 發(fā)表于 12-19 14:31 ?763次閱讀

    AR智能眼鏡定制_ar眼鏡PCBA硬件設(shè)計(jì)與AI賦能

    隨著增強(qiáng)現(xiàn)實(shí)(AR)技術(shù)的快速發(fā)展,AR智能眼鏡成為了科技領(lǐng)域的熱門(mén)方向。設(shè)計(jì)和開(kāi)發(fā)一款優(yōu)秀的AR智能眼鏡,需要綜合考慮硬件選型、功能集成以
    的頭像 發(fā)表于 11-05 20:27 ?930次閱讀
    <b class='flag-5'>AR</b>智能<b class='flag-5'>眼鏡</b>定制_<b class='flag-5'>ar</b><b class='flag-5'>眼鏡</b>PCBA硬件設(shè)計(jì)與<b class='flag-5'>AI</b>賦能

    AR/AI眼鏡行業(yè)的未來(lái)趨勢(shì)

    2025年被稱(chēng)為百鏡大戰(zhàn)元年,AR(增強(qiáng)現(xiàn)實(shí))和AI(人工智能)眼鏡領(lǐng)域風(fēng)起云涌,眾多科技巨頭和創(chuàng)新企業(yè)紛紛推出智能眼鏡產(chǎn)品。
    的頭像 發(fā)表于 07-14 16:15 ?2031次閱讀

    成都匯陽(yáng)投資關(guān)于芯片+AI 眼鏡核心公司

    視覺(jué)圖像, 實(shí)現(xiàn)流暢交互體驗(yàn)。其低功耗特性也至關(guān)重要, 可延長(zhǎng) AI 眼鏡續(xù)航, 保障長(zhǎng)時(shí)間使用。市場(chǎng)中一些公司同時(shí)布局芯片與 AI 眼鏡領(lǐng)域。它們能依據(jù)
    的頭像 發(fā)表于 07-01 09:28 ?1285次閱讀

    結(jié)構(gòu)可視化:利用數(shù)據(jù)編輯器剖析數(shù)據(jù)內(nèi)在架構(gòu)?

    結(jié)構(gòu)可視化聚焦于展示數(shù)據(jù)的內(nèi)部結(jié)構(gòu)和各部分之間的關(guān)系,使企業(yè)能夠深入理解數(shù)據(jù)的組織方式和層次體系,從而更好地進(jìn)行數(shù)據(jù)管理和分析。通過(guò)結(jié)構(gòu)可視化,企業(yè)可以清晰地看到數(shù)據(jù)的層次結(jié)構(gòu)、關(guān)聯(lián)關(guān)系以及數(shù)據(jù)流
    的頭像 發(fā)表于 05-07 18:42 ?955次閱讀
    九龙县| 岳普湖县| 伊金霍洛旗| 离岛区| 舒城县| 临漳县| 福安市| 衡南县| 桐梓县| 陇川县| 梁平县| 富平县| 马尔康县| 临湘市| 阿城市| 延边| 修武县| 桐庐县| 杭锦旗| 十堰市| 保亭| 庆元县| 盐山县| 祁门县| 黄山市| 汨罗市| 罗甸县| 阳高县| 太谷县| 呼玛县| 宜阳县| 永平县| 西林县| 冷水江市| 临泽县| 喜德县| 平江县| 普兰店市| 三河市| 荣成市| 长宁区|