日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

語音AI機器人的低代碼構建塊

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-10-12 09:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在研究復雜的語音人工智能機器人系統(tǒng)時,開發(fā)人員很容易被其復雜性嚇倒。亞瑟· C ·克拉克聲稱:“任何足夠先進的技術都無法與魔法區(qū)分開來?!?/p>

從接受自然語言命令到安全地與環(huán)境和周圍的人實時交互,當今的語音人工智能機器人系統(tǒng)可以執(zhí)行以前機器無法完成的任務。加入谷歌、 Meta 、 NVIDIA 等公司的專家,參加第一屆年度 NVIDIA -Speech AI 峰會。 立即注冊

以 Spot 為例,它是一個支持語音 AI 的機器人,可以自己取飲料。為了方便地添加語音 AI 技能,例如 自動語音識別 ( ASR )或文本到語音( TTS ),許多開發(fā)人員在構建復雜的機器人系統(tǒng)時使用更簡單的低代碼構建塊。

圖 1.Spot ,一只機器狗,在使用 NVIDIA Riva 提供的 ASR 和 TTS 技能處理訂單后,實時獲取飲料。

對于開發(fā)具有語音 AI 技能的機器人應用程序的開發(fā)人員,本文將分解 NVIDIA Riva SDK 提供的低代碼構建塊。

通過跟隨所提供的代碼示例,您將了解 speech AI 技術 如何使智能機器人能夠接受食物訂單,將這些訂單轉發(fā)給餐廳員工,并最終在提示時導航回家。

使用構建塊設計 AI 機器人系統(tǒng)

復雜系統(tǒng)由幾個構建塊組成。每個構建塊都很容易理解。

當您了解每個組件的功能時,最終產品就不那么令人畏懼了。如果您使用的是低代碼構建塊,那么現(xiàn)在可以專注于需要更多努力的特定于域的定制。

我們的最新項目使用了“ Spot ”,一個四足機器人和一個 NVIDIA Jetson Orin ,通過以太網電纜連接到 Spot 。該項目是使用 AI 構建塊形成復雜語音 AI 機器人系統(tǒng)的主要示例。

poYBAGNGFwiAWOYAAAFdWqgqCkg383.png

Figure 2. 帶有 Riva 低代碼語音 AI 塊的語音 AI 機器人系統(tǒng),可添加 ASR 和 TTS 技能

我們的目標是建造一個機器人,它可以在我們盡可能少的干預下,自己從當?shù)氐牟蛷d為我們取零食。我們還著手使用開源庫和工具編寫盡可能少的代碼。這個項目中使用的幾乎所有軟件都是免費的。

為了實現(xiàn)這一目標,人工智能系統(tǒng)必須能夠與人類進行語音交互,感知其環(huán)境(在我們的例子中,使用嵌入式攝像頭),并安全地在環(huán)境中導航。圖 2 顯示了交互、平臺和導航如何表示 Spot 機器人的三個基本操作組件,以及這些組件如何進一步細分為低代碼構建塊。

本文只關注 Riva SDK 中的人機交互塊。

使用 Riva 添加語音識別和語音合成技能

我們每天都與人們進行如此多的互動,以至于我們很容易忽視這些互動到底有多復雜。說話對人類來說很自然,但對于智能機器來說,理解和說話并不是那么簡單。

Riva 是一個完全可定制的 GPU 加速語音 AI SDK ,可處理 ASR 和 TTS 技能,可部署在本地、所有云端、邊緣和嵌入式設備上。它有助于人機語音交互。

Riva 完全在 Spot 機器人上本地運行。因此,處理是安全的,不需要互聯(lián)網訪問。它也可以用一個簡單的參數(shù)文件完全配置,因此不需要額外的編碼。

Riva 每個語音 AI 任務的代碼示例

Riva 提供了 現(xiàn)成的 Python 代碼 和命令行工具,用于將麥克風捕獲的音頻數(shù)據(jù)實時轉換為文本( ASR 、語音識別或語音到文本),并將文本轉換為音頻輸出( TTS 或語音合成)。

修改這些腳本以與開放式機器人技術( ROS )兼容,只需稍作改動。這有助于簡化機器人系統(tǒng)開發(fā)過程。

ASR 自定義

Riva OOTB Python 客戶端 ASR 腳本名為 transcribe_mic.py 。默認情況下,它將 ASR 輸出打印到終端。通過修改它, ASR 輸出被路由到一個 ROS topic 和可以被 ROS 網絡中的任何內容讀取。以下代碼示例顯示了對腳本 main ()函數(shù)的關鍵添加:

   inter_pub = rospy.Publisher('intermediate', String, queue_size=10)
   final_pub = rospy.Publisher('final', String, queue_size=10)
   rospy.init_node('riva_asr', anonymous=True)

以下代碼示例包括對 main 的更關鍵的添加:

       for response in responses:
           if not response.results:
               continue
           partial_transcript = ""
           for result in response.results:
               if not result.alternatives:
                   continue
               transcript = result.alternatives[0].transcript
               if result.is_final:
                   for i, alternative in enumerate(result.alternatives):
                       final_pub.publish(alternative.transcript)
              else:
                  partial_transcript += transcript
           if partial_transcript:
               inter_pub.publish(partial_transcript)

TTS 自定義

Riva 還為 TTS 提供了 talk.py 腳本。默認情況下,您在終端或 Python 解釋器中輸入文本, Riva 從中生成音頻輸出。對于 Spot 來說, input text talk.py script 已被修改 使文本來自 ROS 回調,而不是人類的擊鍵。 OOTB 腳本的關鍵更改包括用于提取文本的功能:

def callback(msg):
   global TTS
   TTS = msg.data

它們還包括對 main ()函數(shù)的以下添加:

   rospy.init_node('riva_tts', anonymous=True)
   rospy.Subscriber("speak", String, callback)

main ()函數(shù)中這些經過修改的條件語句也是關鍵:

       while not rospy.is_shutdown():
           if TTS != None:
               text = TTS

語音交互腳本

像 voice_control.py 這樣的簡單腳本主要由回調和通話功能組成。他們告訴 Spot 要聽什么單詞以及如何回應。

def callback(msg):
   global pub, order
   rospy.loginfo(msg.data)
   if "hey spot" in msg.data.lower() and "fetch me" in msg.data.lower():
       order_start = msg.data.index("fetch me")
       order = msg.data[order_start + 9:]
       pub.publish("Fetching " + order)

def talker():
   global pub
   rospy.init_node("spot_voice_control", anonymous=True)
   pub = rospy.Publisher("speak", String, queue_size=10)
   rospy.Subscriber("final", String, callback)
   rospy.spin()

換言之,如果文本包含“嘿, Spot ,…給我拿…”, Spot 會將句子的其余部分保存為命令。在 ASR 記錄表明句子結束后, Spot 激活 TTS 客戶端并背誦單詞“ Fetching ”加上訂單內容。然后,其他腳本會讓 ROS 動作服務器指示 Spot 導航到餐廳,同時注意避開汽車和其他障礙物。

當 Spot 到達餐廳時,它會等待一個人說“你好, Spot ”來接受訂單。如果 ASR 分析腳本檢測到這一序列, Spot 會背誦訂單并以“請”結尾。餐廳員工將訂購的食物和任何零錢放在 Spot 背后的適當容器中。在 Riva ASR 意識到餐廳員工說“回家吧, Spot ”后, Spot 回家了

類似 Riva 的語音 AI SDK 背后的技術用于構建和部署完全可定制的實時語音 AI 應用程序,這些應用程序可部署在本地、所有云端、邊緣和嵌入式環(huán)境中,將 AI 機器人帶入現(xiàn)實世界。

當機器人與人無縫交互時,它開辟了一個新的領域,機器人可以在這個領域提供幫助,而無需技術人員在計算機上進行翻譯。

使用低代碼解決方案部署您自己的語音 AI 機器人

通常, NVIDIA 、 Open Robotics 和機器人社區(qū)等團隊在解決語音 AI 和機器人問題以及為日常機器人用戶提供和訪問該技術方面做了出色的工作。

任何渴望進入該行業(yè)或改進現(xiàn)有技術的人都可以向這些群體尋求靈感和尖端技術的范例。這些技術可通過免費 SDK ( Riva 、 ROS 、 NVIDIA DeepStream 、 NVIDIA CUDA )和功能強大的硬件(機器人、 NVIDIA Jetson Orin 、傳感器)使用。

關于作者

Dave Niewinski 是一名加拿大機器人工程師,他利用多年的行業(yè)經驗幫助公司采用或開發(fā)自己的機器人系統(tǒng)。他還通過自己的 YouTube 頻道,通過開發(fā)有趣且吸引人的項目,分享他對先進機器人技術的熱愛。他擁有圭爾夫大學工程學士學位,是安大略省的專業(yè)工程師。

Sven Chilton 是 NVIDIA 的一名深度學習技術營銷工程師。他開發(fā)、使用、教育和傳播基本的 NVIDIA 深度學習工具,尤其是 Riva 語音 AI 框架。斯文長期以來熱愛數(shù)學和語言,認為語音人工智能和 NLP 是兩者的完美結合。他獲得了麻省理工學院物理學學士學位,加州大學伯克利分校核工程碩士和博士學位。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    214

    文章

    31609

    瀏覽量

    224298
  • AI
    AI
    +關注

    關注

    91

    文章

    41866

    瀏覽量

    302987
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    杰和科技亮相機器人大會,邊緣AI驅動機器人場景落地

    4月22日,業(yè)內領先的嵌入式邊緣AI廠商杰和科技亮相FAIRplus2026機器人全產業(yè)鏈接會。基于在工業(yè)嵌入式、邊緣AI領域的深厚積累,杰和科技立足機器人底層功能需求,聚焦
    的頭像 發(fā)表于 04-22 16:39 ?744次閱讀
    杰和科技亮相<b class='flag-5'>機器人</b>大會,邊緣<b class='flag-5'>AI</b>驅動<b class='flag-5'>機器人</b>場景落地

    智能機器人從0到1系統(tǒng)入門課程 帶源碼課件 百度網盤下載

    機器人 AI 交互:語音識別 + 視覺識別入門實踐 在人工智能技術飛速演進的當下,機器人正從冰冷的自動化設備向具備感知能力的智能體進化。傳統(tǒng)的機器人
    發(fā)表于 04-11 16:41

    NVIDIA如何用AI構建機器人

    下一代機器人將是通用型專家,既能理解指令、學習通用技能,又可針對特定任務進行訓練。
    的頭像 發(fā)表于 03-25 09:55 ?955次閱讀

    再談低溫燒結銀的應用:從春晚四家機器人出鏡的幕后推手說起

    ,完成翻跟頭、脖子延伸、互動接梗,強調關節(jié)靈活+功率+長期穩(wěn)定。 銀河通用:《我最難忘的今宵》:Galbot G1具身智能,自主決策、精細操作,依賴AI芯片+傳感器+高效互連。 2機器人動得穩(wěn)、準、快
    發(fā)表于 02-17 14:07

    AI+延遲帶寬,解決巡檢機器人控制和視頻傳輸難題

    適應能力。而圖像處理模塊的存在,則是讓機器人具備識別、檢測周邊物體的能力,讓其能夠實現(xiàn)精準操作、避障等功能。這些AI功能慧視光電開發(fā)的Viztra-HS063AI
    的頭像 發(fā)表于 01-13 17:59 ?736次閱讀
    <b class='flag-5'>AI</b>+<b class='flag-5'>低</b>延遲<b class='flag-5'>低</b>帶寬,解決巡檢<b class='flag-5'>機器人</b>控制和視頻傳輸難題

    探索RISC-V在機器人領域的潛力

    應用,特別是機器人操作系統(tǒng)領域的可行性。MUSE Pi Pro以其強大的K1 AI CPU和官方對主流開源軟件棧的積極適配,成為了一個非常有吸引力的選擇。 二、 硬件初窺:性能小鋼炮 MUSE Pi Pro
    發(fā)表于 12-03 14:40

    高精度機器人控制的核心——基于 MYD-LT536 開發(fā)板的精密運動控制方案

    ISP多媒體接口,適合構建機器人視覺-運動融合系統(tǒng),實現(xiàn)工件識別與動態(tài)定位。 3. 支持閉環(huán)控制與誤差校正 可結合高分辨率編碼器反饋數(shù)據(jù),運行機器人閉環(huán)控制算法; 利用AI 協(xié)處理
    發(fā)表于 11-14 15:48

    RK3576機器人核心:三屏異顯+八路攝像頭,重塑機器人交互與感知

    開發(fā)板的實際演示證明,RK3576能夠輕松處理三屏顯示和八路攝像頭輸入的復雜任務,同時保持低功耗和發(fā)熱特性,為機器人應用提供了理想的性能基礎。 實測見證:RK3576輕松駕馭三屏八攝像頭復雜任務理論參數(shù)
    發(fā)表于 10-29 16:41

    巡檢機器人落地攻略:RK3576驅動12路延遲視覺

    ,邊走邊看、實時回傳、異常即告警。周三,機器人上電跑通:前后左右與頂部共 10~12路1080P 攝像頭接入,基于米爾 RK3576開發(fā)板 完成 硬件編解碼 + RTSP/SRT 延遲推流;端到端延遲
    發(fā)表于 10-24 16:53

    小蘿卜機器人的故事

    代替, LED, 有大佬感興趣, 一起關注和討論代碼, 這個機器人知名度不高, 可是是機器人的原型, 如果開放接口, 定位和無線充電, 也不失為未來的禮物。 讓我們?yōu)樾√}卜工程師的, 自掏腰包救蘿卜
    發(fā)表于 10-23 05:24

    再掀語音交互革命,廣和通AI解決方案加速機器人聽覺進化

    機器人世界里,感知是智能化的第一步,是機器人獲取環(huán)境信息,學習適應并自主決策的前提。聽覺作為五感之一,深度融合AI,可幫助機器人實現(xiàn)高效感知、數(shù)據(jù)獲取、
    的頭像 發(fā)表于 08-26 17:44 ?1111次閱讀

    工業(yè)機器人的特點

    的基礎,也是三者的實現(xiàn)終端,智能制造裝備產業(yè)包括高檔數(shù)控機床、工業(yè)機器人、自動化成套生產線、精密儀器儀表、智能傳感器、汽車自動化焊接線、柔性自動化生產線、智能農機、3D 打印機等領域。而智能制造裝備中工業(yè)
    發(fā)表于 07-26 11:22

    涂鴉AI畫畫機器人開發(fā)方案

    兒童教育的畫畫機器人品牌,通過語音互動激發(fā)孩子創(chuàng)作力,已暢銷全球100多個國家。為助力開發(fā)者和各類品牌高效構建此類產品,涂鴉重點突破AI語音
    的頭像 發(fā)表于 06-12 18:17 ?1642次閱讀
    涂鴉<b class='flag-5'>AI</b>畫畫<b class='flag-5'>機器人</b>開發(fā)方案

    STM32+Android實現(xiàn)的智能家政機器人電路代碼論文及項目源碼

    STM32+Android實現(xiàn)的智能家政機器人電路代碼論文及項目部分截圖:
    發(fā)表于 05-28 21:22

    明遠智睿SSD2351開發(fā)板:語音機器人領域的變革力量

    在人工智能快速發(fā)展的今天,語音機器人逐漸成為人們生活和工作中的得力助手。明遠智睿SSD2351開發(fā)板憑借強大性能與豐富功能,為語音機器人的發(fā)展注入新動力,成為該領域的變革力量。 SSD
    發(fā)表于 05-28 11:36
    湾仔区| 宜兰市| 兴文县| 略阳县| 出国| 横峰县| 庆阳市| 且末县| 饶平县| 斗六市| 类乌齐县| 浦城县| 宜黄县| 榆树市| 道真| 石楼县| 浑源县| 扎赉特旗| 错那县| 小金县| 玉屏| 调兵山市| 高雄市| 宜宾市| 应用必备| 临泽县| 会理县| 灵山县| 大庆市| 繁昌县| 利津县| 弥渡县| 老河口市| 新兴县| 屯门区| 罗定市| 禹州市| 奉新县| 博罗县| 南川市| 乐清市|