日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

亞馬遜云科技智能2D數(shù)字人方案為教育行業(yè)賦能

電子產(chǎn)品技術(shù)與應用 ? 來源:科技新思路 ? 作者:科技新思路 ? 2023-08-30 14:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

早在大語言模型如GPT-3.5等的興起和被日漸廣泛的采用之前,教育行業(yè)已經(jīng)在AI輔助教學領域有過各種各樣的嘗試。在教育行業(yè),人工智能技術(shù)的采用幫助教育行業(yè)更好地實現(xiàn)教學目標,提高教學質(zhì)量、學習效率、學習體驗、學習成果。例如,人工智能技術(shù)可以幫助教師更好地管理課堂,更好地識別學生的學習需求,更好地提供個性化的學習內(nèi)容,更好地評估學生的學習成果,更好地提供學習支持。此外,人工智能技術(shù)還可以幫助教育行業(yè)更好地實現(xiàn)自動化,提高教育行業(yè)的效率和效果??傊?,人工智能技術(shù)在教育行業(yè)的采用將會帶來巨大的變化,為教育行業(yè)帶來更多的發(fā)展機遇。

亞馬遜云科技也一直致力于提供更方便快捷,功能更強大的AI服務來支持教育行業(yè)客戶的技術(shù)創(chuàng)新和業(yè)務創(chuàng)新。特別是Amazon Transcribe、Amazon Polly、Amazon Textract、Amazon Translate、Amazon Personalize、Amazon Rekognition、Amazon SageMaker等產(chǎn)品分別從自然語言處理、圖形圖像處理、模型研發(fā)部署等方面為教育行業(yè)提供了強有力的技術(shù)支持。

本文結(jié)合Amazon Transcribe、Amazon Polly,以及OpenAI的大語言模型和D-ID.com公司的2D數(shù)字人生成技術(shù),介紹實現(xiàn)一個演示用的可語音對話的智能2D數(shù)字人設計的服務和具體的實現(xiàn)過程。

方案架構(gòu)

為了能在一個統(tǒng)一的用戶界面呈現(xiàn)語音輸入、語音輸出,以及2D數(shù)字人視頻播放的整體效果,本方案選擇Gradio框架實現(xiàn)WebUI的功能。呈現(xiàn)的WebUI如下:

用戶可以通過直接輸入文字內(nèi)容或者使用麥克風輸入語音,文字內(nèi)容會使用Langchain附加上一定的上下文后送給OpenAI的GPT接口調(diào)用,語音輸入會先調(diào)用Amazon Transcribe服務進行語音到文字的轉(zhuǎn)換。經(jīng)過GPT接口返回的文字內(nèi)容,會調(diào)用AWS Polly形成語音文件,同時語音文件會作為D-ID.com提供的API渲染出2D的動態(tài)視頻在前端自動展示和播放。

本方案中語音輸入,語音輸出,文字響應生成,以及數(shù)字人視頻生成的功能都可以做自由的組合和替換。特別是對于OpenAI接口的調(diào)用可以置換為對自部署的大語言模型的調(diào)用,同時2D數(shù)字人視頻的生成也可以考慮其他類似服務,如Heygen等。

具體實現(xiàn)

語音輸入部分

Amazon Transcribe支持實時轉(zhuǎn)錄語音(流式傳輸),也可以轉(zhuǎn)錄Amazon S3存儲桶中的語音文件(批處理)。Transcribe支持多達幾十種的不同國家的語言。

Transcribe的實時轉(zhuǎn)錄能力非常的強大,處理流數(shù)據(jù)的同時,不斷的利用之前的上下文進行結(jié)果的實時矯正,可以通過下面這個截圖看到Transcribe實時轉(zhuǎn)錄輸出的效果:

應答內(nèi)容生成部分

在本方案里,應答內(nèi)容的生成借助Langchain這個開源框架,調(diào)用基于OpenAI的coversation接口,同時使用memory庫對對話的上下文做了5輪保存。在實際的客戶場景里,可以考慮更豐富的方式來規(guī)范回復的內(nèi)容的有效性和客觀性。

比如可以使用Langchain的對話模版來對大模型的角色進行預設,或者使用Amazon Kendra,Amazon Opensearch這樣的知識庫構(gòu)建和檢索引擎,來進一步限制大模型應答的內(nèi)容范圍。

語音輸出部分

Amazon Polly可以將文本轉(zhuǎn)化為逼真的語音。它支持多種語言并且包含各種逼真的聲音模擬,也包含中文普通話語音的模擬。

可以構(gòu)建支持語音并能用于各種位置的應用程序,并選擇適合客戶的聲音。Amazon Polly也支持語音合成標記語言(SSML),它是一種基于XML的W3C標準標記語言,適用于語音合成應用程序,且支持使用通用SSML標簽進行斷句、重音和語調(diào)。自定義Amazon SSML標簽提供了獨特的選項,例如,能夠以新聞播音員說話風格發(fā)出某些聲音。這種靈活性能夠幫助您創(chuàng)建逼真的語音,從而吸引并維持聽眾的注意力。

在本方案中,可以使用Polly的實時語音生成接口,使用了中文普通話發(fā)音的VoiceID:Zhiyu,同時對特定的字符的發(fā)音做了定制化,這也是Polly一個非常有用的功能(Lexion)。

2D數(shù)字人視頻的生成部分

這里可以使用一個外部第三方的SaaS服務。該服務由D-ID.com公司提供,對應的API可以直接接收文本輸入和一張人臉圖片來生成對應的動態(tài)播報視頻,也可以接受語音文件加圖片作為輸入。

當你輸入文本的時候,該API接口可以選擇制定AWS的Polly服務中的不同的Voice ID來自動為你合成語音。

在本方案中,想體現(xiàn)中文的語音輸出的效果,但是D-ID的API接口中暫時無法直接為中文文本指定中文的Voice ID。所以選擇了先用Polly的API生成語音,再把語音和圖片傳送給D-ID的接口生成視頻。

總結(jié)

今年是AIGC爆發(fā)的一年,也是教育行業(yè)所在的客戶看到行業(yè)拐點的一年。在這個關(guān)鍵的歷史性節(jié)點上,亞馬遜云科技愿意和客戶一起面對這些新的機會和挑戰(zhàn),以客戶的需求為導向,幫助客戶抓住AI浪潮帶來的紅利。

目前除了本文展示的2D數(shù)字人的方案,亞馬遜云科技也可以幫助客戶提供基于3D數(shù)字人或者其他3D數(shù)字形象的直播,互動等方案。同時亞馬遜云科技也會引入更多的技術(shù)合作伙伴如躍遷引擎來豐富整個數(shù)字人,數(shù)字形象直播、點播、互動等場景的解決方案,助力更多的教育行業(yè)客戶加速AI技術(shù)的采用和落地。

原發(fā)標題:近實時智能應答 2D 數(shù)字人搭建

審核編輯 黃宇


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41315

    瀏覽量

    302691
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50366

    瀏覽量

    267056
  • 亞馬遜
    +關(guān)注

    關(guān)注

    8

    文章

    2738

    瀏覽量

    85896
  • 數(shù)字人
    +關(guān)注

    關(guān)注

    0

    文章

    160

    瀏覽量

    2592
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    老子:移動實物數(shù)字智能時代來臨!

    時代的來臨。1.強大的壓縮技術(shù)為什么老子技術(shù)深受行業(yè)人士期待?特別是設計、3D游戲建模行業(yè),眸瑞科技研發(fā)——老子技術(shù),兩個自動化(
    發(fā)表于 04-17 10:10

    AI教育 ROOBO“童秘”平臺及布丁迷你豆同期發(fā)布

    揭開了童秘兒童智能平臺(以下簡稱“童秘”)的神秘面紗。在兒童教育機器業(yè)務量越來越大的同時,童秘從ROS.AI中孕育出來。該平臺能夠為兒童教育機器
    發(fā)表于 08-05 09:27

    筷捷SaaS平臺:助力企業(yè)上數(shù)字經(jīng)濟

    特色產(chǎn)業(yè)園區(qū)項目。并且,筷捷的年用戶量正保持30%以上的增速發(fā)展?! 】杲荩ζ髽I(yè)上,數(shù)字經(jīng)濟?! EC筷捷產(chǎn)品介紹:  辦公S
    發(fā)表于 08-28 13:54

    如何同時獲取2d圖像序列和相應的3d?

    如何同時獲取2d圖像序列和相應的3d?以上來自于谷歌翻譯以下為原文How to obtain the sequence of 2d image and corresponding
    發(fā)表于 11-13 11:25

    天使,科技智造:華秋第八屆硬創(chuàng)賽與亞馬遜科技達成戰(zhàn)略合作

    、技術(shù)領先、服務豐富、應用廣泛而享譽業(yè)界。亞馬遜科技可以支持幾乎上任意工作負載。亞馬遜科技目前提供超過 200 項全功能的服務,涵蓋計
    發(fā)表于 07-01 15:33

    基于VxWorks操作系統(tǒng)的WiWindML 2D顯示方案

    基于VxWorks操作系統(tǒng)有多種2D 顯示的解決方案,但由于種種原因,僅介紹基于VxWorks操作系統(tǒng)的WindML 2D顯示解決方案,并著重討論了WindML的體系結(jié)構(gòu),且介紹了
    發(fā)表于 12-16 14:26 ?10次下載

    基于VxWorks操作系統(tǒng)的WindML 2D顯示方案

    基于VxWorks操作系統(tǒng)有多種2D 顯示的解決方案,但由于種種原因,僅介紹基于VxWorks操作系統(tǒng)的WindML 2D顯示解決方案,并著重討論了WindML的體系結(jié)構(gòu),且介紹了
    發(fā)表于 12-05 16:35 ?14次下載

    知聲31日召開系統(tǒng)發(fā)布會,AI 教育機器全面

    知聲經(jīng)過多年在 AI 教育機器市場上的深耕細作,順應行業(yè)發(fā)展態(tài)勢所打造的面向智能教育機器
    的頭像 發(fā)表于 08-08 08:38 ?3130次閱讀

    RoboCup 2D機器足球仿真的智能算法的應用研究說明

    在Robocup仿真比賽中,Agent的動作技能是仿真足球比賽的基礎。本文詳細分析了robocup 2D機器足球仿真中射門技能存在的問題,論述了智能算法在機器足球
    發(fā)表于 11-07 17:31 ?4次下載

    教育桌面對教育行業(yè)格局的影響

    一定程度的影響,不可否認,技術(shù)已成功金融、電商、工業(yè)互聯(lián)、醫(yī)療健康等行業(yè),而我們教育數(shù)字
    的頭像 發(fā)表于 10-16 15:40 ?1372次閱讀

    SOLIDWORKS教育版2024:2D工程圖的新云端之旅

    隨著數(shù)字化和計算技術(shù)的飛速發(fā)展,SOLIDWORKS工程設計領域的也起到了不少的作用,不斷推陳出新,用戶提供更有效、更便捷的工程設計解決方案
    的頭像 發(fā)表于 02-29 15:50 ?1230次閱讀
    SOLIDWORKS<b class='flag-5'>教育</b>版2024:<b class='flag-5'>2D</b>工程圖的新云端之旅

    數(shù)字,教育蝶變,2024慧聰教育年度盤點揭示數(shù)字化力量

    北京2025年2月10日?/美通社/ -- 2025年1月16日, 由慧聰教育網(wǎng)策劃的主題為"數(shù)字
    的頭像 發(fā)表于 02-12 17:26 ?1039次閱讀
    <b class='flag-5'>數(shù)字</b><b class='flag-5'>賦</b><b class='flag-5'>能</b>,<b class='flag-5'>教育</b>蝶變,2024慧聰<b class='flag-5'>教育</b>年度盤點揭示<b class='flag-5'>數(shù)字</b>化力量

    科技榮獲亞馬遜科技生成式AI能力認證

    Bedrock等技術(shù),從應用范圍、模型選擇、數(shù)據(jù)處理、模型調(diào)優(yōu)到應用集成與部署等方面,助力企業(yè)加速生成式AI應用落地。此外,聚科技還基于亞馬遜科技打造RAGPro企業(yè)知識庫、AI-Space、DecisionAI和
    的頭像 發(fā)表于 02-14 16:07 ?955次閱讀

    廣和通基于阿里通義大模型推出隨身智能解決方案消費電子終端行業(yè)

    2月,廣和通與全球領先的解決方案提供商阿里達成合作:廣和通AI模組及解決方案,基于阿里通義
    的頭像 發(fā)表于 03-03 17:55 ?1554次閱讀
    廣和通基于阿里<b class='flag-5'>云</b>通義大模型推出隨身<b class='flag-5'>智能解決方案</b>,<b class='flag-5'>賦</b><b class='flag-5'>能</b>消費電子終端<b class='flag-5'>行業(yè)</b>

    亞馬遜科技發(fā)布“3+2”合作伙伴戰(zhàn)略 與合作伙伴加速前行

    科技Marketplace和合作伙伴網(wǎng)絡系列支持計劃,持續(xù)合作伙伴實現(xiàn)業(yè)務創(chuàng)新與規(guī)?;鲩L。同時,亞馬遜科技與德勤中國發(fā)布生成式AI勤智企業(yè)
    發(fā)表于 04-25 14:43 ?1087次閱讀
    <b class='flag-5'>亞馬遜</b><b class='flag-5'>云</b>科技發(fā)布“3+<b class='flag-5'>2</b>”合作伙伴戰(zhàn)略 與合作伙伴加速前行
    海淀区| 防城港市| 海兴县| 义乌市| 滕州市| 衡水市| 盐亭县| 云龙县| 兴海县| 高阳县| 辽源市| 礼泉县| 巨野县| 峡江县| 寿宁县| 新竹市| 公主岭市| 阿拉善盟| 佛冈县| 张掖市| 金堂县| 弋阳县| 涿州市| 买车| 老河口市| 灯塔市| 安乡县| 扎鲁特旗| 丰顺县| 乐昌市| 东兰县| 伽师县| 定襄县| 四子王旗| 本溪市| 黄平县| 陕西省| 凉山| 休宁县| 峡江县| 郸城县|