日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA助力微軟將AI Transformer模型投入生產(chǎn)用途

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 作者:NVIDIA英偉達企業(yè)解 ? 2022-03-28 09:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Microsoft 的目標是,通過結(jié)合使用 Azure 與 NVIDIA GPU 和 Triton 推理軟件,率先將一系列強大的 AI Transformer 模型投入生產(chǎn)用途。

如果您的軟件能喚起人們喜悅的淚水,您就是在傳播歡樂。

Translator 是一項 Microsoft Azure 認知服務(wù),通過應(yīng)用一些規(guī)模龐大的 AI 模型來幫助更多人進行交流。

“有太多精彩的故事可以講了!” Translator 開發(fā)經(jīng)理 Vishal Chowdhary 表示。

比如,在 2010 年海地遭受 7.0 級地震后,在短短 5 天的沖刺期里為相關(guān)應(yīng)用緊急添加海地克里奧爾語支持,進而為救援人員提供幫助。再比如,祖父母在使用這款軟件,與講著他們不懂的語言的遠方孫輩進行第一次實時交流時,感動到哽咽。

雄心勃勃的目標

“我們的愿景是,讓成千上萬的開發(fā)者都已經(jīng)在使用的這個 API,能打破不同語言、不同模式之間的阻礙。” Chowdhary 說。

考量全球現(xiàn)行的語言大約有 7000 種,這真的是個雄心勃勃的目標。

因此,團隊采用了一種強大而復(fù)雜的工具,即是混合專家系統(tǒng)(MoE)AI 方法。

在推動自然語言處理快速發(fā)展進步的 Transformer 模型中,這是非常先進的一種。它具有 50 億個參數(shù),其規(guī)模比團隊在生產(chǎn)過程中用于自然語言處理的最大模型大了 80 倍。

MoE 模型涉及到龐大的計算量,很難找到能將其投入生產(chǎn)環(huán)境中使用的用戶。在初始測試中,基于 CPU 的服務(wù)器無法滿足團隊要在一秒鐘內(nèi)完成翻譯一個文檔的要求。

27 倍的提速

隨后,該團隊使用 NVIDIA Triton 推理服務(wù)器(本周 GTC 大會上宣布的 NVIDIA AI Enterprise 2.0 平臺的其中一部分)在加速系統(tǒng)上進行了測試。

Chowdhary 說:“借助 NVIDIA GPU 和 Triton,我們得以實現(xiàn)這一目標,且非常高效。”

事實上,相較于未經(jīng)優(yōu)化的 GPU 運行時,該團隊實現(xiàn)了高達 27 倍的提速。

“這讓我們可以構(gòu)建一個模型來執(zhí)行不同的語言理解任務(wù),例如匯總、生成文本和翻譯等,而不必為每個任務(wù)開發(fā)單獨的模型。” 負責監(jiān)督測試的 Microsoft 首席研究員 Hanny Hassan Awadalla 表示。

Triton 如何提供幫助

Microsoft 的模型能將大型任務(wù)(如翻譯多個文檔)拆分為許多個小任務(wù),在每個小任務(wù)中翻譯幾百個句子。Triton 的動態(tài)批處理功能將諸多此類請求整合起來,從而充分利用 GPU 的強大功能。

對于 Triton 使用 CPU、GPU 或其他加速器在各種模式下運行各種模型的能力,讓該團隊贊不絕口。

Chowdhary 的團隊十多年來一直在開發(fā)大規(guī)模分布式系統(tǒng)。Chowdhary 表示:“這種解決方案周到地考慮了我的工作場景,提供了我想要的各種功能,就像是我給自己親手定制的解決方案一樣。

在幕后,有兩個軟件組件是 Triton 取得成功的關(guān)鍵。一個是 NVIDIA 擴展型 FasterTransformer,這是一個處理推理計算的軟件層,可支持 MoE 模型。另一個是 CUTLASS,這是一個 NVIDIA 數(shù)學庫,有助于高效實現(xiàn)模型。

在四周內(nèi)提供已驗證的原型

盡管測試十分復(fù)雜,但該團隊通過與 NVIDIA 工程師合作并運用 Triton 的強大力量,在不到一個月的時間內(nèi)就獲得了可投入正常運轉(zhuǎn)的端到端原型。

“在如此之短的時間內(nèi)制作出一款達到可發(fā)布程度的產(chǎn)品,這樣的效率實在令人印象深刻,對此我真的非常感激?!?Awadalla 這樣說道。

雖然這是該團隊第一次使用 Triton,但 “我們使用它來發(fā)布 MoE 模型,不用花費太多力氣就重新構(gòu)建了運行時環(huán)境,現(xiàn)在我衷心希望在我們的長期托管系統(tǒng)中納入這款解決方案?!?Chowdhary 補充表示。

采取后續(xù)措施

加速后的服務(wù)將采用審慎的步驟實施,初期會用于少數(shù)幾種主要語言的文檔翻譯。

Chowdhary 表示:“我們的最終目標是,讓客戶能在所有場景中通過透明的方式獲享這些新模型的優(yōu)點?!?/p>

這項工作是 Microsoft 的一項涉獵更廣泛的計劃的一部分。其目的是推動 Office 和 Teams 等眾多產(chǎn)品的進步,幫助各類開發(fā)者與客戶(從專注于打造一款應(yīng)用的小型公司到財富 500 強企業(yè))取得發(fā)展。

為了給這一計劃鋪平道路,Awadalla 的團隊于去年 9 月發(fā)表了一項研究成果,介紹如何在 NVIDIA A100 Tensor Core GPU 上訓(xùn)練具有多達 2 千億個參數(shù)的 MoE 模型。自那之后,該團隊還在具有超過 3 千億個參數(shù)的模型上使用 80G 版本的 A100 GPU,將性能提升了 8 倍。

Adawalla 表示:“為了更好地表示更多的語言,尤其是我們手頭沒有太多數(shù)據(jù)的語言,模型必定會越來越大?!?/p>

原文標題:GTC22 | 促進人際交流:微軟使用 NVIDIA Triton 改善 Translator 翻譯工具的 AI 質(zhì)量和效率

文章出處:【微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6754

    瀏覽量

    108098
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5696

    瀏覽量

    110140
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5283

    瀏覽量

    136099
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41315

    瀏覽量

    302691

原文標題:GTC22 | 促進人際交流:微軟使用 NVIDIA Triton 改善 Translator 翻譯工具的 AI 質(zhì)量和效率

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    HM博學谷狂野AI模型第四期

    ,雖然能快速構(gòu)建原型,卻難以觸及智能的邊界。面對模型的幻覺、推理能力的瓶頸以及定制化需求的落空,單純的應(yīng)用層知識顯得蒼白無力。博學谷“狂野 AI模型第四期”正是為了打破這一層技術(shù)天花板,
    發(fā)表于 05-01 17:30

    NVIDIA攜手微軟加速機器人和物理AI的發(fā)展

    在 GTC 大會上,微軟宣布了其代理式和物理 AI 系統(tǒng)統(tǒng)一平臺的更新,加速從實驗到生產(chǎn)落地的進程。 Microsoft Foundry 與 NV
    的頭像 發(fā)表于 03-23 15:21 ?994次閱讀

    NVIDIA 成立由全球領(lǐng)先 AI 實驗室組成的 Nemotron Coalition,推動開放前沿模型發(fā)展

    在內(nèi)的領(lǐng)先創(chuàng)新者皆是創(chuàng)始成員,助力塑造新一代 AI 系統(tǒng)。 ● 聯(lián)盟成員協(xié)作開發(fā)一款基于 NVIDIA DGX? Cloud 訓(xùn)練的開放模型
    的頭像 發(fā)表于 03-17 11:14 ?339次閱讀
    <b class='flag-5'>NVIDIA</b> 成立由全球領(lǐng)先 <b class='flag-5'>AI</b> 實驗室組成的 Nemotron Coalition,推動開放前沿<b class='flag-5'>模型</b>發(fā)展

    NVIDIA Jetson模型賦能AI在邊緣端落地

    開源生成式 AI 模型不再局限于數(shù)據(jù)中心,而是開始深入到現(xiàn)實世界的各種機器中。從 Orin 到 Thor,NVIDIA Jetson 系列正在成為運行 NVIDIA Nemotron、
    的頭像 發(fā)表于 03-16 16:27 ?679次閱讀
    <b class='flag-5'>NVIDIA</b> Jetson<b class='flag-5'>模型</b>賦能<b class='flag-5'>AI</b>在邊緣端落地

    Transformer 入門:從零理解 AI模型的核心原理

    ) × (4, 5) = 錯誤!? (3 ≠ 4) 在 Transformer 中的應(yīng)用 scss 體驗AI代碼助手 代碼解讀 復(fù)制代碼 Token 嵌入計算
    發(fā)表于 02-10 16:33

    NVIDIA攜手Mistral AI發(fā)布全新開源大語言模型系列

    全新 Mistral 3 系列涵蓋從前沿級到緊湊型模型,針對 NVIDIA 平臺進行了優(yōu)化,助力 Mistral AI 實現(xiàn)云到邊緣分布式智能愿景。
    的頭像 發(fā)表于 12-13 09:58 ?1491次閱讀

    NVIDIA推動面向數(shù)字與物理AI的開源模型發(fā)展

    NVIDIA 發(fā)布一系列涵蓋語音、安全與輔助駕駛領(lǐng)域的全新 AI 工具,其中包括面向移動出行領(lǐng)域的行業(yè)級開源視覺-語言-動作推理模型(Reasoning VLA) NVIDIA DRI
    的頭像 發(fā)表于 12-13 09:50 ?1575次閱讀

    NVIDIA擴大與微軟合作推動AI超級工廠建設(shè)

    在 Microsoft Ignite 大會上,NVIDIA 擴大與微軟的合作,包括在由 NVIDIA Blackwell 平臺驅(qū)動的全新 Microsoft Fairwater AI
    的頭像 發(fā)表于 12-01 09:52 ?1024次閱讀

    利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數(shù)據(jù)生成。借助
    的頭像 發(fā)表于 12-01 09:25 ?1479次閱讀

    NVIDIA DGX Spark助力構(gòu)建自己的AI模型

    作為個人 AI 超級計算機,為世界各地的 AI 研究人員、數(shù)據(jù)科學家和學生提供 NVIDIA Grace Blackwell 平臺的強大功能。
    的頭像 發(fā)表于 11-21 09:25 ?1594次閱讀
    <b class='flag-5'>NVIDIA</b> DGX Spark<b class='flag-5'>助力</b>構(gòu)建自己的<b class='flag-5'>AI</b><b class='flag-5'>模型</b>

    MediaTek攜手NVIDIA開啟個人AI算力新紀元

    Spark 助力開發(fā)者能在本地端對大型 AI 模型進行原型設(shè)計(Prototype)、微調(diào)(Fine-tune)和推理(Inference)。NVIDIA DGX Spark 將于
    的頭像 發(fā)表于 10-16 11:26 ?963次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學習AI芯片的創(chuàng)新方法與架構(gòu)

    射頻模擬處理器的原型與概念驗證 3、光電組合AI芯片 目前最好的應(yīng)對Transformer模型需要的極高算力的方法之一就是使用光子計算芯片來代替基于CMOS的芯片。 光電組合AI芯片的
    發(fā)表于 09-12 17:30

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?2037次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2推理<b class='flag-5'>模型</b>發(fā)布

    NVIDIA攜手微軟加速代理式AI發(fā)展

    代理式 AI 正在重新定義科學探索,推動各行各業(yè)的研究突破和創(chuàng)新發(fā)展。NVIDIA微軟正通過深化合作提供先進的技術(shù),從云到 PC 加速代理式 AI 應(yīng)用的發(fā)展。
    的頭像 發(fā)表于 05-27 14:03 ?1252次閱讀

    機器人領(lǐng)域領(lǐng)先企業(yè)利用NVIDIA技術(shù)實現(xiàn)工業(yè)AI

    包括 KUKA、西門子、Standard Bots、優(yōu)傲機器人和 Vention 在內(nèi)的行業(yè)領(lǐng)先企業(yè),展示了由 NVIDIA 加速且可投入生產(chǎn)的工業(yè)自動化解決方案。
    的頭像 發(fā)表于 05-20 16:10 ?1197次閱讀
    婺源县| 宣威市| 丹东市| 比如县| 西华县| 丰城市| 固镇县| 阿克| 黔西| 循化| 镇宁| 蓝田县| 商水县| 松江区| 北辰区| 于都县| 睢宁县| 阿瓦提县| 天柱县| 肇州县| 普定县| 二连浩特市| 吴堡县| 东辽县| 海伦市| 韩城市| 垣曲县| 新疆| 拉萨市| 遂平县| 舞阳县| 越西县| 陇西县| 岑巩县| 封开县| 邵阳市| 呼和浩特市| 称多县| 平邑县| 张北县| 张掖市|