日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA NIM微服務(wù)帶來巨大優(yōu)勢(shì)

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-08-23 15:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

新服務(wù)通過熱門 AI 模型為數(shù)百萬開發(fā)者帶來高達(dá) 5 倍的 token 效率提升,使他們能夠立即訪問在 NVIDIA DGX Cloud 上運(yùn)行的 NIM 微服務(wù)。

全球最大人工智能社區(qū)之一 Hugging Face 平臺(tái)上的 400 萬開發(fā)者在一些最熱門的 AI 模型上可輕松獲得 NVIDIA 加速推理。

借助新的推理即服務(wù)能力,開發(fā)者將能夠快速部署 Llama 3 系列和 Mistral AI 模型等領(lǐng)先的大語(yǔ)言模型,并使用運(yùn)行在NVIDIA DGX Cloud上的NVIDIA NIM微服務(wù)進(jìn)行優(yōu)化。

這項(xiàng)服務(wù)在 SIGGRAPH 大會(huì)上發(fā)布,它將幫助開發(fā)者利用托管在 Hugging Face Hub 上的開源 AI 模型快速建立原型并將其部署在生產(chǎn)中。Enterprise Hub 用戶可以利用 NVIDIA NIM 進(jìn)行無服務(wù)器推理,以提高靈活性,盡可能降低基礎(chǔ)設(shè)施用度并優(yōu)化性能。

推理服務(wù)補(bǔ)充了在 DGX Cloud 端的訓(xùn)練(Train on DGX Cloud),一種已在 Hugging Face 上提供的 AI 訓(xùn)練服務(wù)。

由于開發(fā)者面對(duì)著越來越多的開源模型,可供其輕松比較各種選項(xiàng)的資源中心會(huì)非常有幫助。這些訓(xùn)練和推理工具為 Hugging Face 開發(fā)者提供了在 NVIDIA 加速基礎(chǔ)設(shè)施上試驗(yàn)、測(cè)試和部署先進(jìn)模型的新方法。它們可以通過 Hugging Face 模型卡上的“訓(xùn)練”和“部署”下拉菜單輕松訪問,用戶只需點(diǎn)擊幾下就能輕松使用這些功能。

不僅限于 Token 層面的提升

— NVIDIA NIM 帶來巨大優(yōu)勢(shì)

NVIDIA NIM 是一系列 AI 微服務(wù)(包括 NVIDIA AI 基礎(chǔ)模型和開源社區(qū)模型)的集合,而且已使用行業(yè)標(biāo)準(zhǔn)應(yīng)用編程接口(API)針對(duì)推理進(jìn)行了優(yōu)化。

NIM 為用戶帶來更高的 token 處理效率 — token 是語(yǔ)言模型使用和生成的數(shù)據(jù)單位。經(jīng)優(yōu)化的微服務(wù)還能改善底層 NVIDIA DGX Cloud 基礎(chǔ)架構(gòu)的效率,從而提高關(guān)鍵 AI 應(yīng)用的速度。

這意味著,與模型的其他版本相比,開發(fā)者可以通過訪問 NIM AI 模型,更快、更可靠地得到結(jié)果。例如,與 NVIDIA Tensor Core GPU 驅(qū)動(dòng)系統(tǒng)上的現(xiàn)成部署相比,通過 NIM 訪問 Llama 3 的 700 億參數(shù)版本時(shí),可實(shí)現(xiàn)最高達(dá) 5 倍的吞吐量提升。

近乎即時(shí)的 DGX Cloud

訪問讓 AI 加速觸手可及

NVIDIA DGX Cloud 平臺(tái)專為生成式 AI 打造,為開發(fā)者提供輕松訪問可靠加速計(jì)算基礎(chǔ)設(shè)施的途徑,幫助他們更快地將生產(chǎn)就緒型應(yīng)用推向市場(chǎng)。

該平臺(tái)提供可擴(kuò)展的 GPU 資源,可為從原型設(shè)計(jì)到生產(chǎn)的每一步 AI 開發(fā)提供支持,同時(shí)無需開發(fā)者做出長(zhǎng)期的 AI 基礎(chǔ)設(shè)施承諾。

借助由 NIM 微服務(wù)提供支持、在 NVIDIA DGX Cloud 上運(yùn)行的 Hugging Face 推理即服務(wù),用戶可輕松訪問針對(duì) AI 部署進(jìn)行優(yōu)化的計(jì)算資源,在企業(yè)級(jí)環(huán)境中實(shí)驗(yàn)最新的 AI 模型。

詳細(xì)了解在 SIGGRAPH 大會(huì)上

發(fā)布的 NVIDIA NIM 相關(guān)信息

在 SIGGRAPH 大會(huì)上,NVIDIA 還推出了面向 OpenUSD 框架的生成式 AI 模型和 NIM 微服務(wù),以加速開發(fā)者構(gòu)建高精度虛擬世界的能力,推動(dòng) AI 再次演進(jìn)。

體驗(yàn)超過 100 種 NVIDIA NIM 微服務(wù)在各行各業(yè)的應(yīng)用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5696

    瀏覽量

    110142
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41315

    瀏覽量

    302695
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50366

    瀏覽量

    267056
  • 微服務(wù)
    +關(guān)注

    關(guān)注

    0

    文章

    150

    瀏覽量

    8143

原文標(biāo)題:SIGGRAPH 2024 | Hugging Face 為開發(fā)者帶來由 NVIDIA NIM 提供支持的推理即服務(wù)

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Springboot+SpringData+SpringCloud微服務(wù)架構(gòu)課程

    不再是加分項(xiàng),而是必選項(xiàng)。而在 Java 生態(tài)中,SpringCloud 無疑是微服務(wù)領(lǐng)域的“事實(shí)標(biāo)準(zhǔn)”。然而,從會(huì)用 SpringCloud 組件到真正落地一個(gè)高可用、高并發(fā)的微服務(wù)系統(tǒng),中間隔著巨大的鴻溝。這正是“落地實(shí)戰(zhàn)”
    的頭像 發(fā)表于 03-19 16:08 ?447次閱讀

    光伏四可裝置軟件系統(tǒng)架構(gòu):微服務(wù)化設(shè)計(jì)與容器化部署方案

    ,某一模塊升級(jí)需整體停機(jī),無法適配光伏場(chǎng)景對(duì)實(shí)時(shí)性與連續(xù)性的要求;物理機(jī)部署模式則導(dǎo)致環(huán)境一致性差,跨場(chǎng)景遷移成本高。為此,基于微服務(wù)化設(shè)計(jì)與容器化部署的軟件架構(gòu)應(yīng)運(yùn)而生,通過“功能解耦、彈性部署、高效
    的頭像 發(fā)表于 03-03 15:47 ?566次閱讀

    基于OpenTelemetry的全鏈路追蹤微服務(wù)可觀測(cè)性實(shí)踐

    微服務(wù)拆分到第三年,我們的服務(wù)數(shù)量從最初的5個(gè)膨脹到了47個(gè)。一個(gè)用戶下單請(qǐng)求要經(jīng)過API Gateway -> 用戶服務(wù) -> 商品服務(wù) -> 庫(kù)存
    的頭像 發(fā)表于 02-26 15:43 ?591次閱讀

    超擎數(shù)智為您深度解析NVIDIA Quantum-X800 InfiniBand平臺(tái)

    NVIDIA
    專精特新
    發(fā)布于 :2026年01月08日 19:47:03

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服務(wù)為 A
    的頭像 發(fā)表于 11-03 14:48 ?1233次閱讀

    華納云VPS容器服務(wù)網(wǎng)格流量管理:實(shí)現(xiàn)微服務(wù)高效路由

    在云計(jì)算和微服務(wù)架構(gòu)日益普及的今天,華納云香港VPS憑借其優(yōu)越的地緣優(yōu)勢(shì)和網(wǎng)絡(luò)自由,成為眾多企業(yè)部署容器化應(yīng)用的熱門選擇。復(fù)雜的微服務(wù)架構(gòu)帶來了流量管理的
    的頭像 發(fā)表于 10-16 17:09 ?688次閱讀

    如何基于Nginx構(gòu)建微服務(wù)網(wǎng)關(guān)

    今天,我將分享我們團(tuán)隊(duì)如何基于Nginx構(gòu)建了一個(gè)日均處理10億+請(qǐng)求的微服務(wù)網(wǎng)關(guān),以及踩過的那些坑。這套方案已經(jīng)穩(wěn)定運(yùn)行2年+,經(jīng)歷過多次大促考驗(yàn)。
    的頭像 發(fā)表于 09-02 16:29 ?996次閱讀

    NVIDIA RTX PRO 4500 Blackwell GPU測(cè)試分析

    今天我們帶來全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測(cè)試,對(duì)比上一代產(chǎn)品 NVIDIA RTX 450
    的頭像 發(fā)表于 08-28 11:02 ?4432次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell GPU測(cè)試分析

    Jtti海外VPS微服務(wù)架構(gòu)下的日志采集與分析優(yōu)化方案

    隨著跨境業(yè)務(wù)和分布式應(yīng)用的普及,越來越多的企業(yè)在海外VPS上構(gòu)建微服務(wù)架構(gòu),以提升系統(tǒng)擴(kuò)展性和靈活性。然而,微服務(wù)帶來了一個(gè)新的挑戰(zhàn):日志數(shù)據(jù)分散在多個(gè)服務(wù)和節(jié)點(diǎn)中,若缺乏統(tǒng)一采集與
    的頭像 發(fā)表于 08-27 17:13 ?716次閱讀

    NVIDIA Omniverse Extension開發(fā)秘籍

    NVIDIA Omniverse 是一個(gè)模塊化平臺(tái),使用高級(jí) API 和微服務(wù)來構(gòu)建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 應(yīng)用。OpenUSD 功能強(qiáng)大的 3D 框架與
    的頭像 發(fā)表于 08-22 15:52 ?3880次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse Extension開發(fā)秘籍

    電商API的微服務(wù)架構(gòu)優(yōu)化策略

    ? 隨著電子商務(wù)的快速發(fā)展,API(應(yīng)用程序編程接口)已成為電商平臺(tái)的核心組件,負(fù)責(zé)連接用戶、商家和后臺(tái)系統(tǒng)。微服務(wù)架構(gòu)通過將應(yīng)用拆分為獨(dú)立、可擴(kuò)展的服務(wù)單元,顯著提升了系統(tǒng)的靈活性和可維護(hù)性。然而
    的頭像 發(fā)表于 07-23 14:30 ?743次閱讀
    電商API的<b class='flag-5'>微服務(wù)</b>架構(gòu)優(yōu)化策略

    蔡司“微服務(wù)”——全能在線售后管家,24小時(shí)守護(hù)您的設(shè)備!

    還在為設(shè)備故障煩惱? 急需技術(shù)支援卻找不到人? 想快速獲取用戶手冊(cè)或軟件升級(jí)? 現(xiàn)在 只需微信掃一掃設(shè)備上的藍(lán)色標(biāo)簽二維碼 蔡司“微服務(wù)”一鍵觸達(dá)! 9大功能板塊 全方位解決您的售后需求 服務(wù)更高
    發(fā)表于 07-10 16:44 ?1704次閱讀
    蔡司“<b class='flag-5'>微服務(wù)</b>”——全能在線售后管家,24小時(shí)守護(hù)您的設(shè)備!

    使用英偉達(dá) NVIDIA Air 服務(wù)將仿真與現(xiàn)實(shí)世界連接

    NVIDIA Air?通過創(chuàng)建與真實(shí)數(shù)據(jù)中心基礎(chǔ)設(shè)施部署相同的副本來實(shí)現(xiàn)云規(guī)模效率。借助 NVIDIA Air,您可以啟動(dòng)數(shù)百臺(tái)交換機(jī)和服務(wù)器,并使用單個(gè)腳本進(jìn)行配置。 NVIDIA
    的頭像 發(fā)表于 07-07 19:41 ?1507次閱讀
    使用英偉達(dá) <b class='flag-5'>NVIDIA</b> Air <b class='flag-5'>服務(wù)</b>將仿真與現(xiàn)實(shí)世界連接

    NVIDIA技術(shù)助力企業(yè)創(chuàng)建主權(quán)AI智能體

    AI Factory 的經(jīng)驗(yàn)證設(shè)計(jì)將加速基礎(chǔ)設(shè)施與軟件(包括全新 NVIDIA NIM 微服務(wù)和經(jīng)擴(kuò)展的 NVIDIA Blueprint)相結(jié)合,為各國(guó)和企業(yè)簡(jiǎn)化了全棧式 AI 開發(fā)
    的頭像 發(fā)表于 06-16 14:28 ?1549次閱讀

    2025 NVIDIA創(chuàng)業(yè)企業(yè)展示澳門站圓滿收官

    澳門站首次作為 NVIDIA 創(chuàng)業(yè)企業(yè)展示分站城市,聚焦 AI 智能體、物理 AI 和機(jī)器人等前沿技術(shù),更有 NVIDIA Omniverse、NVIDIA NIM 等最新技術(shù)分享,涵
    的頭像 發(fā)表于 05-29 14:12 ?1077次閱讀
    顺义区| 秦安县| 陆河县| 岱山县| 仁寿县| 浙江省| 丹阳市| 达孜县| 雷州市| 桦南县| 建宁县| 会同县| 侯马市| 南涧| 沁水县| 苏尼特左旗| 瑞安市| 龙口市| 天长市| 香河县| 依安县| 嘉黎县| 苏州市| 东山县| 三穗县| 清河县| 镇赉县| 安泽县| 阳曲县| 马鞍山市| 绍兴市| 尼木县| 深泽县| 东安县| 临洮县| 陵川县| 昔阳县| 辽宁省| 江津市| 虞城县| 滕州市|