日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA在多模態(tài)生成式AI領(lǐng)域的突破性進(jìn)展

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2025-05-15 10:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在今年的國(guó)際學(xué)習(xí)表征大會(huì)(ICLR)上,NVIDIA 發(fā)表了 70 余篇論文,其內(nèi)容涵蓋醫(yī)療、機(jī)器人自動(dòng)駕駛汽車以及大語(yǔ)言模型等領(lǐng)域。

推動(dòng) AI 進(jìn)步需要采用全棧式方法,這依賴于包括加速處理器和網(wǎng)絡(luò)技術(shù)在內(nèi)的強(qiáng)大計(jì)算基礎(chǔ)設(shè)施,并將其與優(yōu)化的編譯器、算法及應(yīng)用程序相連接。

NVIDIA Research 正在該領(lǐng)域進(jìn)行全方位的創(chuàng)新,并在此過程中為幾乎所有行業(yè)提供支持。在近日舉行的國(guó)際學(xué)習(xí)表征大會(huì)(ICLR)上,NVIDIA 提交了 70 余篇論文,展示了 AI 在自動(dòng)駕駛汽車、醫(yī)療、多模態(tài)內(nèi)容創(chuàng)作、機(jī)器人等領(lǐng)域的應(yīng)用進(jìn)展。

NVIDIA 應(yīng)用深度學(xué)習(xí)研究副總裁 Bryan Catanzaro 表示:“ICLR 是全球最具影響力的 AI 會(huì)議之一,研究人員在此發(fā)布推動(dòng)各行各業(yè)進(jìn)步的關(guān)鍵技術(shù)創(chuàng)新。NVIDIA 今年提交的研究成果旨在加速計(jì)算堆棧的各個(gè)層級(jí),從而增強(qiáng) AI 在各行業(yè)的影響力和實(shí)用性。”

解決現(xiàn)實(shí)世界挑戰(zhàn)的研究工作

NVIDIA 在 ICLR 上提交的多篇論文聚焦多模態(tài)生成式 AI 領(lǐng)域的突破性進(jìn)展,以及 AI 訓(xùn)練和合成數(shù)據(jù)生成的新方法,具體包括:

Fugatto:Fugatto 是世界上最靈活的音頻生成式 AI 模型。根據(jù)輸入的文本提示和音頻文件,它能夠生成或修改包含任意的音樂、人聲和聲音組合的作品。在 ICLR 上展示的其他 NVIDIA 模型對(duì)音頻大語(yǔ)言模型(LLM)進(jìn)行了改進(jìn),以使其更好地理解語(yǔ)音。

HAMSTER:這篇論文提出了一種視覺-語(yǔ)言-動(dòng)作模型的分層設(shè)計(jì)方案,它可以更好地從域外微調(diào)數(shù)據(jù)(即無需在真實(shí)機(jī)器人硬件上收集的低成本數(shù)據(jù))中遷移知識(shí),進(jìn)而提升機(jī)器人在測(cè)試場(chǎng)景中的技能水平。

Hymba:這個(gè)小語(yǔ)言模型家族采用混合模型架構(gòu),由此創(chuàng)造的 LLM 融合了 Transformer 模型和狀態(tài)空間模型的優(yōu)勢(shì),實(shí)現(xiàn)了高分辨率記憶檢索、高效的上下文總結(jié)以及常識(shí)推理任務(wù)。借助這種混合模型架構(gòu),Hymba 在保持性能的前提下將吞吐量提升了 3 倍,緩存減少至約1/4。

LongVILA:該訓(xùn)練流程實(shí)現(xiàn)了高效的視覺語(yǔ)言模型訓(xùn)練與推理,以支持長(zhǎng)視頻理解。使用長(zhǎng)視頻訓(xùn)練 AI 模型時(shí),需要大量算力和密集內(nèi)存,而這篇論文提出的系統(tǒng)可以高效地并行處理長(zhǎng)視頻的訓(xùn)練和推理,在 256 塊 GPU 上進(jìn)行訓(xùn)練時(shí)可擴(kuò)展到多達(dá) 200 萬個(gè) token。LongVILA 在 9 個(gè)主流視頻基準(zhǔn)測(cè)試中均達(dá)到當(dāng)前最優(yōu)性能。

LLaMaFlex:這篇論文提出了一種全新的零樣本生成技術(shù),可從單個(gè)大型模型來構(gòu)建一系列壓縮 LLM 家族。研究人員發(fā)現(xiàn),LLaMaFlex 生成的壓縮模型在精度上媲美或優(yōu)于現(xiàn)有剪枝、彈性架構(gòu)及從頭訓(xùn)練的模型。相比剪枝和知識(shí)蒸餾等技術(shù),這種能力能夠顯著降低訓(xùn)練模型家族的成本。

Proteina:該模型可以生成多樣且可設(shè)計(jì)的蛋白質(zhì)骨架,即維持蛋白質(zhì)結(jié)構(gòu)的框架。它采用 Transformer 模型架構(gòu),參數(shù)數(shù)量是此前模型的 5 倍。

SRSA:這個(gè)框架解決了使用現(xiàn)有技能庫(kù)教會(huì)機(jī)器人執(zhí)行新任務(wù)的難題。這意味著機(jī)器人無需從頭學(xué)習(xí),而是能夠?qū)F(xiàn)有技能應(yīng)用并適配到新任務(wù)中。研究人員開發(fā)了預(yù)測(cè)最相關(guān)預(yù)置技能的框架,使機(jī)器人在執(zhí)行未知任務(wù)時(shí)的零樣本成功率提高了 19%。

STORM:通過僅需少量快照即可推斷出精確的 3D 表示,該模型能夠重建動(dòng)態(tài)戶外場(chǎng)景,比如行駛的汽車或隨風(fēng)搖曳的樹木。該模型能夠在 200 毫秒內(nèi)重建大規(guī)模戶外場(chǎng)景,在自動(dòng)駕駛開發(fā)中具有應(yīng)用潛力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31494

    瀏覽量

    223865
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5696

    瀏覽量

    110142
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41320

    瀏覽量

    302703

原文標(biāo)題:NVIDIA Research 在 ICLR 大會(huì)引領(lǐng)新一波多模態(tài)生成式 AI 浪潮

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    模態(tài)大模型 前沿算法與實(shí)戰(zhàn)應(yīng)用 第一季》精品課程簡(jiǎn)介

    技術(shù),需要開發(fā)者同時(shí)具備模態(tài)編碼、跨模態(tài)對(duì)齊、系統(tǒng)優(yōu)化等跨領(lǐng)域能力。從算法原理到項(xiàng)目落地,關(guān)鍵在于理解不同模態(tài)的互補(bǔ),并通過合理的融合策略
    發(fā)表于 05-01 17:46

    Adobe智能體攜手NVIDIA與WPP打造突破性創(chuàng)意平臺(tái)

    NVIDIA OpenShell 運(yùn)行時(shí)提供安全保障的創(chuàng)意 AI 智能體可生成符合品牌風(fēng)格的內(nèi)容,重塑了品牌創(chuàng)建、個(gè)性化和激活內(nèi)容的方式。
    的頭像 發(fā)表于 04-27 15:30 ?319次閱讀

    雷曼光電入選ICDT 2026顯示行業(yè)十大突破性進(jìn)展榜單

    4月1日,國(guó)際信息顯示學(xué)會(huì)中國(guó)區(qū)(簡(jiǎn)稱:SID China)主辦的2026國(guó)際顯示技術(shù)大會(huì)(ICDT 2026)重慶正式啟幕,作為大會(huì)十周年里程碑的重磅環(huán)節(jié),“顯示行業(yè)十大突破性進(jìn)展”榜單同期揭曉,雷曼光電核心產(chǎn)品——雷曼Mi
    的頭像 發(fā)表于 04-03 11:09 ?542次閱讀

    嵌入AI開發(fā)必看:杜絕幻覺,才是工業(yè)級(jí)IDE的核心底氣

    入門開發(fā)者也能快速完成工業(yè)級(jí) AI 應(yīng)用開發(fā),同時(shí)減少平臺(tái)切換帶來的工具鏈維護(hù)成本。 工業(yè)嵌入領(lǐng)域,
    發(fā)表于 03-18 13:49

    融合場(chǎng)耦合效應(yīng):生成人工智能技術(shù)演進(jìn)及其航空發(fā)動(dòng)機(jī)復(fù)雜工程系統(tǒng)中的賦能機(jī)制研究

    人工智能技術(shù)正經(jīng)歷著從感知智能向生成智能、再向代理智能與物理智能演進(jìn)的深刻變革。在這一進(jìn)程中,生成AI技術(shù)的突破性發(fā)展尤為引人矚目,其不僅
    的頭像 發(fā)表于 02-26 10:07 ?693次閱讀
    融合<b class='flag-5'>多</b>場(chǎng)耦合效應(yīng):<b class='flag-5'>生成</b><b class='flag-5'>式</b>人工智能技術(shù)演進(jìn)及其<b class='flag-5'>在</b>航空發(fā)動(dòng)機(jī)復(fù)雜工程系統(tǒng)中的賦能機(jī)制研究

    NVIDIA TensorRT Edge-LLM汽車與機(jī)器人行業(yè)的落地應(yīng)用

    大語(yǔ)言模型(LLM)與模態(tài)推理系統(tǒng)正迅速突破數(shù)據(jù)中心的局限。越來越多的汽車與機(jī)器人領(lǐng)域的開發(fā)者希望將對(duì)話
    的頭像 發(fā)表于 01-14 09:10 ?3263次閱讀
    <b class='flag-5'>NVIDIA</b> TensorRT Edge-LLM<b class='flag-5'>在</b>汽車與機(jī)器人行業(yè)的落地應(yīng)用

    NVIDIAISC 2025分享最新超級(jí)計(jì)算進(jìn)展

    NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代網(wǎng)絡(luò)和量子技術(shù)實(shí)現(xiàn)了飛躍。 SC25 上展示的加速系統(tǒng)突顯了全球超級(jí)計(jì)算和 AI
    的頭像 發(fā)表于 11-25 10:59 ?1126次閱讀
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>在</b>ISC 2025分享最新超級(jí)計(jì)算<b class='flag-5'>進(jìn)展</b>

    NVIDIA技術(shù)推動(dòng)化學(xué)和材料科學(xué)發(fā)展

    NVIDIA Holoscan 推動(dòng)實(shí)時(shí)納米成像技術(shù)取得突破性進(jìn)展NVIDIA ALCHEMI 促進(jìn)先進(jìn)材料和冷卻技術(shù)的發(fā)現(xiàn)。
    的頭像 發(fā)表于 11-25 10:45 ?855次閱讀

    今日看點(diǎn):消息稱已有模組企業(yè)調(diào)整原定產(chǎn)品規(guī)劃;華為將發(fā)布 AI 領(lǐng)域突破性技術(shù)

    華為將發(fā)布 AI 領(lǐng)域突破性技術(shù) 業(yè)內(nèi)消息指出,華為將于 11 月 21 日發(fā)布一項(xiàng) AI 領(lǐng)域突破性
    發(fā)表于 11-17 10:47 ?1356次閱讀

    清華大學(xué)石墨負(fù)極儲(chǔ)能領(lǐng)域取得系列突破性進(jìn)展

    清華大學(xué)石墨負(fù)極儲(chǔ)能領(lǐng)域取得系列突破性進(jìn)展 ? 電子發(fā)燒友網(wǎng)綜合報(bào)道 全球能源結(jié)構(gòu)向清潔能源轉(zhuǎn)型的背景下,大規(guī)模電化學(xué)儲(chǔ)能技術(shù)成為保障能
    的頭像 發(fā)表于 09-22 02:34 ?5084次閱讀
    清華大學(xué)<b class='flag-5'>在</b>石墨負(fù)極儲(chǔ)能<b class='flag-5'>領(lǐng)域</b>取得系列<b class='flag-5'>突破性</b><b class='flag-5'>進(jìn)展</b>

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    2)滲透AI的優(yōu)勢(shì) 5、大型模態(tài)模型 模態(tài)模型(LMM)可以被理解成大模型的更高級(jí)版本,
    發(fā)表于 09-18 15:31

    NVIDIA AI助力科學(xué)研究領(lǐng)域持續(xù)突破

    隨著 AI 技術(shù)的廣泛應(yīng)用,AI 正在成為科學(xué)研究的引擎。NVIDIA 作為重要的技術(shù)推手,持續(xù)驅(qū)動(dòng)著 AI 系統(tǒng)解鎖更多領(lǐng)域的科學(xué)
    的頭像 發(fā)表于 08-05 16:30 ?1342次閱讀

    龍芯產(chǎn)品賦能千行百業(yè)的突破性進(jìn)展

    近日,2025龍芯產(chǎn)品發(fā)布暨用戶大會(huì)在北京成功舉辦。本次大會(huì)集中展示了龍芯從基礎(chǔ)民生到國(guó)防安全、從石油化工到航空航天、從智慧農(nóng)業(yè)到軌道交通等領(lǐng)域的全棧創(chuàng)新應(yīng)用成果,多角度、全方位呈現(xiàn)了龍芯用科技賦能千行百業(yè)的突破性進(jìn)展,為與會(huì)嘉
    的頭像 發(fā)表于 07-11 09:48 ?1461次閱讀

    NVIDIA助力圖靈新訊美推出企業(yè)級(jí)模態(tài)視覺大模型融合解決方案

    中國(guó)推出企業(yè)級(jí)模態(tài)視覺大模型融合解決方案,推動(dòng)先進(jìn) AI 模型交通治理、工業(yè)質(zhì)檢、金融風(fēng)控等領(lǐng)域實(shí)現(xiàn)高效識(shí)別、精準(zhǔn)預(yù)警和穩(wěn)定交付。
    的頭像 發(fā)表于 06-26 09:17 ?1551次閱讀

    使用NVIDIA Earth-2生成AI基礎(chǔ)模型革新氣候建模

    NVIDIA 正通過 cBottle(Climate in a Bottle 的簡(jiǎn)稱)為這項(xiàng)工作帶來新的突破,這是全球首個(gè)專為以公里尺度分辨率模擬全球氣候而設(shè)計(jì)的生成
    的頭像 發(fā)表于 06-12 15:54 ?1473次閱讀
    枣庄市| 广元市| 昌平区| 巨野县| 余干县| 洛隆县| 南川市| 三亚市| 微博| 永嘉县| 云浮市| 寻乌县| 开平市| 德清县| 旅游| 资阳市| 樟树市| 永和县| 会宁县| 垦利县| 比如县| 巴林右旗| 盐源县| 南开区| 绥德县| 盐池县| 方正县| 松溪县| 桃源县| 鄂伦春自治旗| 大荔县| 元朗区| 福州市| 广汉市| 上思县| 陵川县| 濉溪县| 多伦县| 威信县| 上杭县| 弥渡县|