日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA為本地代理式AI加速Gemma 4開放模型

麗臺(tái)科技 ? 來源:NVIDIA英偉達(dá) ? 2026-05-08 09:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:NVIDIA英偉達(dá)

開放模型正在推動(dòng)新一輪設(shè)備端 AI 浪潮,將創(chuàng)新從云端擴(kuò)展到日常本地設(shè)備。隨著這些模型不斷進(jìn)步,它們的價(jià)值愈發(fā)取決于能否訪問本地實(shí)時(shí)上下文,從而將有意義的洞察轉(zhuǎn)化為行動(dòng)。

為順應(yīng)這一轉(zhuǎn)變,Google 的 Gemma 4 家族全新引入了一類的小巧、快速且具備全模態(tài)能力的模型,能夠在廣泛設(shè)備上實(shí)現(xiàn)高效本地運(yùn)行。

Google 與 NVIDIA 合作,將 Gemma 4 為 NVIDIA GPU 進(jìn)行了優(yōu)化,在多種系統(tǒng)上實(shí)現(xiàn)高效性能。從數(shù)據(jù)中心部署到 NVIDIA RTX 驅(qū)動(dòng)的 PC 和工作站,再到 NVIDIA DGX Spark 個(gè)人 AI 超級(jí)計(jì)算機(jī)以及 NVIDIA Jetson Orin Nano 邊緣 AI 模塊。

Gemma 4:為 NVIDIA GPU 優(yōu)化的緊湊型模型

Gemma 4 開放模型家族的最新成員涵蓋 E2B、E4B、26B 和 31B 變體,專為從邊緣設(shè)備到高性能 GPU 的高效部署而設(shè)計(jì)。

3739c402-41fd-11f1-90a1-92fbcf53809c.png

所有配置均采用 Q4_K_M 量化、BS = 1、ISL = 4096 和 OSL = 128,在 NVIDIA GeForce RTX 5090 和 Mac M3 Ultra 臺(tái)式機(jī)上進(jìn)行測(cè)量。Token 生成吞吐量基于 llama.cpp b7789,使用 llama-bench 工具測(cè)得。

新一代緊湊型模型支持多種任務(wù),包括:

推理:在復(fù)雜問題求解任務(wù)中表現(xiàn)強(qiáng)勁。

編碼:面向開發(fā)者工作流的代碼生成與調(diào)試。

智能體:原生支持結(jié)構(gòu)化工具調(diào)用(函數(shù)調(diào)用)。

視覺、視頻和音頻能力:支持對(duì)象識(shí)別、自動(dòng)語(yǔ)音識(shí)別以及文檔或視頻智能等豐富的多模態(tài)交互。

交錯(cuò)式多模態(tài)輸入:可在單個(gè)提示詞中以任意順序混合文本和圖像。

多語(yǔ)言:開箱即用,支持超過 35 種語(yǔ)言,并在超過 140 種語(yǔ)言上進(jìn)行了預(yù)訓(xùn)練。

E2B 和 E4B 模型專為超高效、低延遲的邊緣推理而打造,可在包括 Jetson Nano 模塊在內(nèi)的多種設(shè)備上以接近零延遲的方式完全離線運(yùn)行。

26B 和 31B 模型專為高性能推理和以開發(fā)者為中心的工作流而設(shè)計(jì),非常適合代理式 AI 任務(wù)。這些優(yōu)化模型以便捷的方式提供業(yè)界領(lǐng)先的推理能力,可在 NVIDIA RTX GPU 和 DGX Spark 上高效運(yùn)行,為開發(fā)環(huán)境、編碼助手和智能體驅(qū)動(dòng)的工作流提供動(dòng)力。

隨著本地代理式 AI 持續(xù)升溫,OpenClaw 等應(yīng)用正讓 RTX PC、工作站和 DGX Spark 上的長(zhǎng)期 AI 助手成為現(xiàn)實(shí)。最新的 Gemma 4 模型兼容 OpenClaw,允許用戶構(gòu)建能夠調(diào)用個(gè)人文件、應(yīng)用程序和工作流上下文的本地智能體,以實(shí)現(xiàn)任務(wù)自動(dòng)化。查看頁(yè)面了解如何在 RTX GPU 和 DGX Spark 上免費(fèi)運(yùn)行 OpenClaw,或查看 DGX Spark OpenClaw playbook 。

查看 Google DeepMind 公告博客,了解 Gemma 4 家族最新成員的更多信息。

開始上手:在 RTX GPU 和 DGX Spark 上運(yùn)行 Gemma 4

NVIDIA 已與 Ollama 和 llama.cpp 合作,為各個(gè) Gemma 4 模型提供最佳本地部署體驗(yàn)。

要在本地使用 Gemma 4,用戶可以下載 Ollama 來運(yùn)行 Gemma 4 模型,或安裝 llama.cpp 并結(jié)合 Gemma 4 的 GGUF Hugging Face checkpoint 使用。Unsloth 提供首日支持,通過 Unsloth Studio 提供經(jīng)過優(yōu)化和量化的模型,以實(shí)現(xiàn)高效的本地微調(diào)和部署?,F(xiàn)在即可開始在 Unsloth Studio 中運(yùn)行和微調(diào) Gemma 4。

在 NVIDIA GPU 上運(yùn)行 Gemma 4 家族等開放模型能夠?qū)崿F(xiàn)最佳性能。NVIDIA Tensor Core 可加速 AI 推理工作負(fù)載,從而為本地執(zhí)行提供更高吞吐量和更低延遲。CUDA 軟件??纱_保與主流框架和工具廣泛兼容,使新模型從發(fā)布首日就能高效運(yùn)行。

這套組合使得 Gemma 4 等開放模型可在廣泛系統(tǒng)上擴(kuò)展部署,從邊緣側(cè)的 Jetson Orin Nano 到 RTX PC、工作站和 DGX Spark,無需深度優(yōu)化即可覆蓋。查看 NVIDIA 技術(shù)博客,了解如何在 NVIDIA GPU 上快速上手 Gemma 4 的更多細(xì)節(jié),并進(jìn)一步了解 NVIDIA 在開放模型方面的工作。

別錯(cuò)過:NVIDIA RTX AI PC 的最新進(jìn)展

請(qǐng)查看 RTX AI Garage 博客,了解 NVIDIA GTC 期間發(fā)布的一系列關(guān)于代理式 AI 的公告,例如面向本地智能體的新開放模型。這些模型包括 NVIDIA Nemotron 3 Nano 4B、Nemotron 3 Super 120B,以及針對(duì) Qwen 3.5 和 Mistral Small 4 的優(yōu)化。

NVIDIA 最近推出了 NVIDIA NemoClaw,這是一套開源技術(shù)棧,可通過提升安全性并支持本地模型來優(yōu)化 NVIDIA 設(shè)備上的 OpenClaw 體驗(yàn)。

Accomplish.ai 宣布推出 Accomplish FREE,一款免費(fèi)版的內(nèi)置模型的開源桌面 AI 智能體。它使用 NVIDIA GPU 在本地運(yùn)行開放權(quán)重模型,同時(shí)通過混合路由器在本地 RTX 硬件與云端之間動(dòng)態(tài)平衡工作負(fù)載,無需調(diào)用 API Key,即可實(shí)現(xiàn)快速、私密、零配置的執(zhí)行體驗(yàn)。

| 作者 Michael Fukuyama

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5708

    瀏覽量

    110155
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41492

    瀏覽量

    302806
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3846

    瀏覽量

    52295

原文標(biāo)題:從 RTX 到 Spark:NVIDIA 為本地代理式 AI 加速 Gemma 4

文章出處:【微信號(hào):Leadtek,微信公眾號(hào):麗臺(tái)科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA與Google Cloud攜手推進(jìn)代理式與物理AI發(fā)展

    NVIDIA Blackwell GPU 以及由 NVIDIA Nemotron 和 NeMo 提供支持、基于 Gemini Enterprise Agent Platform 的代理式 A
    的頭像 發(fā)表于 04-27 15:35 ?456次閱讀

    在Google AI Edge Gallery中探索Gemma 4的Agent Skills

    前不久,Google DeepMind 推出了 Gemma 4,這是一系列業(yè)界領(lǐng)先的開放模型,重塑了端側(cè) AI 的可能性。
    的頭像 發(fā)表于 04-23 09:19 ?559次閱讀

    Google正式推出最新開放模型Gemma 4

    今天,我們正式推出 Gemma 4 —— 這是我們迄今為止最智能的開放模型Gemma 4 專為
    的頭像 發(fā)表于 04-08 10:06 ?614次閱讀
    Google正式推出最新<b class='flag-5'>開放</b><b class='flag-5'>模型</b><b class='flag-5'>Gemma</b> <b class='flag-5'>4</b>

    NVIDIA攜手微軟加速機(jī)器人和物理AI的發(fā)展

    在 GTC 大會(huì)上,微軟宣布了其代理式和物理 AI 系統(tǒng)統(tǒng)一平臺(tái)的更新,加速從實(shí)驗(yàn)到生產(chǎn)落地的進(jìn)程。將 Microsoft Foundry 與 NVIDIA
    的頭像 發(fā)表于 03-23 15:21 ?1027次閱讀

    NVIDIA 擴(kuò)展開放模型系列,推動(dòng)代理式、物理和醫(yī)療 AI 下一階段發(fā)展

    NVIDIA BioNeMo 平臺(tái)的一部分,Proteina-Complexa 模型加速蛋白質(zhì)藥物研發(fā)——同時(shí)推出全新開放數(shù)據(jù)集,包含數(shù)百萬條由
    的頭像 發(fā)表于 03-17 09:18 ?561次閱讀
    <b class='flag-5'>NVIDIA</b> 擴(kuò)展<b class='flag-5'>開放</b><b class='flag-5'>模型</b>系列,推動(dòng)<b class='flag-5'>代理式</b>、物理和醫(yī)療 <b class='flag-5'>AI</b> 下一階段發(fā)展

    NVIDIA推出代理式AI藍(lán)圖與電信推理模型

    借助全新開源大型電信模型NVIDIA Blueprint,電信運(yùn)營(yíng)商能夠利用自有數(shù)據(jù)訓(xùn)練 AI 智能體,構(gòu)建自主網(wǎng)絡(luò)。
    的頭像 發(fā)表于 03-06 17:37 ?3119次閱讀

    生命科學(xué)領(lǐng)先企業(yè)采用 NVIDIA BioNeMo 平臺(tái)加速 AI 驅(qū)動(dòng)的藥物研發(fā)

    Discovery、Basecamp Research、Boltz 及生態(tài)系統(tǒng)領(lǐng)先企業(yè),將 NVIDIA BioNeMo、代理式 AI 與物理 AI 相結(jié)合,推動(dòng)科學(xué)研究與藥物研發(fā)規(guī)
    的頭像 發(fā)表于 01-14 11:40 ?690次閱讀
    生命科學(xué)領(lǐng)先企業(yè)采用 <b class='flag-5'>NVIDIA</b> BioNeMo 平臺(tái)<b class='flag-5'>加速</b> <b class='flag-5'>AI</b> 驅(qū)動(dòng)的藥物研發(fā)

    NVIDIA 推出 Nemotron 3 系列開放模型

    新聞?wù)?● Nemotron 3 系列開放模型包含 Nano、Super 和 Ultra 三種規(guī)模,具有極高的效率和領(lǐng)先的精度,適用于代理式 AI 應(yīng)用開發(fā)。 ● Nemotron
    的頭像 發(fā)表于 12-16 09:27 ?879次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Nemotron 3 系列<b class='flag-5'>開放</b><b class='flag-5'>模型</b>

    利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 A
    的頭像 發(fā)表于 12-01 09:25 ?1518次閱讀

    谷歌推出AI模型Gemma 3 270M

    過去幾個(gè)月,Gemma 開放模型系列的發(fā)展是激動(dòng)人心的。我們推出了 Gemma 3 和 Gemma 3 QAT,
    的頭像 發(fā)表于 09-11 15:09 ?1345次閱讀

    代理式 AI 重構(gòu) EDA:從對(duì)話助手到虛擬工程師

    電子發(fā)燒友網(wǎng)報(bào)道(文?/?吳子鵬)代理式?AI(Agentic AI)作為?AI?領(lǐng)域的新興方向,是一種能夠通過自主感知、推理、規(guī)劃與執(zhí)行,獨(dú)立完成復(fù)雜多步驟任務(wù)的?
    的頭像 發(fā)表于 08-28 07:54 ?3439次閱讀

    代理式AIAI智能體在不同行業(yè)中的實(shí)際應(yīng)用

    代理式 AI 的時(shí)代已經(jīng)到來。如今,代理式 AI 已經(jīng)驅(qū)動(dòng)應(yīng)用邁向深度場(chǎng)景融合與規(guī)?;涞?。這波演進(jìn)浪潮標(biāo)志著 AI 能力向自主執(zhí)行的躍遷。
    的頭像 發(fā)表于 07-28 14:28 ?1438次閱讀

    NVIDIA RTX AI加速FLUX.1 Kontext現(xiàn)已開放下載

    NVIDIA RTX 與 NVIDIA TensorRT 現(xiàn)已加速 Black Forest Labs 的最新圖像生成和編輯模型;此外,Gemma
    的頭像 發(fā)表于 07-16 09:16 ?2227次閱讀

    NVIDIA全棧加速代理式AI應(yīng)用落地

    在近期舉辦的 AWS 中國(guó)峰會(huì)上,NVIDIA 聚焦于“NVIDIA 全棧加速代理式 AI 應(yīng)用落地”,深入探討了
    的頭像 發(fā)表于 07-14 11:41 ?1494次閱讀

    NVIDIA攜手微軟加速代理式AI發(fā)展

    代理式 AI 正在重新定義科學(xué)探索,推動(dòng)各行各業(yè)的研究突破和創(chuàng)新發(fā)展。NVIDIA 和微軟正通過深化合作提供先進(jìn)的技術(shù),從云到 PC 加速代理式
    的頭像 發(fā)表于 05-27 14:03 ?1265次閱讀
    湘阴县| 宜兰市| 沙雅县| 剑阁县| 玉田县| 宜宾市| 准格尔旗| 辛集市| 保靖县| 鹤峰县| 淮北市| 兴国县| 黑龙江省| 蛟河市| 土默特左旗| 桐梓县| 三亚市| 墨竹工卡县| 崇信县| 龙口市| 青州市| 郸城县| 高安市| 长海县| 同江市| 名山县| 壤塘县| 武山县| 嘉定区| 宝山区| 镇原县| 景德镇市| 剑川县| 横峰县| 咸宁市| 宜城市| 稷山县| 丽江市| 迭部县| 公安县| 张北县|