日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用 NVIDIA AI Foundation Models 構(gòu)建自定義企業(yè)級生成式 AI

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:未知 ? 2023-11-17 21:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

wKgaomVXbAeAcNF2AADs9hQoRuI274.jpg

在生成式 AI 領(lǐng)域,構(gòu)建企業(yè)級大語言模型(LLM)需要具備采集高質(zhì)量數(shù)據(jù)、設(shè)置加速基礎(chǔ)設(shè)施和優(yōu)化模型方面的專業(yè)知識。

開發(fā)者可以從預(yù)訓(xùn)練模型開始,根據(jù)自己的用例對模型進(jìn)行微調(diào),從而節(jié)省時間并使其解決方案更快地投入市場。開發(fā)者需要一種簡單的方法來試用模型,并通過 API 集成這些模型來評估其能力。這有助于他們確定哪種模型最適合其應(yīng)用。

NVIDIA AI Foundation Models

NVIDIA AI Foundation Models是由精心挑選的社區(qū)模型和 NVIDIA 構(gòu)建的模型組成,并針對峰值性能進(jìn)行了優(yōu)化。開發(fā)者可以通過 API 或圖形用戶界面直接在瀏覽器中快速使用這些模型,無需進(jìn)行任何設(shè)置。這些模型通過NVIDIA TensorRT-LLM和激活感知權(quán)重量化(AWQ)技術(shù)進(jìn)行優(yōu)化,以便確定最高吞吐量和最低延遲的配置,并且在 NVIDIA 加速計(jì)算堆棧上大規(guī)模運(yùn)行。

NVIDIA Nemotron-3 8B 系列 LLM 介紹

NVIDIA Nemotron-3 8B系列模型為想要構(gòu)建生產(chǎn)就緒生成式 AI 應(yīng)用的客戶提供了基礎(chǔ)。這些模型是基于可靠的數(shù)據(jù)集構(gòu)建,其運(yùn)行性能可媲美規(guī)模遠(yuǎn)超它們的模型,因此非常適合企業(yè)部署。

NVIDIA Nemotron-3 8B 系列模型的一大關(guān)鍵優(yōu)勢在于其具有多語言功能,這使其成為全球企業(yè)的理想選擇。這些模型精通 53 種語言,包括英語、德語、俄語、西班牙語、法語、日語、中文、意大利語和荷蘭語。

該系列模型還采用了一系列對齊技術(shù),包括監(jiān)督微調(diào)(SFT)、人類反饋強(qiáng)化學(xué)習(xí)(RLHF)以及全新的NVIDIA SteerLM定制化技術(shù),使客戶可以在推理時調(diào)整模型。無論是自定義模型還是從頭開始運(yùn)行模型,這些變體為支持各種不同的用例打下了基礎(chǔ)。

Nemotron-3 8B 系列模型包含:

  • Nemotron-3-8B-Chat-SteerLM:一個基于 NV-Nemotron-3-8B 基本模型的生成式語言模型,專為在推理過程中使用戶能夠采用 SteerLM 技術(shù)控制模型輸出而定制。

  • Nemotron-3-8B-QA:一個基于 NV-Nemotron-3-8B 基礎(chǔ)模型的生成式語言模型,可針對問題回答指令進(jìn)行進(jìn)一步微調(diào)。

經(jīng)過 NVIDIA 優(yōu)化的社區(qū)模型

此外,NVIDIA 還提供領(lǐng)先的社區(qū)模型,這些模型均經(jīng)過 NVIDIA TensorRT-LLM 的優(yōu)化,具有最高的性價比,企業(yè)機(jī)構(gòu)可根據(jù)企業(yè)應(yīng)用對它們進(jìn)行自定義。這些模型包括:

  • Llama 2:最流行的 LLM 之一,能夠根據(jù)提示生成文本。

  • Stable Diffusion XL:一種熱門的生成式 AI 模型,可使用文本創(chuàng)建富有表現(xiàn)力的圖像。

  • Code Llama:Llama 2 模型的微調(diào)版本,可使用 JavaC++、Python 等多種流行語言生成代碼。

  • Mistral 7B:一種能遵循指令、完成請求并生成有創(chuàng)意的文本格式的 LLM。

  • Contrastive Language-Image Pre-Training (CLIP):一種流行的開源模型,能同時理解圖像和文本,從而完成圖像分類、物體檢測等任務(wù)。

當(dāng)開發(fā)者確定了合適的基礎(chǔ)模型后,就可以輕松地對這些模型進(jìn)行微調(diào)和部署,無論是在自己的基礎(chǔ)設(shè)施上,還是通過NVIDIA DGX Cloud在 NVIDIA 維護(hù)的基礎(chǔ)設(shè)施上。

下面讓我們一起體驗(yàn)、定制和部署微調(diào)后的 Llama 2 模型。

體驗(yàn) Llama 2

NVIDIA 提供了一個易于使用的界面,使開發(fā)者能夠直接在瀏覽器上與 Llama 2 模型進(jìn)行交互。只需在提示字段中輸入文本并點(diǎn)擊生成,模型就會立即開始生成信息回復(fù)。

在圖 1 中,用戶要求模型進(jìn)行 SQL 查詢,檢索 2021 年第一季度至少消費(fèi) 50,000 美元的客戶名單。模型不但正確理解了用戶的查詢,并提供了答案和詳細(xì)解釋。

wKgaomVXbAeASNiOAAHfhVJza_w002.png

圖 1. Llama 2 模型對 SQL 查詢“獲取 2021 年第一季度

至少消費(fèi) 50,000 美元的客戶名單”所做出的響應(yīng)

而開發(fā)者通常對代碼更感興趣。因此,NVIDIA 也直接在瀏覽器中提供了一個 API 小工具,讓用戶可以通過 API 無縫體驗(yàn)這些模型。

如要試用這個瀏覽器內(nèi)置的 API,請單擊 API 模式,然后從下拉菜單中選擇您傾向的語言。圖 2 顯示了通過 cURL 調(diào)用該 API 的 API 指令。

wKgaomVXbAeAfx5VAAJT5xM-gms898.png

圖 2. 用于體驗(yàn) Llama 2 模型的

瀏覽器內(nèi)置 API 小工具(cURL 語言)

自定義模型

通常情況下,一般模型無法滿足開發(fā)者的需求,必須使用專有數(shù)據(jù)進(jìn)行微調(diào)。因此,NVIDIA 提供了多種自定義可用模型的途徑。

NVIDIA NeMo是一個端到端企業(yè)級云原生框架,開發(fā)者可用它來構(gòu)建、定制和部署具有數(shù)十億參數(shù)的生成式 AI 模型。此外,NeMo 還提供用于微調(diào) LLM(如 Llama)的 API。

為了快速上手,我們也提供了一個 NVIDIA LaunchPad 實(shí)驗(yàn)室。這個通用的試驗(yàn)場可對最新的 NVIDIA 企業(yè)級軟硬件進(jìn)行全方位測試。

該 LaunchPad 實(shí)驗(yàn)室體驗(yàn)中的以下示例使用自定義數(shù)據(jù)集對 Llama 2 7B 文本-文本模型進(jìn)行了微調(diào),以更好地執(zhí)行問答任務(wù)。

  1. 如要開始使用,請單擊“Llama 2 微調(diào)實(shí)驗(yàn)室(https://www.nvidia.com/en-us/launchpad/ai/customize-llama-2-with-enterprise-data/)并申請?jiān)L問。在 Launchpad 上工作時,Llama 2 模型文件會以 .nemo 檢查點(diǎn)的形式預(yù)先下載,從而實(shí)現(xiàn)與 NVIDIA NeMo Framework 的微調(diào)兼容性。

  2. 模型準(zhǔn)備就緒后,我們從 Hugging Face 加載 Dolly 數(shù)據(jù)集(https://huggingface.co/datasets/databricks/databricks-dolly-15k)并對其進(jìn)行預(yù)處理,刪除不必要的字段、重命名某些字段,以更好地適應(yīng)提示調(diào)整任務(wù),并將數(shù)據(jù)集分割成訓(xùn)練文件和測試文件。

    dataset=load_dataset("aisquared/databricks-dolly-15k")

    面所示的是一個數(shù)據(jù)樣本。為了適應(yīng)特定的用例,數(shù)據(jù)集可以互換。

    {
    "question": "When did Virgin Australia start operating?", 
    "context": "Virgin Australia, the trading name of Virgin Australia Airlines Pty Ltd, is an Australian-based airline. It is the largest airline by fleet size to use the Virgin brand. It commenced services on 31 August 2000 as Virgin Blue, with two aircraft on a single route.[3] It suddenly found itself as a major airline in Australia's domestic market after the collapse of Ansett Australia in September 2001. The airline has since grown to directly serve 32 cities in Australia, from hubs in Brisbane, Melbourne and Sydney.[4]", 
    "answer": "Virgin Australia commenced services on 31 August 2000 as Virgin Blue, with two aircraft on a single route.", 
    "taskname": "genqa"
    }

  3. 然后,通過更新默認(rèn) NeMo 配置文件的某些字段來設(shè)置微調(diào)作業(yè),以適應(yīng)當(dāng)前的訓(xùn)練任務(wù)。接著,使用 NeMo 訓(xùn)練腳本啟動作業(yè),運(yùn)行微調(diào)并在過程中生成模型檢查點(diǎn)。

  4. 微調(diào)任務(wù)完成后,我們就可以運(yùn)行筆記本內(nèi)推理,生成一些示例輸出,并評估微調(diào)后模型的性能。

  5. 接著讓我們來看看這樣一個示例輸出。我們在上下文中提供了兩種產(chǎn)品的描述:割草機(jī)和廚房機(jī)器人,并詢問模型割草機(jī)是否由太陽能供電。

    該模型準(zhǔn)確地把握了上下文,并給出了“是”的回答。在對該模型進(jìn)行微調(diào)后,它就能夠根據(jù)所提供的上下文準(zhǔn)確回答我們的問題了。

    {
    "input": "Context: The Auto Chef Master is a personal kitchen robot that effortlessly turns raw ingredients into gourmet meals with the precision of a Michelin-star chef. The Eco Lawn Mower is a solar powered high-tech lawn mower that provides an eco-friendly and efficient way to maintain your lawn. Question: Is the lawn mower product solar powered? 
    Answer:", 
    "pred": "Yes", 
    "label": "Yes, the Eco Lawn Mower is solar powered.", 
    "taskname": "genqa"
    }

部署模型

NVIDIA AI FoundationEndpoints提供完全無服務(wù)器和可擴(kuò)展的 API,這些 API 可部署在您自己的云或NVIDIA DGX Cloud上。填寫此表(https://developer.nvidia.com/login)即可開始使用 AI Foundation Endpoints。

您還可以使用NVIDIA AI Enterprise在自己的云或數(shù)據(jù)中心基礎(chǔ)設(shè)施上進(jìn)行部署。這一端到端的云原生軟件平臺憑借其企業(yè)級的安全性、穩(wěn)定性、可管理性和支持,能夠加速生產(chǎn)級生成式 AI 的開發(fā)和部署。當(dāng)您準(zhǔn)備從實(shí)驗(yàn)轉(zhuǎn)向生產(chǎn)階段時,就可以使用 NVIDIA AI Enterprise 的企業(yè)級運(yùn)行時來微調(diào)和部署這些模型。

更多信息

通過這篇文章,我們了解了 NVIDIA AI Foundation 模型是如何通過提供易于使用的模型體驗(yàn)界面,以及簡化的模型微調(diào)和部署路徑,從而幫助企業(yè)開發(fā)者找到適合各種用例的模型。

歡迎探索NVIDIA NGC 目錄中提供的不同AI Foundation 模型(https://catalog.ngc.nvidia.com/ai-foundation-models),找到適合您的模型。

GTC 2024 將于 2024 年 3 月 18 至 21 日在美國加州圣何塞會議中心舉行,線上大會也將同期開放。點(diǎn)擊“閱讀原文”掃描下方海報(bào)二維碼,立即注冊 GTC 大會。


原文標(biāo)題:利用 NVIDIA AI Foundation Models 構(gòu)建自定義企業(yè)級生成式 AI

文章出處:【微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4116

    瀏覽量

    99660

原文標(biāo)題:利用 NVIDIA AI Foundation Models 構(gòu)建自定義企業(yè)級生成式 AI

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    黑馬-Java+AI新版V16零基礎(chǔ)就業(yè)班百度云網(wǎng)盤下載+Java+AI全棧開發(fā)工程師

    傳統(tǒng)開發(fā)升級,Java+AI 融合開發(fā)精講——構(gòu)建下一代企業(yè)級智能應(yīng)用的技術(shù)棧重塑 在人工智能加速滲透至各行各業(yè)的當(dāng)下,Java 開發(fā)者正面臨一個關(guān)鍵轉(zhuǎn)折點(diǎn):要么被動旁觀 AI 能力的
    發(fā)表于 05-01 11:29

    [完結(jié)15章]Java轉(zhuǎn) AI高薪領(lǐng)域必備-從0到1打通生產(chǎn)AI Agent開發(fā)

    編寫的推理引擎(如TensorRT、ONNX Runtime)進(jìn)行無縫對接。將訓(xùn)練好的模型封裝為標(biāo)準(zhǔn)的Java微服務(wù),利用JVM的內(nèi)存管理與線程池技術(shù),去承載企業(yè)級高吞吐的AI推理請求,這才是Java
    發(fā)表于 04-30 13:46

    Java轉(zhuǎn) AI高薪領(lǐng)域必備 從0到1打通生產(chǎn)AI Agent開發(fā) 教程資料

    的是直接的“利潤增量”。 Java程序員轉(zhuǎn)型AI Agent開發(fā),其最大的經(jīng)濟(jì)優(yōu)勢在于“跨界的稀缺性”。懂大模型底層算法的人往往不懂企業(yè)級復(fù)雜的Java后端架構(gòu)、微服務(wù)治理和歷史遺留的沉疴數(shù)據(jù);而傳統(tǒng)
    發(fā)表于 04-29 17:08

    MathWorks 加入 EDGE AI FOUNDATION,推進(jìn)面向工程化系統(tǒng)的嵌入 AI 發(fā)展

    全新合作將支持工程師在 MATLAB 和 PyTorch 中構(gòu)建 AI 模型,將其集成到系統(tǒng)仿真中,并部署到嵌入設(shè)備 MathWorks 近期宣布加入 EDGE AI
    的頭像 發(fā)表于 04-17 15:46 ?171次閱讀

    NVIDIA與電信領(lǐng)導(dǎo)企業(yè)共建AI網(wǎng)格

    AT&T、T-Mobile、Comcast、Spectrum 等公司正在使用 NVIDIA AI 基礎(chǔ)設(shè)施構(gòu)建 AI 網(wǎng)格,Personal AI
    的頭像 發(fā)表于 04-10 16:16 ?347次閱讀

    嵌入AI開發(fā)必看:杜絕幻覺,才是工業(yè)IDE的核心底氣

    AI浪潮正在重塑嵌入開發(fā)范式,代碼生成效率大幅提升的同時,“AI幻覺”問題卻成為工業(yè)場景落地的核心阻礙——看似合規(guī)的代碼暗藏時序錯誤、硬件邏輯沖突等隱性風(fēng)險,傳統(tǒng) IDE 缺乏工業(yè)
    發(fā)表于 03-18 13:49

    Commotion推出由NVIDIA Nemotron?開源模型驅(qū)動的企業(yè)級AI操作系統(tǒng),助力數(shù)字員工團(tuán)隊(duì)提升生產(chǎn)力

    ? ? 企業(yè)級AI操作系統(tǒng)將上下文、編排與執(zhí)行相統(tǒng)一,賦能受管控的AI員工自主化、規(guī)模化地完成真實(shí)業(yè)務(wù)任務(wù)。 集成語音AIAI OS支持超
    的頭像 發(fā)表于 02-25 21:17 ?219次閱讀
    Commotion推出由<b class='flag-5'>NVIDIA</b> Nemotron?開源模型驅(qū)動的<b class='flag-5'>企業(yè)級</b><b class='flag-5'>AI</b>操作系統(tǒng),助力數(shù)字員工團(tuán)隊(duì)提升生產(chǎn)力

    利用BigQuery MCP服務(wù)器開發(fā)面向數(shù)據(jù)分析的生成AI應(yīng)用

    AI 智能體接入企業(yè)數(shù)據(jù),其實(shí)不需要復(fù)雜的自定義集成或耗費(fèi)數(shù)周開發(fā)。12 月,我們推出了面向 Google 服務(wù)的全托管遠(yuǎn)程 Model Context Protocol (MC
    的頭像 發(fā)表于 02-25 10:22 ?472次閱讀
    <b class='flag-5'>利用</b>BigQuery MCP服務(wù)器開發(fā)面向數(shù)據(jù)分析的<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>應(yīng)用

    智能硬件通過小聆AI自定義MCP應(yīng)用開發(fā)操作講解

    智能硬件通過小聆AI自定義MCP應(yīng)用開發(fā)操作講解 前言 MCP(Modular Communication Protocol,模塊化通信協(xié)議)為智能硬件帶來多方面顯著優(yōu)勢:它通過標(biāo)準(zhǔn)化的通信接口
    發(fā)表于 10-14 15:50

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    主要步驟: ①溯因②假說③實(shí)驗(yàn) 1、科學(xué)推理的類型 ①演繹②歸納 2、自動化科學(xué)發(fā)現(xiàn)框架 AI-笛卡兒-----自動化科學(xué)發(fā)現(xiàn)框架,利用數(shù)據(jù)和知識來生成和評估候選的科學(xué)假說。 4項(xiàng)規(guī)則:三、直覺
    發(fā)表于 09-17 11:45

    2025 IBM中國企業(yè)級AI巔峰論壇即將開幕

    隨著中國企業(yè)加速數(shù)智化轉(zhuǎn)型,IBM 始終致力于幫助中國客戶、合作伙伴看清方向、打好基礎(chǔ),加速企業(yè)級AI應(yīng)用的落地和投資回報(bào)。面向新的 AI 時代,IBM 持續(xù)升級其服務(wù)于
    的頭像 發(fā)表于 08-26 15:30 ?1339次閱讀

    Cognizant加速AI模型企業(yè)級開發(fā)

    -Cognizant推出AI Training Data Services,助力企業(yè)級AI模型加速開發(fā) Cognizant是數(shù)據(jù)與AI模型訓(xùn)練合作伙伴,長期深受大型數(shù)字原生先鋒
    的頭像 發(fā)表于 07-31 17:25 ?831次閱讀

    NVIDIA全棧加速代理式AI應(yīng)用落地

    在近期舉辦的 AWS 中國峰會上,NVIDIA 聚焦于“NVIDIA 全棧加速代理式 AI 應(yīng)用落地”,深入探討了代理式 AI (Agentic A
    的頭像 發(fā)表于 07-14 11:41 ?1483次閱讀

    HarmonyOS應(yīng)用自定義鍵盤解決方案

    自定義鍵盤是一種替換系統(tǒng)默認(rèn)鍵盤的解決方案,可實(shí)現(xiàn)鍵盤個性化交互。允許用戶結(jié)合業(yè)務(wù)需求與操作習(xí)慣,對按鍵布局進(jìn)行可視化重構(gòu)、設(shè)置多功能組合鍵位,使輸入更加便捷和舒適。在安全防護(hù)層面,自定義鍵盤可以
    的頭像 發(fā)表于 06-05 14:19 ?2673次閱讀

    NVIDIA助力安利生成AI在效能和安全上破局

    依托 NVIDIA AI Enterprise 企業(yè)級解決方案,安利正在構(gòu)建安全、高效、可擴(kuò)展的 AI 基礎(chǔ)設(shè)施體系,全面提升算力資源調(diào)度能
    的頭像 發(fā)表于 05-10 09:28 ?1498次閱讀
    南投县| 平陆县| 手游| 福建省| 革吉县| 鱼台县| 公主岭市| 盱眙县| 高邮市| 舟曲县| 靖边县| 南澳县| 葫芦岛市| 徐闻县| 普兰店市| 旺苍县| 蓝田县| 阿拉善盟| 疏附县| 高淳县| 兰溪市| 鹰潭市| 高邑县| 河北区| 高阳县| 柘荣县| 土默特右旗| 苗栗县| 瓮安县| 冷水江市| 三都| 襄城县| 邓州市| 新乐市| 夹江县| 唐海县| 磐安县| 衡阳县| 东港市| 齐河县| 潞西市|