日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

微軟開源“傻瓜式”類ChatGPT模型訓練工具

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 2023-04-14 09:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在利用 OpenAI 的 GPT-4 為 Bing Chat、 Bing Image Creator、Microsoft 365 Copilot、Azure OpenAI Service 和 GitHub Copilot X 引入了類似 ChatGPT 的功能后。微軟現(xiàn)又宣布推出 DeepSpeed-Chat,一種用于 RLHF 訓練的低成本開源解決方案,基于微軟開源的深度學習優(yōu)化庫 DeepSpeed;聲稱即使是使用單個 GPU,任何人也都可以創(chuàng)建高質(zhì)量的 ChatGPT 式模型。

該公司表示,盡管開源社區(qū)付出了巨大的努力,但目前仍缺乏一個支持端到端的基于人工反饋機制的強化學習(RLHF)的規(guī)?;到y(tǒng),這使得訓練強大的類 ChatGPT 模型十分困難。ChatGPT 模型的訓練是基于 InstructGPT 論文中的 RLHF 方式,與常見的大語言模型的預訓練和微調(diào)截然不同,使得現(xiàn)有深度學習系統(tǒng)在訓練類 ChatGPT 模型時存在種種局限。因此,為了讓 ChatGPT 類型的模型更容易被普通數(shù)據(jù)科學家和研究者使用,并使 RLHF 訓練真正普及到 AI 社區(qū),他們發(fā)布了 DeepSpeed-Chat。

8e39ca58-d9e7-11ed-bfe3-dac502259ad0.png

DeepSpeed-Chat 具有以下三大核心功能:

簡化 ChatGPT 類型模型的訓練和強化推理體驗:只需一個腳本即可實現(xiàn)多個訓練步驟,包括使用 Huggingface 預訓練的模型、使用 DeepSpeed-RLHF 系統(tǒng)運行 InstructGPT 訓練的所有三個步驟、甚至生成你自己的類 ChatGPT 模型。此外,還提供了一個易于使用的推理 API,用于用戶在模型訓練后測試對話式交互。

DeepSpeed-RLHF 模塊:DeepSpeed-RLHF 復刻了 InstructGPT 論文中的訓練模式,并確保包括 a) 監(jiān)督微調(diào)(SFT),b) 獎勵模型微調(diào)和 c) 基于人類反饋的強化學習(RLHF)在內(nèi)的三個步驟與其一一對應。此外,還提供了數(shù)據(jù)抽象和混合功能,以支持用戶使用多個不同來源的數(shù)據(jù)源進行訓練。

DeepSpeed-RLHF 系統(tǒng):其將 DeepSpeed 的訓練(training engine)和推理能力(inference engine) 整合到一個統(tǒng)一的混合引擎(DeepSpeed Hybrid Engine or DeepSpeed-HE)中用于 RLHF 訓練。DeepSpeed-HE 能夠在 RLHF 中無縫地在推理和訓練模式之間切換,使其能夠利用來自 DeepSpeed-Inference 的各種優(yōu)化,如張量并行計算和高性能 CUDA 算子進行語言生成,同時對訓練部分還能從 ZeRO- 和 LoRA-based 內(nèi)存優(yōu)化策略中受益。DeepSpeed-HE 還能夠自動在 RLHF 的不同階段進行智能的內(nèi)存管理和數(shù)據(jù)緩存。

文檔內(nèi)容指出,DeepSpeed Chat 與其他先進方案相比的優(yōu)勢在于:效率和經(jīng)濟性方面比現(xiàn)有系統(tǒng)快 15 倍以上,在 Azure 云上只需 9 小時即可訓練一個 OPT-13B 模型,只需 18 小時既可訓練 OPT-30B 模型,分別花費不到 300 美元和 600 美元。

在速度和可擴展性方面,即使是 13B 的模型也可以在 1.25 小時內(nèi)訓練,龐大的 175B 模型可以在不到一天的時間內(nèi)使用 64 個 GPU 集群進行訓練。在 RLHF 的可訪問性和普及化方面,則可以在單個 GPU 上訓練超過 130 億參數(shù)的模型。此外還支持在相同的硬件上分別運行 6.5B 和 50B 的模型,實現(xiàn)高達 7.5 倍的提升。

8e44b440-d9e7-11ed-bfe3-dac502259ad0.png

8e6634f8-d9e7-11ed-bfe3-dac502259ad0.png

8e7a9b3c-d9e7-11ed-bfe3-dac502259ad0.png

盡管近期關(guān)于對 ChatGPT 類大語言模型發(fā)展的反對和擔憂之聲不斷,但微軟似乎仍在全力推進其 AI 開發(fā)。對于微軟的此次發(fā)布,前 Meta AI 專家 Elvis 也激動地表示,DeepSpeed Chat 提供了 Alpaca 和 Vicuna 等所缺少的、一個端到端的 RLHF 管道來訓練類似 ChatGPT 的模型,解決的是成本和效率方面的挑戰(zhàn)。這是 “微軟令人印象深刻的開源努力。..。.. 是一件大事”。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6754

    瀏覽量

    108099
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5610

    瀏覽量

    124656
  • ChatGPT
    +關(guān)注

    關(guān)注

    31

    文章

    1600

    瀏覽量

    10400

原文標題:微軟開源“傻瓜式”類ChatGPT模型訓練工具,提速省錢15倍

文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AI Ceph 分布存儲教程資料大模型學習資料2026

    。如何構(gòu)建高性能、高吞吐、高可擴展的 AI 分布存儲系統(tǒng),已成為解鎖大模型基建能力的核心科技命題。這不僅關(guān)乎數(shù)據(jù)存得下、讀得快,更直接決定了 GPU 集群的利用率與模型訓練的最終效率
    發(fā)表于 05-01 17:35

    HM博學谷狂野AI大模型第四期

    的工程內(nèi)幕 一個大模型的誕生,離不開海量數(shù)據(jù)的訓練與精調(diào)??褚?AI 第四期將視角深入到模型訓練的引擎室,詳細拆解預訓練與指令微調(diào)(SFT)
    發(fā)表于 05-01 17:30

    小米開源VLA大模型訓練全流程:亞毫米級操作突破引領機器人產(chǎn)業(yè)革命

    在機器人技術(shù)領域,小米集團近日宣布開源VLA大模型Xiaomi-Robotics-0的后訓練全流程,這一突破性進展標志著智能機器人從實驗室走向?qū)嶋H生產(chǎn)的"最后一公里"正式打通。該模型
    的頭像 發(fā)表于 04-28 09:24 ?864次閱讀

    Edge Impulse 喚醒詞模型訓練 | 技術(shù)集結(jié)

    今天,將手把手帶領學習如何訓練一個語音關(guān)鍵詞模型部署到嵌入硬件上,采用Edgi-Talk平臺適配EdgeImpulse,當然原理在其他的ARM嵌入平臺也是通用的。讓我們看看如何讓
    的頭像 發(fā)表于 04-20 10:05 ?1270次閱讀
    Edge Impulse 喚醒詞<b class='flag-5'>模型</b><b class='flag-5'>訓練</b> | 技術(shù)集結(jié)

    AI模型訓練與部署實戰(zhàn) | 線下免費培訓

    流程與部署實戰(zhàn)”免費培訓!以人形檢測模型部署與優(yōu)化實戰(zhàn)為基礎,聚焦嵌入AI落地的核心環(huán)節(jié),提供硬件,動手實操,帶你在半天時間內(nèi),走通從模型訓練到嵌入
    的頭像 發(fā)表于 04-07 13:08 ?696次閱讀
    AI<b class='flag-5'>模型</b><b class='flag-5'>訓練</b>與部署實戰(zhàn) | 線下免費培訓

    摩爾線程發(fā)布SimuMax v1.1:從仿真工具升級為全棧工作流平臺,助力大模型訓練提效

    ? ? 近日,摩爾線程正式發(fā)布開源模型分布訓練仿真工具SimuMax的1.1版本。該版本在完整繼承v1.0高精度仿真能力的基礎上,實現(xiàn)了
    的頭像 發(fā)表于 01-09 09:17 ?370次閱讀
    摩爾線程發(fā)布SimuMax v1.1:從仿真<b class='flag-5'>工具</b>升級為全棧工作流平臺,助力大<b class='flag-5'>模型</b><b class='flag-5'>訓練</b>提效

    openDACS 2025 開源EDA與芯片賽項 賽題七:基于大模型的生成原理圖設計

    1. 大賽背景 開放原子大賽是由開放原子開源基金會組織舉辦的面向開源領域的技術(shù)賽事,目前大賽已成功舉辦兩屆共發(fā)布100個賽項,吸引8多萬人報名參賽,覆蓋1000多所院校,發(fā)放獎金超過2700萬元
    發(fā)表于 11-13 11:49

    在Ubuntu20.04系統(tǒng)中訓練神經(jīng)網(wǎng)絡模型的一些經(jīng)驗

    本帖欲分享在Ubuntu20.04系統(tǒng)中訓練神經(jīng)網(wǎng)絡模型的一些經(jīng)驗。我們采用jupyter notebook作為開發(fā)IDE,以TensorFlow2為訓練框架,目標是訓練一個手寫數(shù)字識
    發(fā)表于 10-22 07:03

    NVIDIA開源Audio2Face模型及SDK

    NVIDIA 現(xiàn)已開源 Audio2Face 模型與 SDK,讓所有游戲和 3D 應用開發(fā)者都可以構(gòu)建并部署帶有先進動畫的高精度角色。NVIDIA 開源 Audio2Face 的訓練
    的頭像 發(fā)表于 10-21 11:11 ?1038次閱讀
    NVIDIA<b class='flag-5'>開源</b>Audio2Face<b class='flag-5'>模型</b>及SDK

    摩爾線程發(fā)布大模型訓練仿真工具SimuMax v1.0

    近日,摩爾線程正式發(fā)布并開源模型分布訓練仿真工具SimuMax 1.0版本。該版本在顯存和性能仿真精度上實現(xiàn)突破性提升,同時引入多項關(guān)鍵
    的頭像 發(fā)表于 09-11 18:19 ?3942次閱讀
    摩爾線程發(fā)布大<b class='flag-5'>模型</b><b class='flag-5'>訓練</b>仿真<b class='flag-5'>工具</b>SimuMax v1.0

    新一代超大模型訓練引擎XTuner V1開源

    9月8日,上海人工智能實驗室(上海AI實驗室)開源書生大模型新一代訓練引擎XTuner V1。
    的頭像 發(fā)表于 09-10 10:55 ?1373次閱讀

    寧暢與與百度文心大模型展開深度技術(shù)合作

    近日,百度正式開源文心大模型4.5系列模型。作為文心開源合作伙伴,寧暢在模型開源首日即實現(xiàn)即刻部
    的頭像 發(fā)表于 07-07 16:26 ?1043次閱讀

    make sence成的XML文件能上傳到自助訓練模型上嗎?

    make sence成的XML文件能上傳到自助訓練模型上嗎
    發(fā)表于 06-23 07:38

    微軟推出多項革新性AI工具

    模型;多智能體協(xié)同編排功能重新定義協(xié)作模式,支持跨部門智能體團隊協(xié)同處理復雜任務。微軟正將AI技術(shù)從工具升級為組織核心生產(chǎn)力,重新定義人機協(xié)作的未來。
    的頭像 發(fā)表于 05-26 09:47 ?1330次閱讀

    傻瓜式操作!燈具外殼氣密性檢測儀上手就會

    在燈具生產(chǎn)過程中,確保外殼的氣密性至關(guān)重要。而如今,有了先進的燈具外殼氣密性檢測儀,檢測工作變得輕松便捷,真正實現(xiàn)了“傻瓜式操作”,讓你上手就會。首先,在開始檢測前,只需將燈具外殼放置在檢測儀的特定
    的頭像 發(fā)表于 05-05 14:56 ?910次閱讀
    <b class='flag-5'>傻瓜式</b>操作!燈具外殼氣密性檢測儀上手就會
    清丰县| 雷波县| 四川省| 大石桥市| 尚志市| 巴楚县| 丹寨县| 新兴县| 错那县| 巨鹿县| 西和县| 万载县| 甘洛县| 佛学| 太仆寺旗| 陇南市| 金溪县| 永仁县| 河西区| 商南县| 安阳县| 右玉县| 常德市| 台中市| 平定县| 商丘市| 高邑县| 东海县| 米易县| 苍山县| 临泉县| 合水县| 日喀则市| 乐平市| 嘉义县| 合阳县| 霞浦县| 卫辉市| 绥江县| 元氏县| 松溪县|