日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CNCC 論壇 | NVIDIA 攜手百度、京東、騰訊、小冰,共同解讀超大模型的推理和部署實(shí)踐

NVIDIA英偉達(dá) ? 來(lái)源:未知 ? 2022-12-05 21:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA 四大主題論壇

全棧式解決方案

為您啟動(dòng) AI 引擎

12 月 8 日-10 日,CNCC 邀您共赴 “計(jì)算之約”。以算力、數(shù)據(jù)、生態(tài)為主題,本屆 CNCC 首次全面改為線上舉辦,但規(guī)??烧f(shuō)是史上之 “最” :邀請(qǐng)嘉賓包括 ACM 圖靈獎(jiǎng)獲得者、田納西大學(xué)教授 Jack Dongarra,以及多位院士及專(zhuān)家,還有七百余位國(guó)內(nèi)外名校學(xué)者、名企領(lǐng)軍人物、各領(lǐng)域極具影響力的業(yè)內(nèi)專(zhuān)家。

今年,NVIDIA會(huì)在CNCC帶來(lái)涵蓋DPU、元宇宙、超大模型的推理和部署實(shí)踐三大主題的演講論壇和面向開(kāi)發(fā)者的CUDA Python線上編程培訓(xùn)實(shí)驗(yàn)論壇,內(nèi)容豐富、干貨滿滿、場(chǎng)場(chǎng)精彩!(* NVIDIA 將免費(fèi)放送四大論壇,線上票價(jià)值 1080 元,千萬(wàn)別錯(cuò)過(guò))

NVIDIA 在 CNCC 主題論壇概覽

時(shí)間

主題

12 月 8 日(星期四)1330

探索 DPU 應(yīng)用場(chǎng)景

加速云原生基礎(chǔ)設(shè)施創(chuàng)新

12 月 8 日(星期四)1900

如何利用元宇宙相關(guān)技術(shù)

實(shí)現(xiàn)虛擬世界和現(xiàn)實(shí)世界的連接

12 月 9 日(星期五)1330

超大模型的推理和部署實(shí)踐

12 月 10 日(星期六)1330

基于 Python 的 CUDA 編程入門(mén)

培訓(xùn)及線上編程體驗(yàn)

在 8 號(hào)的“為數(shù)據(jù)中心不斷“減負(fù)” :探索 DPU 應(yīng)用場(chǎng)景加速云原生基礎(chǔ)設(shè)施創(chuàng)新”、穿梭虛實(shí)之間,元宇宙技術(shù)是如何做到的?兩期主題論壇之后。

這一程,NVIDIA 將攜手百度、騰訊、小冰,于 12 月 9 日下午共同解讀《超大模型的推理和部署實(shí)踐》。論壇云集技術(shù)大牛,您將了解:

  • 飛槳超大模型的壓縮和推理優(yōu)化;

  • 基于精調(diào)、蒸餾和壓縮的大模型落地應(yīng)用;

  • 通往高參數(shù)效用比的自然語(yǔ)言處理;

  • “小冰”如何利用 FasterTransformer 實(shí)現(xiàn)大規(guī)模語(yǔ)言模型的產(chǎn)品級(jí)部署等內(nèi)容。

對(duì)超大模型推理及其具體應(yīng)用感興趣的小伙伴們,

下方查看會(huì)議詳情!

超大模型的推理和部署實(shí)踐

12 月 9 日,星期五,1330

線上會(huì)議室 6

隨著 AI 的發(fā)展,創(chuàng)新和數(shù)據(jù)復(fù)雜性不斷提升,超大規(guī)模成為必然趨勢(shì)。通過(guò)本次分論壇,您將了解飛槳超大模型的壓縮和推理優(yōu)化;基于精調(diào)、蒸餾和壓縮的大模型落地應(yīng)用;通往高參數(shù)效用比的自然語(yǔ)言處理;如何利用 FasterTransformer 實(shí)現(xiàn)大規(guī)模語(yǔ)言模型的產(chǎn)品級(jí)部署,以及 Transformer 模型在 TensorRT 上的推理性能優(yōu)化等內(nèi)容。

具體議程

飛槳超大模型的壓縮和推理優(yōu)化

超大模型在各類(lèi)任務(wù)上取得卓越的效果,然而由于超大模型體積大、速度慢,推理部署面臨巨大的挑戰(zhàn),大模型的高效推理是實(shí)現(xiàn)大模型產(chǎn)業(yè)應(yīng)用落地的關(guān)鍵所在。飛槳推出了針對(duì)大模型的壓縮、推理、服務(wù)化全流程部署方案。該方案通過(guò)面向大模型的精度無(wú)損模型壓縮技術(shù)、自適應(yīng)分布式推理技術(shù),可自動(dòng)感知硬件特性,完成模型壓縮、自動(dòng)切分和混合并行推理計(jì)算,實(shí)現(xiàn)領(lǐng)先性能。

a213299c-749e-11ed-8abf-dac502259ad0.png

黨青青 | 百度資深研發(fā)工程師

黨青青,百度資深研發(fā)工程師,目前主要從事深度學(xué)習(xí)模型推理、壓縮、視覺(jué)算法的研究。負(fù)責(zé)飛槳推理性能優(yōu)化,以及模型壓縮工具、視覺(jué)套件建設(shè)。有豐富的深度學(xué)習(xí)框架系統(tǒng)研發(fā)、高性能優(yōu)化、算法調(diào)優(yōu)經(jīng)驗(yàn)。

通往高參數(shù)效用比的自然語(yǔ)言處理-預(yù)訓(xùn)練、

下游任務(wù)、與前沿展望

如今自然語(yǔ)言處理領(lǐng)域正在進(jìn)行 “訓(xùn)練->推理” 到 “預(yù)訓(xùn)練->下游任務(wù)微調(diào)”的范式轉(zhuǎn)換,其中模型神經(jīng)元數(shù)量和預(yù)訓(xùn)練所用數(shù)據(jù)規(guī)模已經(jīng)遠(yuǎn)超人類(lèi)大腦的神經(jīng)元數(shù)量和人類(lèi)人均閱讀總量,同時(shí)在 GLUE 等通用大模型評(píng)估榜單中獲得的收益是非常微弱的。對(duì)此,我們開(kāi)展了一系列高參數(shù)效用比的自然語(yǔ)言處理預(yù)訓(xùn)練、和下游任務(wù)的探索,來(lái)幫助大模型更加智能、高效的從海量數(shù)據(jù)中挖掘知識(shí),并魯棒、準(zhǔn)確的遷移到下游任務(wù)中。

a272c78a-749e-11ed-8abf-dac502259ad0.png

丁亮 | 京東探索研究院算法科學(xué)家

丁亮,京東探索研究院算法科學(xué)家,自然語(yǔ)言處理方向負(fù)責(zé)人。博士畢業(yè)于悉尼大學(xué),師從 IEEE/ACM Fellow 陶大程教授。他致力于基于深度學(xué)習(xí)的自然語(yǔ)言處理,包括大規(guī)模語(yǔ)言模型預(yù)訓(xùn)練、語(yǔ)言理解、生成和翻譯。他帶領(lǐng)團(tuán)隊(duì)在 2021 年 12 月在兩個(gè) GLUE 基準(zhǔn)評(píng)測(cè)任務(wù)上實(shí)現(xiàn)首次超越人類(lèi)的表現(xiàn),隨后在 2022 年 1 月以均分 91.3 獲得總榜單第一。

基于精調(diào)、蒸餾和壓縮的大模型落地應(yīng)用

大模型歷經(jīng)過(guò)去幾年探索已經(jīng)相對(duì)成熟。目前如何能夠在真實(shí)場(chǎng)景快速落地成為急需解決的問(wèn)題。為解決大模型落地方面的各種問(wèn)題,我們開(kāi)發(fā)提供精調(diào)、蒸餾、壓縮、推理、服務(wù)化全流程部署方案,助力大模型快速有效落地。

a299f10c-749e-11ed-8abf-dac502259ad0.png

劉凱 | 騰訊軟件工程師

從事 NLP 訓(xùn)練推理一體化服務(wù)開(kāi)發(fā)。

小冰如何利用 FasterTransformer

實(shí)現(xiàn)大規(guī)模語(yǔ)言模型的產(chǎn)品級(jí)部署

小冰在部署 GPT 1B/6B 模型中遇到的困難;Faster Transformer (FT) 如何解決上述困難;在上述模型配置下,F(xiàn)T+Triton 與 baseline (Huggingface Transformers 和 Deepspeed) 在 a. latency, b. throughput, c. 可部署的最低配置GPU環(huán)境 上的差異;小冰如何利用 FT 對(duì) soft prompt/prefix 的支持,在只使用同一個(gè) backbone model 的情況下實(shí)現(xiàn)對(duì)不同用戶的高度自定義化。

a2cea67c-749e-11ed-8abf-dac502259ad0.png

趙天雨 | 小冰高級(jí)研究員

2015 年本科畢業(yè)于北京大學(xué)計(jì)算機(jī)系,2020 年博士畢業(yè)于京都大學(xué)智能信息學(xué)系,同年就職于小冰日本團(tuán)隊(duì)。研究方向?yàn)樽匀徽Z(yǔ)言處理,主要關(guān)注對(duì)話系統(tǒng)、大模型的訓(xùn)練與部署。

a2e7bce8-749e-11ed-8abf-dac502259ad0.png

鄭鵬 | NVIDIA GPU 計(jì)算專(zhuān)家

畢業(yè)于佐治亞理工計(jì)算科學(xué)與工程專(zhuān)業(yè),2021 年加入 NVIDIA 主要參與 FasterTransformer Multi-GPU Multi-Node 相關(guān)的優(yōu)化工作。

基于 FasterTransformer

和 Triton大模型的預(yù)估

自 2020 年 OpenAI 推出 GPT 模型之後,越來(lái)越多研究證明超大模型在自然語(yǔ)言處理上的能力與重要性。NVIDIA 在 2021 年時(shí)基于 FasterTransformer 開(kāi)發(fā)多機(jī)多卡并行推理的功能,提出第一個(gè)多機(jī)多卡大模型推理的解決方案。FasterTransformer 本身不具有收集、整理請(qǐng)求的能力,這在實(shí)際應(yīng)用上是非常重要的功能。為了填補(bǔ)不足,我們將 FasterTransformer 與推理框架 Triton 進(jìn)行結(jié)合,讓 FasterTransformer 能夠更好的支持實(shí)際的推理場(chǎng)景。在這次的演講中,我們會(huì)詳細(xì)的講解我們?nèi)绾螌?shí)現(xiàn)以上的功能,讓用戶能透過(guò) FasterTransformer 將大模型推理實(shí)際落地。

a3360d8a-749e-11ed-8abf-dac502259ad0.png

薛博陽(yáng) | NVIDIA GPU 技術(shù)專(zhuān)家

2019 年加入 NVIDIA,目前主要負(fù)責(zé) FasterTransformer 的開(kāi)發(fā)與優(yōu)化。FasterTransformer 提供 Transformer 模型推理上靈活與高效的調(diào)用,對(duì)比一般的框架能提供數(shù)倍到十倍以上的加速效果。除此之外,是第一個(gè)支持 GPT-3 的推理庫(kù)。FasterTransformer 針對(duì) GPT-3 這種超大規(guī)模(1750 億模型參數(shù))的模型提供了模型并行、優(yōu)化通信開(kāi)銷(xiāo)、顯存使用,讓使用者能以最少的 GPU、透過(guò)多 GPU、多節(jié)點(diǎn)在 GPT-3 的服務(wù)上得到最好的速度。

Transformer 模型

在 TensorRT 上的推理性能優(yōu)化

Transformer 在 NLP 和 CV 領(lǐng)域大放異彩,在眾多深度學(xué)習(xí)模型中顯現(xiàn)了突出的效果。同時(shí),它相比于卷積網(wǎng)絡(luò)需要更高的計(jì)算量,其推理優(yōu)化值得關(guān)注。TensorRT 是 NVIDIA 專(zhuān)門(mén)針對(duì)推理場(chǎng)景推出的性能優(yōu)化工具;NVIDIA DevTech 團(tuán)隊(duì)將若干常用的 Transformer 模型移植到 TensorRT,獲得了良好的加速效果。

a3746224-749e-11ed-8abf-dac502259ad0.png

王猛 | NVIDIA GPU 技術(shù)專(zhuān)家

2019 年加入 NVIDIA,目前主要從事 GPU 上模型部署與優(yōu)化,在 TensorRT,ONNX 和 CUDA 并行計(jì)算等領(lǐng)域有較多的研究和應(yīng)用經(jīng)驗(yàn),目前主要負(fù)責(zé) TensorRT workflow。

小組座談

參與嘉賓:

王猛 | NVIDIA GPU 技術(shù)專(zhuān)家

劉凱 | 騰訊軟件工程師

怎樣報(bào)名參會(huì)

掃描下方二維碼或點(diǎn)擊閱讀原文,添加微信小助手

并備注“CNCC”加入本次活動(dòng)微信交流群

分論壇觀看入口將在直播開(kāi)始前在微信群內(nèi)發(fā)布

與行業(yè)先鋒一同,探尋超大模型的推理和部署實(shí)踐

a3b83260-749e-11ed-8abf-dac502259ad0.png

原文標(biāo)題:CNCC 論壇 | NVIDIA 攜手百度、京東、騰訊、小冰,共同解讀超大模型的推理和部署實(shí)踐

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4119

    瀏覽量

    99675
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3811

    瀏覽量

    5282

原文標(biāo)題:CNCC 論壇 | NVIDIA 攜手百度、京東、騰訊、小冰,共同解讀超大模型的推理和部署實(shí)踐

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    瀚博半導(dǎo)體宣布深度參與百度飛槳黑客松生態(tài)活動(dòng)

    近日,瀚博半導(dǎo)體正式宣布深度參與百度飛槳主辦的黑客松生態(tài)活動(dòng)。面向全球開(kāi)發(fā)者開(kāi)放旗下載天系列加速卡開(kāi)發(fā)環(huán)境,支持部署百度文心ERNIE-4.5 系列開(kāi)源模型與PP-OCRv4 文檔理解
    的頭像 發(fā)表于 04-11 09:41 ?729次閱讀

    百度地圖LD解決方案助力無(wú)人配送行業(yè)規(guī)?;涞?/a>

    在今日舉辦的智能網(wǎng)聯(lián)汽車(chē)發(fā)展論壇無(wú)人配送生態(tài)大會(huì)主論壇上,百度地圖無(wú)人車(chē)解決方案產(chǎn)品負(fù)責(zé)人發(fā)表了題為《百度LD無(wú)人配送規(guī)模化落地元年》的主題演講——
    的頭像 發(fā)表于 03-31 13:54 ?508次閱讀

    百度文心大模型5.0正式版上線

    今天,在百度文心Moment大會(huì)現(xiàn)場(chǎng),文心大模型5.0正式版上線。
    的頭像 發(fā)表于 01-23 16:48 ?1552次閱讀

    有方科技攜手百度智能云重塑AI賦能新生態(tài)

    12月30日,由百度智能云主辦的“云智思享會(huì):大模型重塑消費(fèi)電子新體驗(yàn)”行業(yè)研討會(huì)在深圳舉辦。本次大會(huì)匯聚了芯片、模組、方案商、大模型、品牌商、市場(chǎng)及渠道等全產(chǎn)業(yè)鏈的眾多企業(yè)代表與專(zhuān)家,共同
    的頭像 發(fā)表于 01-08 11:00 ?525次閱讀

    百度世界2025進(jìn)行中 百度昆侖芯超節(jié)點(diǎn)亮相 性能巨幅提升

    思維、洞察未來(lái)趨勢(shì)的重要平臺(tái)。 今日(11月13日)Baidu World 2025在北京舉辦。在這里,可以體驗(yàn)AI應(yīng)用的價(jià)值涌現(xiàn),見(jiàn)證AI能力的創(chuàng)新爆發(fā)。 今年的百度世界2025以“效果涌現(xiàn)|AI in Action”為主題,設(shè)置有1+ 6場(chǎng)頂尖論壇。
    的頭像 發(fā)表于 11-13 11:51 ?1507次閱讀

    NVIDIA TensorRT LLM 1.0推理框架正式上線

    TensorRT LLM 作為 NVIDIA 為大規(guī)模 LLM 推理打造的推理框架,核心目標(biāo)是突破 NVIDIA 平臺(tái)上的推理性能瓶頸。為實(shí)
    的頭像 發(fā)表于 10-21 11:04 ?1470次閱讀

    光庭信息成為百度智能云大模型行業(yè)合伙人

    論壇上,光庭信息作為受邀企業(yè)出席,正式成為百度智能云“大模型行業(yè)合伙人”,并榮獲“行業(yè)卓越貢獻(xiàn)伙伴獎(jiǎng)”。這標(biāo)志著雙方合作進(jìn)入了一個(gè)全新的階段,將為AI+汽車(chē)產(chǎn)業(yè)智能化升級(jí)創(chuàng)造更大價(jià)值。 日前,國(guó)務(wù)院關(guān)于深入實(shí)施“人工智能
    的頭像 發(fā)表于 09-02 16:17 ?1001次閱讀

    珠海泰芯半導(dǎo)體攜手百度共筑智能硬件產(chǎn)業(yè)新生態(tài)

    2025年8月29日,北京國(guó)際會(huì)議中心二期迎來(lái)科技行業(yè)年度盛會(huì)。由百度智能云與極客公園聯(lián)合主辦的百度云智大會(huì)AI+智能硬件專(zhuān)場(chǎng)論壇圓滿舉行,珠海泰芯半導(dǎo)體有限公司總經(jīng)理唐振中作為特邀嘉賓出席,
    的頭像 發(fā)表于 09-01 17:46 ?1252次閱讀

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準(zhǔn)確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?2068次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2<b class='flag-5'>推理模型</b>發(fā)布

    NVIDIA從云到邊緣加速OpenAI gpt-oss模型部署,實(shí)現(xiàn)150萬(wàn)TPS推理

    ? 自 2016 年推出 NVIDIA DGX 以來(lái),NVIDIA 與 OpenAI 便開(kāi)始共同推動(dòng) AI 技術(shù)的邊界。此次 OpenAI gpt-oss-20b 和 gpt-oss-120b
    的頭像 發(fā)表于 08-15 20:34 ?2543次閱讀
    <b class='flag-5'>NVIDIA</b>從云到邊緣加速OpenAI gpt-oss<b class='flag-5'>模型</b><b class='flag-5'>部署</b>,實(shí)現(xiàn)150萬(wàn)TPS<b class='flag-5'>推理</b>

    百度智能云亮相第二十二屆ChinaJoy

    百度智能云亮相第二十二屆ChinaJoy 8月1日,第二十二屆中國(guó)國(guó)際數(shù)碼互動(dòng)娛樂(lè)展覽會(huì)(ChinaJoy)在上海開(kāi)幕。大會(huì)期間,百度全景展示了百度智能云千帆大模型平臺(tái)等行業(yè)領(lǐng)先的技術(shù)
    的頭像 發(fā)表于 08-05 09:47 ?960次閱讀

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 開(kāi)源其物理 AI 平臺(tái) NVIDIA Cosmos 中的關(guān)鍵模型——NVIDIA Cosmos Reason-1-7B。這款先進(jìn)的多模態(tài)大
    的頭像 發(fā)表于 07-09 10:17 ?1043次閱讀

    寧暢與與百度文心大模型展開(kāi)深度技術(shù)合作

    近日,百度正式開(kāi)源文心大模型4.5系列模型。作為文心開(kāi)源合作伙伴,寧暢在模型開(kāi)源首日即實(shí)現(xiàn)即刻部署,做到“開(kāi)源即接入、發(fā)布即可用”。據(jù)悉,文
    的頭像 發(fā)表于 07-07 16:26 ?1050次閱讀

    65%央企大模型落地首選百度智能云

    今天,很榮幸地分享一個(gè)好消息,百度智能云已牽手65%的央企,共同推進(jìn)大模型產(chǎn)業(yè)落地。得益于全棧的AI能力,百度聯(lián)合眾多央國(guó)企伙伴,針對(duì)各類(lèi)不同業(yè)務(wù)場(chǎng)景,打造了一大批可推廣、可復(fù)制的標(biāo)桿
    的頭像 發(fā)表于 06-11 15:44 ?1053次閱讀

    百度文心大模型X1 Turbo獲得信通院當(dāng)前大模型最高評(píng)級(jí)證書(shū)

    百度在520居然還領(lǐng)了個(gè)證?是它, 信通院當(dāng)前大模型最高評(píng)級(jí)證書(shū) ! 在5月20日的百度AI Day 上,中國(guó)信通院公布了大模型推理能力評(píng)估
    的頭像 發(fā)表于 05-21 18:19 ?1434次閱讀
    <b class='flag-5'>百度</b>文心大<b class='flag-5'>模型</b>X1 Turbo獲得信通院當(dāng)前大<b class='flag-5'>模型</b>最高評(píng)級(jí)證書(shū)
    左权县| 建阳市| 肇州县| 庄浪县| 广南县| 报价| 饶平县| 五华县| 鸡泽县| 漳州市| 突泉县| 普兰店市| 蕉岭县| 德安县| 阆中市| 恭城| 汝南县| 开鲁县| 平顶山市| 东方市| 宾阳县| 肃北| 望奎县| 麦盖提县| 和平县| 武义县| 蛟河市| 建水县| 乌拉特后旗| 敖汉旗| 唐山市| 资阳市| 汝城县| 兴和县| 陵川县| 墨玉县| 信阳市| 马山县| 伊吾县| 枣庄市| 通江县|