3 月 22 日下午 1 點(diǎn)開(kāi)始,本屆 GTC 專門(mén)面向中國(guó) AI 從業(yè)者的特別活動(dòng) China AI Day 將在線上舉行,11 位來(lái)自阿里巴巴、百度、快手、騰訊、網(wǎng)易,字節(jié)跳動(dòng),以及 NVIDIA GPU 計(jì)算專家團(tuán)隊(duì)的技術(shù)專家將進(jìn)行專題報(bào)告,圍繞互聯(lián)網(wǎng)搜索、推薦、廣告業(yè)務(wù)、數(shù)字孿生、短視頻應(yīng)用、元宇宙和數(shù)字人等熱門(mén)應(yīng)用場(chǎng)景分享專業(yè)見(jiàn)解。
推薦業(yè)內(nèi)關(guān)注數(shù)據(jù)、算法、架構(gòu)和運(yùn)維的工程師、開(kāi)發(fā)人員以及 AI 從業(yè)者預(yù)約觀看!
以下為 11 個(gè)演講的詳細(xì)介紹:
加速計(jì)算助力云上業(yè)務(wù)場(chǎng)景
會(huì)議代碼:[SE52359]
演講時(shí)間:3 月 22 日 1:00 PM - 1:30 PM
演講嘉賓:

李曦鵬
NVIDIA 開(kāi)發(fā)與技術(shù)部門(mén)亞太區(qū)總經(jīng)理
主要內(nèi)容:
加速計(jì)算是未來(lái)必經(jīng)之路,極致化性能,并提高能效。NVIDIA AI 平臺(tái)涵蓋了從基礎(chǔ)設(shè)施、調(diào)度、加速庫(kù)以及加速框架、部署工具和最上層的應(yīng)用框架。NVIDIA 也提供了從數(shù)據(jù)預(yù)處理、大規(guī)模訓(xùn)練、推理優(yōu)化到大規(guī)模部署的端對(duì)端軟件。加速計(jì)算需要應(yīng)用導(dǎo)向來(lái)進(jìn)行整個(gè)環(huán)節(jié)的優(yōu)化,是軟硬件協(xié)同,需要業(yè)務(wù)、算法、工程師和加速工程師密切合作。
本演講將以推薦系統(tǒng)的演變?yōu)槔?,?lái)闡述加速計(jì)算的旅程。加速計(jì)算也正是 China AI Day 的主旨所在。非常歡迎并誠(chéng)摯感謝 China AI Day 的演講者,分享在數(shù)字孿生、元宇宙、短視頻、以及搜索、廣告、推薦等領(lǐng)域,借助 NVIDIA GPU 和全棧 AI 解決方案,最新鮮的優(yōu)化加速的精彩成果。
李星瀾:一個(gè)基于實(shí)時(shí)智能交互系統(tǒng)打造的
“真實(shí)” 數(shù)字生命
會(huì)議代碼:[SE51461]
演講時(shí)間:3 月 22 日 1:30 PM -2:00 PM
演講嘉賓:

四道
朝夕光年江南工作室 AI 技術(shù)負(fù)責(zé)人
主要內(nèi)容:
智能 NPC 和數(shù)字人已經(jīng)在娛樂(lè)行業(yè)和社交媒體平臺(tái)被廣泛應(yīng)用,包括人工智能驅(qū)動(dòng)的主持人、評(píng)論員和網(wǎng)紅等。但開(kāi)發(fā)具有高視覺(jué)保真度的逼真智能 AI 通常需要大量時(shí)間,而且成本很高,很難擴(kuò)大規(guī)模。
朝夕光年江南工作室提出了一個(gè) GPU 驅(qū)動(dòng)的系統(tǒng),包括文本到語(yǔ)音模塊、音頻到全身動(dòng)畫(huà)模塊、視頻分析模塊、渲染模塊和聊天機(jī)器人模塊,基于這些模塊可以構(gòu)建一個(gè)逼真的實(shí)時(shí)交互數(shù)字人。在 NVIDIA Omniverse 的支持下,可以實(shí)時(shí)高效地渲染李星瀾,而且其中的動(dòng)畫(huà)模塊將根據(jù)后端聊天機(jī)器人的輸出自動(dòng)驅(qū)動(dòng)角色模型的運(yùn)動(dòng)。動(dòng)畫(huà)模塊和后臺(tái)聊天機(jī)器人都是基于自定義開(kāi)發(fā)的深度神經(jīng)網(wǎng)絡(luò)。使用 NVIDIA Omniverse ACE,能夠在兩天內(nèi)完全訓(xùn)練 audio2motion 和 text2speech 模型,并在 5 天內(nèi)訓(xùn)練超大參數(shù)的 Chatbot 神經(jīng)網(wǎng)絡(luò)模型,使用了超過(guò) 10tb 的訓(xùn)練數(shù)據(jù)。
本演講將介紹如何利用 NVIDIA Omniverse 和 NVIDIA GPU,以及如何借助計(jì)算機(jī)圖形學(xué)和人工智能功能來(lái)構(gòu)建 Lydia 數(shù)字人項(xiàng)目。
飛槳深度學(xué)習(xí)平臺(tái)高效支持
大規(guī)模生產(chǎn)及應(yīng)用
會(huì)議代碼:[S52366]
演講時(shí)間:3 月 22 日即可在線觀看
(自選點(diǎn)播)
演講嘉賓:

馬艷軍
百度 AI 技術(shù)生態(tài)總經(jīng)理
主要內(nèi)容:
源于百度業(yè)務(wù)對(duì)人工智能技術(shù)的廣泛應(yīng)用,飛槳深度學(xué)習(xí)平臺(tái)結(jié)合應(yīng)用持續(xù)創(chuàng)新,研發(fā)了業(yè)界領(lǐng)先的大規(guī)模分布式訓(xùn)練技術(shù)。飛槳先后發(fā)布了 4D 混合并行訓(xùn)練、端到端自適應(yīng)分布式訓(xùn)練、超大規(guī)模圖訓(xùn)練引擎等核心技術(shù),并基于這些技術(shù)支持文心大模型的訓(xùn)練和部署。目前,文心大模型已經(jīng)覆蓋基礎(chǔ)大模型、任務(wù)大模型、行業(yè)大模型的三級(jí)體系,飛槳+文心大模型賦能千行百業(yè)的智能化升級(jí)。本演講將分享飛槳深度學(xué)習(xí)平臺(tái)如何高效支持大規(guī)模生產(chǎn)及應(yīng)用。
機(jī)器學(xué)習(xí)模型中訪存密集型計(jì)算 STITCH
融合優(yōu)化技術(shù)
會(huì)議代碼:[SE51289]
演講時(shí)間:3 月 22 日 2:00 PM – 2:30 PM
演講嘉賓:

鄭禎
阿里巴巴高級(jí)技術(shù)專家
主要內(nèi)容:
近年來(lái),訪存密集型計(jì)算日益成為影響機(jī)器學(xué)習(xí)模型性能的重要因素。由于機(jī)器學(xué)習(xí)模型計(jì)算圖日趨復(fù)雜,傳統(tǒng)的機(jī)器學(xué)習(xí)編譯器面對(duì)復(fù)雜的數(shù)據(jù)依賴關(guān)系時(shí)很難執(zhí)行高效的計(jì)算融合優(yōu)化。同時(shí),動(dòng)態(tài)張量形狀(dynamic tensor shape)的模型優(yōu)化需求開(kāi)始興起,缺失的張量形狀使得訪存密集型計(jì)算子圖的性能優(yōu)化變得更加困難。
本演講將講述阿里巴巴針對(duì)機(jī)器學(xué)習(xí)任務(wù)中訪存密集型計(jì)算性能優(yōu)化的關(guān)鍵技術(shù):STITCH 融合技術(shù)。該技術(shù)支持將任意類型及任何數(shù)量的機(jī)器學(xué)習(xí)訪存密集型算子進(jìn)行融合,最終將大粒度的訪存密集型計(jì)算子圖轉(zhuǎn)化為單個(gè)的 GPU 核函數(shù),以減少片外訪存、框架調(diào)度及 GPU 核函數(shù)調(diào)用開(kāi)銷(xiāo)。
GPU 加速大規(guī)模向量索引構(gòu)建
會(huì)議代碼:[SE51475]
演講時(shí)間:3 月 22 日 2:30 PM – 3:00 PM
演講嘉賓:

李晨
騰訊高級(jí)工程師
主要內(nèi)容:
大規(guī)模向量檢索引擎在騰訊諸多業(yè)務(wù)中有所應(yīng)用,在百億級(jí)召回場(chǎng)景中提供低延遲、高召回率的在線服務(wù)。但隨著索引規(guī)模的增加,向量索引的構(gòu)建已經(jīng)成為日常索引的更新瓶頸。離線向量 IVF 索引構(gòu)建,在引入 GPU 優(yōu)化之前,索引構(gòu)建工作依托 Hadoop 平臺(tái)進(jìn)行,引入 NVIDIA GPU 改造后索引構(gòu)建成本降低 60%。索引構(gòu)建的優(yōu)化工作主要由兩部分組成:1. IVF KMeans 聚類;2. 百億向量在海量聚類中心上的 FIT 過(guò)程。本次演講將介紹如何基于 GPU 構(gòu)建大規(guī)模向量索引及其優(yōu)化過(guò)程。
多模態(tài)超大模型在短視頻場(chǎng)景落地應(yīng)用
會(huì)議代碼:[SE52361]
演講時(shí)間:3 月 22 日 3:00 PM – 3:30 PM
演講嘉賓:

張勝卓,快手算法引擎專家
韓青長(zhǎng),快手算法引擎工程師
李杰,快手算法引擎工程師
門(mén)春雷,快手算法引擎專家
主要內(nèi)容:
以 ChatGPT 為代表的大模型面世,帶來(lái)了 AI 大模型技術(shù)熱潮,研究表明,知識(shí)密集任務(wù)中越大的模型學(xué)習(xí)效率越高(相同訓(xùn)練數(shù)據(jù)量下,模型越大任務(wù)效果越好),主流大模型的參數(shù)大都超過(guò)了千億 (100B) 規(guī)模,同時(shí)也給模型的高效訓(xùn)練和推理部署帶來(lái)嚴(yán)峻挑戰(zhàn)??焓謬@提高模型計(jì)算效率和可部署開(kāi)展技術(shù)攻關(guān),沉淀了一套通用的混合并行訓(xùn)練、壓縮、推理整體解決方案,并聯(lián)合業(yè)務(wù)實(shí)現(xiàn)百億參數(shù) Dense 模型和千億參數(shù) MOE 大模型落地,取得顯著業(yè)務(wù)收益。本演講將分享多模態(tài)超大模型在短視頻場(chǎng)景的落地應(yīng)用。
PGLBox:百度基于 GPU 的
超大規(guī)模圖模型訓(xùn)練框架
會(huì)議代碼:[SE51302]
演講時(shí)間:3 月 22 日 3:30 PM – 4:00 PM
演講嘉賓:

焦學(xué)武
百度主任架構(gòu)師
百度 MEG 商業(yè)模型中臺(tái)技術(shù)負(fù)責(zé)人
主要內(nèi)容:
PGLBox 是百度研發(fā)的基于 GPU 的大規(guī)模圖模型訓(xùn)練框架,支持?jǐn)?shù)百億節(jié)點(diǎn)和邊的圖模型全 GPU 訓(xùn)練,已在百度廣泛部署。相比業(yè)界主流的分布式 CPU 解決方案,PGLBox 具有以下幾大優(yōu)勢(shì):1. 超高性能:業(yè)界首個(gè)分布式 GPU 圖學(xué)習(xí)訓(xùn)練框架,相比分布式 CPU 方案,訓(xùn)練速度提升 27 倍;2. 超大規(guī)模:業(yè)界首個(gè)多級(jí)存儲(chǔ)圖引擎,單機(jī)可支持?jǐn)?shù)百億節(jié)點(diǎn)數(shù)百億邊的超大圖規(guī)模;3. 算法豐富:預(yù)置豐富的圖表示學(xué)習(xí)算法,支持跨場(chǎng)景異構(gòu)圖建模和復(fù)雜圖屬性建模;4. 靈活易用:用戶僅需簡(jiǎn)單配置,即可一鍵啟動(dòng)大規(guī)模圖表示學(xué)習(xí)訓(xùn)練任務(wù);5. 落地廣泛:百度內(nèi)部多業(yè)務(wù)體系廣泛落地,為業(yè)務(wù)帶來(lái)了顯著業(yè)務(wù)收益。
視頻場(chǎng)景中的音頻理解推理加速解決方案
會(huì)議代碼:[SE51166]
演講時(shí)間:3 月 22 日 4:00 PM – 4:30 PM
演講嘉賓:

陳炳州
字節(jié)跳動(dòng)音頻理解視頻方向引擎負(fù)責(zé)人
主要內(nèi)容:
音頻理解是指通過(guò)語(yǔ)音識(shí)別、事件檢測(cè)、語(yǔ)種識(shí)別、聲紋識(shí)別等技術(shù)從音頻數(shù)據(jù)中解析出多維度信息。在視頻場(chǎng)景上,比較經(jīng)典的落地技術(shù),比如視頻字幕生成、視頻字幕打軸等等。這些技術(shù)應(yīng)用極大地提高了人效,也帶來(lái)生活的便利。伴隨短視頻和音頻類應(yīng)用的興起,用戶請(qǐng)求量、音頻數(shù)據(jù)正呈幾何級(jí)別增長(zhǎng),這些都為大規(guī)模數(shù)據(jù)處理,以及高并發(fā)低延遲的推理帶來(lái)諸多挑戰(zhàn)。比如機(jī)器有限的情況下如何處理更多的音頻,多語(yǔ)種的場(chǎng)景中單卡處理單語(yǔ)種模型存在利用率較低的問(wèn)題。本演講將基于 NVIDIA 提供的推理 GPU(T4, A10, A30),介紹音頻理解如何做推理加速,以及如何廣泛應(yīng)用于抖音等大流量場(chǎng)景。
CUTLASS 極致性能優(yōu)化探索
及在阿里巴巴推薦系統(tǒng)中的應(yīng)用
會(huì)議代碼:[SE51305]
演講時(shí)間:3 月 22 日 4:30 PM – 5:00 PM
演講嘉賓:

董紀(jì)瑩
阿里巴巴高級(jí)工程師
主要內(nèi)容:
在大規(guī)模推薦系統(tǒng)中,點(diǎn)擊率(Click-Through Rate, CTR)和 轉(zhuǎn)化率(ConVersion Rate, CVR)預(yù)測(cè)任務(wù)的深度神經(jīng)網(wǎng)絡(luò)模型通過(guò)由 Embedding 層,Attention 層和 MLP 層組成。然而,在 TensorFlow 上執(zhí)行時(shí),Attention 層和 MLP 層中數(shù)量眾多的算子和大量耗時(shí)的計(jì)算成為了性能瓶頸。
通過(guò) NVIDIA 開(kāi)源的高性能矩陣乘(general matrix multiplication, GEMM)應(yīng)用框架 CUTLASS,能夠?qū)崿F(xiàn)將與 GEMM 相連的算子融合進(jìn) GEMM,并且將級(jí)聯(lián)的 GEMM 進(jìn)一步融合成一個(gè)算子。通過(guò)這種方式,在理想情況下,可以將整個(gè)Attention 模塊融合成一個(gè)算子。在計(jì)算 MLP 時(shí),將縱向相連的 GEMM 融合成 back-to-back GEMM,然后繼續(xù)將橫向相連的 GEMM 融合成 Batch GEMM,從而實(shí)現(xiàn)性能提升。這些優(yōu)化已經(jīng)在阿里巴巴預(yù)測(cè)引擎平臺(tái)上線,很好地提升了預(yù)測(cè)性能,更好地發(fā)揮了硬件算力。
NVIDIA CUDA 技術(shù)助力網(wǎng)易瑤臺(tái)
神經(jīng)隱式曲面建模 20 倍加速
會(huì)議代碼:[SE52360]
演講時(shí)間:3 月 22 日 5:00 PM – 5:30 PM
演講嘉賓:

李林橙
網(wǎng)易伏羲視覺(jué)計(jì)算負(fù)責(zé)人
主要內(nèi)容:
網(wǎng)易瑤臺(tái)提供大型的沉浸式會(huì)展服務(wù)。在與客戶的溝通中,我們了解到,客戶期望將線下物體生成 3D 模型,導(dǎo)入瑤臺(tái),從而降低定制化制作的成本。2020 年以來(lái)神經(jīng)渲染 3D 建模技術(shù)快速發(fā)展,重建精度有了顯著的提升,但耗時(shí)卻限制了實(shí)際的應(yīng)用。網(wǎng)易瑤臺(tái)充分利用了 NVIDIA 的 tiny-cuda-nn 與 CUDA 渲染技術(shù),對(duì)神經(jīng)隱式曲面建模進(jìn)行了 20 多倍加速,實(shí)現(xiàn)了高效、高質(zhì)量的 3D mesh 重建。本演講將分享項(xiàng)目過(guò)程中的實(shí)踐經(jīng)驗(yàn)與心得。
在 GPU 上使用 Video Codec SDK,CV-CUDA和 TensorRT 加速現(xiàn)代云上視頻應(yīng)用
會(huì)議代碼:[SE51229]
演講時(shí)間:3 月 22 日5:30 PM – 6:00 PM
演講嘉賓:

王倬遙
NVIDIA 開(kāi)發(fā)與技術(shù)部工程師
主要內(nèi)容:
人工智能技術(shù)廣泛應(yīng)用于云和 on-prem 數(shù)據(jù)中心的短視頻和直播應(yīng)用當(dāng)中,覆蓋了超分辨率、直播視頻特效、舊視頻修復(fù)、自動(dòng)像素化、視頻內(nèi)容理解等。然而,當(dāng)部署這些應(yīng)用程序時(shí),傳統(tǒng)視頻處理管線混合了 CPU 和 GPU 負(fù)載,其性能將受到以下因素的限制:1) h2d 和 d2h 內(nèi)存拷貝;2) CPU 上的前處理和后處理;3) CPU 上的視頻編解碼;4) 未充分優(yōu)化的 AI 推理框架。
針對(duì)以上限制, NVIDIA 提供了豐富的視頻處理相關(guān)的 SDK。如何在實(shí)踐中高效地在云上使用這些工具是搭建基于人工智能的新式視頻處理管線的關(guān)鍵。本演講將介紹如何使用這些 SDK 來(lái)解決應(yīng)用中的低效部分,并構(gòu)建一個(gè)全 GPU 的視頻處理管線。
馬上注冊(cè),預(yù)約觀看China AI Day
想要預(yù)約以上精彩內(nèi)容?掃描海報(bào)二維碼或點(diǎn)擊“閱讀原文”,打開(kāi) China AI Day 專題頁(yè)面,按照會(huì)議代碼或標(biāo)題,找到對(duì)應(yīng)演講。通過(guò)點(diǎn)擊“Add to Schedule”或右上角“五角星”,將該演講內(nèi)容添加至您的日程,大會(huì)開(kāi)始后登錄即可在線觀看。
進(jìn)入 GTC 2023特別活動(dòng):China AI Day 專題頁(yè)面

按照 會(huì)議代碼 或者 演講標(biāo)題,找到感興趣的內(nèi)容。點(diǎn)擊“Add to Schedule”,添加至您的日程。

如無(wú)“Add to Schedule”按鈕,說(shuō)明該演講為點(diǎn)播,從 3 月 22 日開(kāi)始即可在線觀看。點(diǎn)擊右上方的五角星,將該演講添加至您的日程。

如點(diǎn)擊“Add to Schedule”或五角星時(shí),出現(xiàn)如下界面。

如果您已注冊(cè),請(qǐng)點(diǎn)擊“Login”登錄,激活賬戶,繼續(xù)操作;如果您尚未注冊(cè),請(qǐng)點(diǎn)擊“Create Account”,詳情參看 GTC23 注冊(cè)教程。
掃描下方海報(bào)二維碼,鎖定 NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛的 GTC 主題演講!北京時(shí)間 3 月 21 日 23:00 全球首播,3 月 22 日 10:00 中國(guó)重播。深度解讀 NVIDIA 加速計(jì)算平臺(tái)如何推動(dòng)人工智能、元宇宙、云技術(shù)和可持續(xù)計(jì)算的下一波浪潮。加入 GTC23,切勿錯(cuò)過(guò) AI 的決定性時(shí)刻!
原文標(biāo)題:GTC23 | 3 月 22 日預(yù)告 — 點(diǎn)擊解鎖 GTC 特別活動(dòng) China AI Day
文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
英偉達(dá)
+關(guān)注
關(guān)注
23文章
4118瀏覽量
99669
原文標(biāo)題:GTC23 | 3 月 22 日預(yù)告 — 點(diǎn)擊解鎖 GTC 特別活動(dòng) China AI Day
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
NVIDIA GTC 2026展示推動(dòng)物理AI時(shí)代的虛擬世界
達(dá)索系統(tǒng)于NVIDIA GTC 2026展示AI驅(qū)動(dòng)的虛擬孿生
天合光能出席英偉達(dá)GTC 2026大會(huì)
連接器如何理解GTC 2026大會(huì)?
安森美重磅亮相NVIDIA GTC 2026
聯(lián)想集團(tuán)攜最新成果亮相NVIDIA GTC 2026
新思科技與英偉達(dá)多項(xiàng)硬核科技成果亮相GTC 2026
研華科技受邀亮相NVIDIA GTC 2026
ADI攜最新成果亮相NVIDIA GTC 2026
益登科技攜手生態(tài)伙伴亮相NVIDIA GTC 2026
SK海力士攜AI存儲(chǔ)器產(chǎn)品亮相NVIDIA GTC 2026
益登科技邀您相約NVIDIA GTC 2026
NVIDIA CEO 黃仁勛與全球技術(shù)領(lǐng)導(dǎo)者在 GTC 2026 大會(huì)共話 AI 時(shí)代
GTC23 | 3 月 22 日預(yù)告 — 點(diǎn)擊解鎖 GTC 特別活動(dòng) China AI Day
評(píng)論