日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

vLLM Meetup上海站成功舉辦

沐曦MetaX ? 來(lái)源:vLLM ? 2025-08-27 13:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來(lái)源:vLLM

2025年8月23日,vLLM Meetup上海站成功舉辦?;顒?dòng)匯聚技術(shù)專(zhuān)家、社區(qū)開(kāi)發(fā)者及行業(yè)用戶(hù),圍繞vLLM(一種用于大型語(yǔ)言模型的高性能推理引擎)的技術(shù)進(jìn)展、生態(tài)建設(shè)及應(yīng)用展開(kāi)深度探討。會(huì)議涵蓋社區(qū)貢獻(xiàn)指南、分布式推理架構(gòu)、多模態(tài)模型集成等前沿議題,現(xiàn)場(chǎng)互動(dòng)熱烈,并提出每年舉辦vLLM Con大會(huì)的倡議,為AI推理領(lǐng)域的技術(shù)落地注入新動(dòng)能。

本次Meetup由沐曦與紅帽公司聯(lián)合主辦,紅帽作為全球開(kāi)源社區(qū)vLLM的重要貢獻(xiàn)者,長(zhǎng)期參與上游協(xié)作并分享實(shí)踐經(jīng)驗(yàn),推動(dòng)社區(qū)發(fā)展;沐曦則結(jié)合國(guó)產(chǎn)硬件優(yōu)勢(shì),積極探索vLLM在本土計(jì)算平臺(tái)上的適配與應(yīng)用。沐曦開(kāi)源生態(tài)總監(jiān)章津楠與紅帽亞太CTO辦公室首席架構(gòu)師張家駒共同開(kāi)場(chǎng),對(duì)到場(chǎng)嘉賓及觀眾表示歡迎。活動(dòng)設(shè)置五大核心議題,并穿插開(kāi)發(fā)者提問(wèn)環(huán)節(jié),最終以沐曦聯(lián)合創(chuàng)始人、CTO兼首席軟件架構(gòu)師楊建博士的開(kāi)源生態(tài)趨勢(shì)分享及書(shū)籍簽贈(zèng)環(huán)節(jié)收尾,現(xiàn)場(chǎng)氣氛活躍。

活動(dòng)核心環(huán)節(jié)圍繞五大技術(shù)方向展開(kāi),專(zhuān)家團(tuán)隊(duì)通過(guò)案例解析與方案演示,系統(tǒng)呈現(xiàn)vLLM在社區(qū)生態(tài)、分布式架構(gòu)、多模態(tài)集成等領(lǐng)域的創(chuàng)新實(shí)踐。

在題為《vLLM: Building, Testing and Contributing》演講中, vLLM社區(qū)貢獻(xiàn)者、Red Hat資深專(zhuān)家Daniele Trifirò深入剖析了vLLM社區(qū)的發(fā)展現(xiàn)狀,為愛(ài)好者及開(kāi)發(fā)者提供了系統(tǒng)性指南。他詳細(xì)闡述了項(xiàng)目構(gòu)建流程、關(guān)鍵測(cè)試規(guī)范,并指導(dǎo)開(kāi)發(fā)者如何高效貢獻(xiàn)代碼。通過(guò)豐富的代碼實(shí)例、實(shí)踐案例及參考鏈接,演講極大降低了初學(xué)者入門(mén)門(mén)檻,獲得現(xiàn)場(chǎng)開(kāi)發(fā)者高度認(rèn)可。

在《Disaggregated P/D for Wide EP》主題分享中,vLLM社區(qū)貢獻(xiàn)者、Red Hat技術(shù)專(zhuān)家Nicolò Lucchesi重點(diǎn)介紹了利用llm-d實(shí)現(xiàn)vLLM分布式推理的方案,核心目標(biāo)是通過(guò)預(yù)填充/解碼(P/D)解耦與寬專(zhuān)家并行(EP)擴(kuò)展大模型推理能力,尤其針對(duì)長(zhǎng)上下文和混合專(zhuān)家(MoE)模型場(chǎng)景,關(guān)鍵技術(shù)方案包括P/D解耦部署、通過(guò)NIXL實(shí)現(xiàn)高效KV Cache傳輸、支持預(yù)填充(P)與解碼(D)階段采用不同TP并行度、將MoE模型中的專(zhuān)家分布至不同GPU等實(shí)現(xiàn)細(xì)節(jié)。

百度高級(jí)產(chǎn)品經(jīng)理王凱在《ERNIE 4.5 + vLLM: Multimodal Model Integration》演講中,系統(tǒng)解析了百度ERNIE 4.5多模態(tài)模型與vLLM的集成實(shí)踐。內(nèi)容涵蓋ERNIE 4.5 的特性、與 vLLM 集成的原因以及 vLLM 為 ERNIE 4.5 模型提供的全面支持,包括密集模型、MoE 模型和用于加速生成的MTP。同時(shí)還介紹了正在進(jìn)行的開(kāi)發(fā)工作,例如專(zhuān)家并行性負(fù)載均衡和視覺(jué)-語(yǔ)言支持。

Mooncake核心開(kāi)發(fā)者蘇金陽(yáng)在《Mooncake x LMCache 性能優(yōu)化分享》的主題分享中重點(diǎn)介紹了 Mooncake(特別是其傳輸引擎和存儲(chǔ))與 LMCache 的集成,以在 vLLM 中實(shí)現(xiàn)高性能 KV Cache 重用。LMCache 被認(rèn)為是用于 KV Cache 管理(卸載、重用、P/D 分離、RAG 緩存)的流行 vLLM 社區(qū)擴(kuò)展。此次集成旨在提高數(shù)據(jù)分發(fā)效率和整體系統(tǒng)性能。

沐曦vLLM推理引擎專(zhuān)家張廉潔在《vLLM-metax: Bridging CUDA to MetaX MACA》演講中,詳細(xì)介紹了vLLM-metax 如何通過(guò) cu-bridge 在 MACA 上實(shí)現(xiàn)接近零成本的 CUDA 執(zhí)行,允許在不修改源代碼的情況下進(jìn)行原生編譯。同時(shí)還解釋了在 vLLM 中使用插件架構(gòu)支持 MetaX 的方式,概述了修補(bǔ)方法(patch補(bǔ)丁和文件替換)和限制。演講還公布了2025年路線(xiàn)圖。

提問(wèn)環(huán)節(jié)中,開(kāi)發(fā)者圍繞社區(qū)貢獻(xiàn)規(guī)范、分布式推理落地、國(guó)產(chǎn)硬件支持等議題提出建議,嘉賓以技術(shù)細(xì)節(jié)回應(yīng),討論貫穿全場(chǎng)。

本次活動(dòng)彩蛋,沐曦聯(lián)合創(chuàng)始人、CTO兼首席軟件架構(gòu)師楊建博士驚喜亮相現(xiàn)場(chǎng),他不僅生動(dòng)分享了沐曦在開(kāi)源生態(tài)和vLLM推理技術(shù)的最新趨勢(shì),還熱情地為獲得《沐曦異構(gòu)并行計(jì)算軟件棧》書(shū)籍的幸運(yùn)觀眾親筆簽名留念。

本次Meetup不僅展示了vLLM在分布式推理、多模態(tài)集成及硬件適配領(lǐng)域的最新成果,更通過(guò)技術(shù)交流與生態(tài)合作,為AI推理引擎的規(guī)?;瘧?yīng)用提供了實(shí)踐范本。行業(yè)專(zhuān)家與開(kāi)發(fā)者的深度互動(dòng),進(jìn)一步強(qiáng)化了vLLM在開(kāi)源社區(qū)的技術(shù)影響力,為下一代AI基礎(chǔ)設(shè)施的研發(fā)奠定基礎(chǔ)。

關(guān)于沐曦

沐曦致力于自主研發(fā)全棧高性能GPU芯片及計(jì)算平臺(tái),為智算、通用計(jì)算、云渲染等前沿領(lǐng)域提供高能效、高通用性的算力支撐,助力數(shù)字經(jīng)濟(jì)發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54463

    瀏覽量

    469678
  • 開(kāi)源
    +關(guān)注

    關(guān)注

    3

    文章

    4368

    瀏覽量

    46467
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3831

    瀏覽量

    52287

原文標(biāo)題:vLLM Meetup上海站圓滿(mǎn)落幕

文章出處:【微信號(hào):沐曦MetaX,微信公眾號(hào):沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    電科網(wǎng)安2025安全保密應(yīng)用交流系列活動(dòng)鄭州成功舉辦

    初冬中原,智慧匯聚。12月11日,電科網(wǎng)安“創(chuàng)新驅(qū)動(dòng)保密 共筑安全防線(xiàn)”2025安全保密應(yīng)用交流系列活動(dòng)鄭州成功舉辦,為中原地區(qū)重點(diǎn)行業(yè)單位嘉賓獻(xiàn)上了一場(chǎng)精彩紛呈的安全保密技術(shù)盛會(huì)。
    的頭像 發(fā)表于 12-19 17:26 ?1743次閱讀

    2025開(kāi)放原子園區(qū)行寧波成功舉辦

    12月5日,以“開(kāi)源甬動(dòng) 產(chǎn)業(yè)躍升”為主題的開(kāi)放原子“園區(qū)行”(寧波)在寧波廣電集團(tuán)第二演播廳成功舉辦。活動(dòng)搭建起開(kāi)源項(xiàng)目與本地場(chǎng)景需求的精準(zhǔn)對(duì)接平臺(tái),為寧波產(chǎn)業(yè)數(shù)字化升級(jí)注入強(qiáng)勁動(dòng)力,推動(dòng)開(kāi)源
    的頭像 發(fā)表于 12-12 16:18 ?925次閱讀

    開(kāi)源鴻蒙城市技術(shù)沙龍上海圓滿(mǎn)落幕

    11月25日,由開(kāi)源鴻蒙項(xiàng)目管理委員會(huì)(PMC)與合規(guī)SIG聯(lián)合主辦、模速空間科創(chuàng)金融綜合服務(wù)平臺(tái)承辦的“開(kāi)源鴻蒙城市技術(shù)沙龍·上海”暨“開(kāi)源鴻蒙合規(guī)SIG年度 Meetup”在上海
    的頭像 發(fā)表于 12-03 17:36 ?1487次閱讀

    2025開(kāi)放原子校源行上海成功舉辦

    10月15日,開(kāi)放原子校源行(上海)在復(fù)旦大學(xué)成功舉辦。本次活動(dòng)作為復(fù)旦大學(xué)計(jì)算機(jī)建系50周年系列活動(dòng)之一,邀請(qǐng)?jiān)菏繉?zhuān)家、高校領(lǐng)導(dǎo)、知名開(kāi)源社區(qū)代表、頭部科技企業(yè)代表以及來(lái)自復(fù)旦大學(xué)
    的頭像 發(fā)表于 10-17 11:01 ?769次閱讀

    AGIROS開(kāi)源社區(qū)Meetup上海圓滿(mǎn)落幕,RT-Thread睿賽德分享核心技術(shù)賦能機(jī)器人開(kāi)發(fā)|新聞速遞

    2025年9月20日,AGIROS開(kāi)源社區(qū)Meetup上海順利舉辦。RT-Thread睿賽德AI負(fù)責(zé)人葉昌博士受邀出席,帶來(lái)“從異構(gòu)通信到虛擬化技術(shù):RT-Thread助力機(jī)器人敏捷、可持續(xù)開(kāi)發(fā)
    的頭像 發(fā)表于 09-22 21:25 ?859次閱讀
    AGIROS開(kāi)源社區(qū)<b class='flag-5'>Meetup</b><b class='flag-5'>上海</b><b class='flag-5'>站</b>圓滿(mǎn)落幕,RT-Thread睿賽德分享核心技術(shù)賦能機(jī)器人開(kāi)發(fā)|新聞速遞

    2025 NVIDIA創(chuàng)業(yè)企業(yè)展示北京成功舉辦

    近日,2025 NVIDIA 創(chuàng)業(yè)企業(yè)展示——北京(AI 智能體與物理 AI 出海專(zhuān)場(chǎng))在北京量子銀座集智會(huì)議中心舉辦。
    的頭像 發(fā)表于 09-16 10:43 ?1350次閱讀

    匯川技術(shù)匯英行動(dòng)人才雙選日蘇州成功舉辦

    金秋九月,匯聚英才。 匯英行動(dòng)人才雙選日·蘇州于9月6日在匯川技術(shù)蘇州總部大廈成功舉辦
    的頭像 發(fā)表于 09-11 17:12 ?1571次閱讀

    2025紫光同創(chuàng)FPGA技術(shù)研討會(huì)成都成功舉辦

    近日,“2025紫光同創(chuàng)FPGA技術(shù)研討會(huì)”成都成功舉辦,來(lái)自通信、工業(yè)、圖像視頻、消費(fèi)、汽車(chē)等領(lǐng)域近200名專(zhuān)業(yè)觀眾參會(huì)交流,現(xiàn)場(chǎng)座無(wú)虛席,氣氛熱烈。自此,本年度紫光同創(chuàng)線(xiàn)下研討會(huì)系列活動(dòng)圓滿(mǎn)收官!
    的頭像 發(fā)表于 09-08 17:26 ?1581次閱讀

    格羅方德2025年度技術(shù)峰會(huì)北美成功舉辦

    格羅方德2025年度技術(shù)峰會(huì)(GlobalFoundries Technology Summit 2025, GTS 2025)北美于8月28日在美國(guó)加利福尼亞州圣克拉拉市成功舉辦。
    的頭像 發(fā)表于 09-03 17:29 ?1224次閱讀

    開(kāi)放原子園區(qū)行重慶成功舉辦

    8月29日,開(kāi)放原子“園區(qū)行”(重慶)在渝州賓館成功舉辦,活動(dòng)以“共建智能汽車(chē)操作系統(tǒng)開(kāi)源生態(tài)”為主題,匯聚政府機(jī)構(gòu)、高校及科研院所、OEM廠商、汽車(chē)軟件開(kāi)發(fā)企業(yè)、芯片企業(yè)、開(kāi)源社區(qū)的近100位代表,共探開(kāi)源模式如何破解智能汽
    的頭像 發(fā)表于 09-01 18:10 ?1224次閱讀

    2025開(kāi)放原子園區(qū)行上海成功舉辦

    近日,以“開(kāi)源賦能智能,協(xié)同創(chuàng)新共筑AI未來(lái)”為主題的開(kāi)放原子“園區(qū)行”(上海)在上海市徐匯區(qū)成功舉辦。本次活動(dòng)由開(kāi)放原子開(kāi)源基金會(huì)與
    的頭像 發(fā)表于 07-07 18:12 ?1137次閱讀

    2025開(kāi)放原子校源行廣東海洋大學(xué)活動(dòng)成功舉辦

    近日,由開(kāi)放原子開(kāi)源基金會(huì)主辦,廣東海洋大學(xué)和北京中軟國(guó)際教育科技股份有限公司承辦的“開(kāi)放原子校源行”(廣東海洋大學(xué))活動(dòng)成功舉辦。
    的頭像 發(fā)表于 06-30 10:02 ?906次閱讀

    2025開(kāi)放原子校源行太原成功舉辦

    近日,開(kāi)放原子“校源行”(太原)在中北大學(xué)成功舉辦。工業(yè)和信息化部信息技術(shù)發(fā)展司、山西省工信廳、山西省教育廳,以及地方工信部門(mén)、高校、頭部科技企業(yè)代表等600余人共話(huà)開(kāi)源生態(tài),推進(jìn)開(kāi)源教育。
    的頭像 發(fā)表于 06-28 17:44 ?1349次閱讀

    Wolfspeed助力捷豹TCS車(chē)隊(duì)FE上海成功衛(wèi)冕

    !從第一回合遭遇低谷,到第二回合成功衛(wèi)冕,捷豹 TCS 車(chē)隊(duì)逆風(fēng)翻盤(pán)!“KIWI”組合上海兩年兩冠,續(xù)寫(xiě)傳奇!
    的頭像 發(fā)表于 06-06 09:12 ?1000次閱讀

    在openEuler上基于vLLM Ascend部署Qwen3

    近日,阿里巴巴正式發(fā)布新一代Qwen大語(yǔ)言模型系列(Qwen3與Qwen3-MoE),在模型規(guī)模與性能上實(shí)現(xiàn)多方面升級(jí)。openEuler社區(qū)團(tuán)隊(duì)與vLLM社區(qū)通力合作,在第一時(shí)間完成Qwen3模型
    的頭像 發(fā)表于 05-07 14:44 ?2090次閱讀
    在openEuler上基于<b class='flag-5'>vLLM</b> Ascend部署Qwen3
    岳池县| 石河子市| 望都县| 资溪县| 宁武县| 鄂尔多斯市| 南岸区| 府谷县| 清涧县| 柞水县| 灵山县| 文成县| 太保市| 沂源县| 甘谷县| 方正县| 阜平县| 彭山县| 维西| 沈阳市| 淄博市| 宝鸡市| 文山县| 丁青县| 酒泉市| 共和县| 滦平县| 敦化市| 青冈县| 炎陵县| 云霄县| 兰州市| 临湘市| 渑池县| 瑞丽市| 康保县| 彭水| 澎湖县| 德保县| 舒兰市| 惠水县|